Redes neurais para dados tabulares: uma comparação empírica

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Neural networks for tabular data: an empirical comparison

Primeiro orientador

Membros da banca

Milton Pifano Soares Ferreira
Denise Bulgarelli Duczmal
Vinícius Diniz Mayrink
Uriel Moreira Silva

Resumo

O Aprendizado Profundo passou por significativas transformações nas últimas décadas, o tornando a ferramenta principal na modelagem de dados não estruturados, como vídeos, áudios, linguagem e imagens. Entretanto, para dados estruturados ele não foi capaz de superar a popularidade de métodos mais estabelecidos, como Modelos Lineares Generalizados, Gradient Boosted Trees e Bagging. Nos últimos anos, modelos promissores emergiram para dados tabulares objetivando adaptar, para redes neurais, inovações aplicadas à dados não estruturados, como a arquitetura dos transformers, ou que tentam simular processos baseados em árvores de decisão. Este estudo é uma comparação empírica desses modelos em bases de dados de dimensões e tamanhos amostrais muito diferentes. Sendo ilustrado por diversas áreas, como ciência dos materiais, marketing, biologia e astronomia.

Abstract

Deep Learning has undergone significant transformations in recent decades, making it the dominant strategy in modeling unstructured data, such as videos, audios, language, and images. Although it came to structured data, it was not able to overcome the popularity of more established methods such as Generalized Linear Models, Gradient Boosted Trees and Bagging. In recent years, promising models have emerged for tabular data that aim to adapt, for neural networks, innovations applied to unstructured data, such as the architecture of transformers, or that tried to simulate processes based on decision trees. This study is an empirical comparison of these models in databases of very different dimensions and sample sizes. It is illustrated by various areas, such as materials science, marketing, biology, and astronomy.

Assunto

Estatística – Teses, Redes neurais – Teses, Predição – Teses, Gradient Boosted Trees – Teses

Palavras-chave

Redes Neurais, Estatística, Modelagem Preditiva, Gradient Boosted Trees, Dados Tabulares

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por