Redes neurais para dados tabulares: uma comparação empírica
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Neural networks for tabular data: an empirical comparison
Primeiro orientador
Membros da banca
Milton Pifano Soares Ferreira
Denise Bulgarelli Duczmal
Vinícius Diniz Mayrink
Uriel Moreira Silva
Denise Bulgarelli Duczmal
Vinícius Diniz Mayrink
Uriel Moreira Silva
Resumo
O Aprendizado Profundo passou por significativas transformações nas últimas décadas, o tornando a ferramenta principal na modelagem de dados não estruturados, como vídeos, áudios, linguagem e imagens. Entretanto, para dados estruturados ele não foi capaz de superar a popularidade de métodos mais estabelecidos, como Modelos Lineares Generalizados, Gradient
Boosted Trees e Bagging. Nos últimos anos, modelos promissores emergiram para dados tabulares objetivando adaptar, para redes neurais, inovações aplicadas à dados não estruturados, como a arquitetura dos transformers, ou que tentam simular processos baseados em árvores de decisão. Este estudo é uma comparação empírica desses modelos em bases de dados de dimensões e
tamanhos amostrais muito diferentes. Sendo ilustrado por diversas áreas, como ciência dos materiais, marketing, biologia e astronomia.
Abstract
Deep Learning has undergone significant transformations in recent decades, making it the dominant strategy in modeling unstructured data, such as videos, audios, language, and images. Although it came to structured data, it was not able to overcome the popularity of more established methods such as Generalized Linear Models, Gradient Boosted Trees and Bagging. In recent years, promising models have emerged for tabular data that aim to adapt, for neural networks, innovations applied to unstructured data, such as the architecture of transformers, or that tried to simulate processes based on decision trees. This study is an empirical comparison of these models in databases of very different dimensions and sample sizes. It is illustrated by various areas, such as materials science, marketing, biology, and astronomy.
Assunto
Estatística – Teses, Redes neurais – Teses, Predição – Teses, Gradient Boosted Trees – Teses
Palavras-chave
Redes Neurais, Estatística, Modelagem Preditiva, Gradient Boosted Trees, Dados Tabulares