Stacking bagged and boosted forests for classification of noisy and high-dimensional data

dc.creatorRaphael Rodrigues Campos
dc.date.accessioned2019-08-12T07:46:56Z
dc.date.accessioned2025-09-08T23:06:58Z
dc.date.available2019-08-12T07:46:56Z
dc.date.issued2017-07-21
dc.identifier.urihttps://hdl.handle.net/1843/JCES-ATKER7
dc.languageInglês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectComputação
dc.subjectFloresta Aleatória
dc.subjectAprendizado de máquina
dc.subjectMineração de dados (Computação)
dc.subject.otherAprendizado de Máquina
dc.subject.otherClassificação
dc.subject.otherEnsemble
dc.subject.otherFloresta Aleatória
dc.subject.otherEmpilhamento
dc.titleStacking bagged and boosted forests for classification of noisy and high-dimensional data
dc.typeDissertação de mestrado
local.contributor.advisor1Marcos Andre Goncalves
local.contributor.referee1Leonardo Chaves Dutra da Rocha
local.contributor.referee1Marco Antonio Pinheiro de Cristo
local.contributor.referee1Pedro Olmo Stancioli Vaz de Melo
local.description.resumoFloresta Aleatória (FA) é uma das estratégias mais bem-sucedidas para tarefas de classificação automática. Motivado por seu grande sucesso, recém-propostos métodos baseados em FA têm alavancado a ideia central da RF de agregar um grande conjunto de árvores de decisão com baixa correlação, que é inerentemente paralelizável e provê capacidade excepcional de generalização. Nesse contexto, esse trabalho provê várias novas contribuições para essa linha de pesquisa. Primeiramente, nós propomos uma nova estratégia baseada em FA (BERT) que aplica a técnica de \textit{boosting} em árvores extremamente aleatórias com \textit{bagging}. Segundo, nós demonstramos empiricamente que essa nova estratégia, assim como os recém-propostos classificadores BROOF e LazyNN\_RF complementam uns aos outros, motivando-nos a empilhá-los a fim de produzir um método ainda mais eficaz. Até onde sabemos, esse é a primeira estratégia que efetivamente combina as três principais estratégias de comitê de classificadores: empilhamento, \textit{bagging} (a base da FA) e \textit{boosting}. Por último, nós exploramos as instâncias \textit{out-of-bag (OOB)} para empilhar, eficientemente e sem viés, métodos baseados em \textit{bagging}, desse modo diminuindo consideravelmente o custoso processo de treino do procedimento de empilhamento. Nossos experimentos cobrindo dois domínios ruidosos e com alta dimensionalidade - classificação de tópicos e sentimentos - provê forte evidência em favor dos benefícios de nossas soluções baseadas em FA. Nós mostramos que o BERT está dentre os classificadores de mais alta efetividade na vasta maioria dos casos analisados, mantendo os benefícios únicos da FA (interpretabilidade, paralelização, fácil parametrização, capacidade de lidar com dados heterogêneos e valores faltantes).
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
raphael_rodrigues_campos.pdf
Tamanho:
1.07 MB
Formato:
Adobe Portable Document Format