Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/JCES-ATKER7
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Marcos Andre Goncalvespt_BR
dc.contributor.referee1Leonardo Chaves Dutra da Rochapt_BR
dc.contributor.referee2Marco Antonio Pinheiro de Cristopt_BR
dc.contributor.referee3Pedro Olmo Stancioli Vaz de Melopt_BR
dc.creatorRaphael Rodrigues Campospt_BR
dc.date.accessioned2019-08-12T07:46:56Z-
dc.date.available2019-08-12T07:46:56Z-
dc.date.issued2017-07-21pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/JCES-ATKER7-
dc.description.resumoFloresta Aleatória (FA) é uma das estratégias mais bem-sucedidas para tarefas de classificação automática. Motivado por seu grande sucesso, recém-propostos métodos baseados em FA têm alavancado a ideia central da RF de agregar um grande conjunto de árvores de decisão com baixa correlação, que é inerentemente paralelizável e provê capacidade excepcional de generalização. Nesse contexto, esse trabalho provê várias novas contribuições para essa linha de pesquisa. Primeiramente, nós propomos uma nova estratégia baseada em FA (BERT) que aplica a técnica de \textit{boosting} em árvores extremamente aleatórias com \textit{bagging}. Segundo, nós demonstramos empiricamente que essa nova estratégia, assim como os recém-propostos classificadores BROOF e LazyNN\_RF complementam uns aos outros, motivando-nos a empilhá-los a fim de produzir um método ainda mais eficaz. Até onde sabemos, esse é a primeira estratégia que efetivamente combina as três principais estratégias de comitê de classificadores: empilhamento, \textit{bagging} (a base da FA) e \textit{boosting}. Por último, nós exploramos as instâncias \textit{out-of-bag (OOB)} para empilhar, eficientemente e sem viés, métodos baseados em \textit{bagging}, desse modo diminuindo consideravelmente o custoso processo de treino do procedimento de empilhamento. Nossos experimentos cobrindo dois domínios ruidosos e com alta dimensionalidade - classificação de tópicos e sentimentos - provê forte evidência em favor dos benefícios de nossas soluções baseadas em FA. Nós mostramos que o BERT está dentre os classificadores de mais alta efetividade na vasta maioria dos casos analisados, mantendo os benefícios únicos da FA (interpretabilidade, paralelização, fácil parametrização, capacidade de lidar com dados heterogêneos e valores faltantes).pt_BR
dc.languageInglêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectClassificaçãopt_BR
dc.subjectEnsemblept_BR
dc.subjectFloresta Aleatóriapt_BR
dc.subjectEmpilhamentopt_BR
dc.subject.otherComputaçãopt_BR
dc.subject.otherFloresta Aleatóriapt_BR
dc.subject.otherAprendizado de máquinapt_BR
dc.subject.otherMineração de dados (Computação)pt_BR
dc.titleStacking bagged and boosted forests for classification of noisy and high-dimensional datapt_BR
dc.typeDissertação de Mestradopt_BR
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
raphael_rodrigues_campos.pdf1.1 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.