Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/SLSS-8HTM7W
Type: Dissertação de Mestrado
Title: Um método evolucionário para classificação hierárquica
Authors: Rafael Vieira Carvalho
First Advisor: Gisele Lobo Pappa
First Referee: Marcos Andre Goncalves
Second Referee: Wagner Meira Junior
Third Referee: Alexandre Plastino de Carvalho
Abstract: A tarefa de classificação tradicional (plana) vem sendo extensivamente explorada nas mais diversas áreas de conhecimento. Na última década, os esforços de investigação nestas áreas foram voltados para a tarefa de classificação hierárquica, uma especialização da tarefa anterior. A principal diferença entre as duas é que na classificação hierárquica os exemplos devem ser associados a classes organizadas em uma hierarquia de classes pré-definida, enquanto na classificação plana, nenhuma ordem é imposta para as classes. Atualmente, existem duas abordagens principais para tratar do problema de classificação hierárquica: (i) utilizar uma abordagem local, também conhecida como topdown, ou (ii) utilizar uma abordagem global, também chamada de big-bang. A primeira estratégia utiliza classificadores planos para gerar modelos para cada nó ou nó pai da hierarquia, e leva em consideração informações locais da hierarquia na construção dos modelos, terminando com um conjunto de modelos. Para cada novo exemplo, esses modelos são usados para prever suas classes mais genéricas e depois as mais específicas. A abordagem global, por sua vez, normalmente modifica um classificador plano a fim de acrescentar informações sobre a hierarquia na construção do modelo de classificação. Muitos algoritmos estão sendo utilizados com sucesso na classificação tradicional. Vários desses métodos são derivados de algoritmos já consolidados como o SVM ou Naive Bayes, enquanto novas propostas de algoritmos ainda não foram muito exploradosnessa área. Aqui exploramos algoritmos evolucionários para classificação hierárquica. Algoritmos evolucionários são métodos baseados nos princípios da evolução de Darwin e sobrevivência do indivíduo mais forte, e são muito conhecidos por seu poderoso mecanismo de busca global e capacidade de adaptação. Esse trabalho propõe HCGA (Hierarchical Classification Genetic Algorithm), umalgoritmo evolucionário para classificação hierárquica que tem como principal contribuição unir ambas informações local e global da hierarquia utilizando uma abordagem top-down tanto para criação do modelo de cada classe (treino) quanto para classificaçãode novos exemplos (teste). Isto representa uma grande inovação, já que os métodos topix down atuais utilizam apenas informação local no treino, perdendo valiosa informação sobre a estrutura da hierarquia de classes. Como problemas de classificação hierárquica vêm sendo explorados principalmente nas áreas de classificação de texto e bioinformática, o método proposto é aplicado a quatro bases de dados de previsão de proteínas e a 20 Newsgroups, uma baseclássica da área de classificação de texto. Os resultados obtidos foram comparados com cinco outros algoritmos comumente utilizados nessa tarefa, obtendo resultados promissores principalmente nos níveis mais baixos da hierarquia.
Abstract: The traditional (flat) classification task has been extensively explored in several areas of knowledge. In the last decade, however, research efforts turn to the task of hierarchical classification, a specialization of the previous task. The main difference between the two is that in hierarchical classification examples are associated with classes organized into a predefined class hierarchy, whereas in flat classification no class order is enforced. Currently, two main approaches are used to generate hierarchical classification models: (i) the local approach, also known as top-down, and (ii) the global approach, also called big-bang. The first strategy uses flat classifiers to generate models for each node or parent node of the hierarchy, and take into account local information of the hierarchy when developing these models, ending with a set of models. For each new example, these models are used to predict their most generic classes, and then the most specific ones. The global approach, in contrast, typically modifies a flat classifier to add information about the hierarchy for building the classification model. Many traditional classification algorithms are being successfully adapted for hierarchical classification, such as SVM and Naive Bayes, while new algorithms proposals are yet underexplored. In this direction, this work proposes HCGA (Hierarchical Classification Genetic Algorithm), an evolutionary method for hierarchical classification whose main contribution is to merge both local and global information of the hierarchy, using a top-down approach for both creating the class models (training) and classifying new examples (test). This represents a major innovation, since the current top-down methods use only local information in training, and are not aware of the hierarchy structure when building models. Hierarchical problems have been exploited mainly in the areas of text classification and bioinformatics. Hence, the proposed method was applied to four datasets regarding protein function prediction and a well-known text classification dataset. The results obtained were compared to five other algorithms commonly used in hierarchical classification, obtaining promising results specially in the deeper levels of the hierarchy.
Subject: Computação
Classificação (Computadores)
Algoritmos geneticos
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/SLSS-8HTM7W
Issue Date: 13-May-2011
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
rafaelvieiracarvalho.pdf804.32 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.