Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/SLSS-8GQMAX
Tipo: Dissertação de Mestrado
Título: Um algoritmo de nuvem de partículas para combinação de classificadores em aprendizado multi-visão
Autor(es): Zilton Jose Maciel Cordeiro Junior
Primeiro Orientador: Gisele Lobo Pappa
Primeiro membro da banca : Luis Henrique Zárate
Segundo membro da banca: Adriano Alonso Veloso
Terceiro membro da banca: Marcos Andre Goncalves
Resumo: O aprendizado multi-visão ou multi-modalidade está se tornando cada vez mais popular, por fornecer diferentes representações de um problema a partir das quais se pode aprender. Dada a tarefa de classificação de vídeo, por exemplo, o som, a imagem e as legendas poderiam ser consideradas visões.A ideia principal do aprendizado multi-visão é que, ao aprender a partir dessas representações separadamente, pode-se obter previsões melhores do que ao agregar todas essas visões em uma única base de dados. Porém, um modelo de classificação é criado para cada visão, e as saídas disponibilizadas por cada um deles deve ser combinada para fornecer uma classe final para cada instância. Esta dissertação propõe um algoritmo de Otimização por Nuvem de Partícula (PSO) para combinar as saídas advindas de diferentes classificadores. O PSO trabalha em dois contextos: o primeiro leva em consideração somente a classe/confiança atribuída por um classificador na categorização de uma instância, aplicando pesos a cada visão. O segundo, além de atribuir pesos às visões, atribui também pesos a cada classe. Experimentos foram feitos em duas bases de dados, com três visões cada, e comparados com três diferentes métodos existentes na literatura: o voto da maioria, o algoritmo de Borda Count e a teoria de Dempster-Shafer. Além desses, foi feita uma comparação com a abordagem que utiliza todas as visões juntas em uma única base de dados. Na grande maioria dos experimentos, o PSO obteve resultados estatisticamente melhores que as outras abordagens avaliadas.
Abstract: The multi-view or multi-modality learning approach is becoming popular for providing different representations of a problem from which classifiers can learn from. Given the task of video classification, for example, the sound, the image and the subtitles may be considered views.The main idea behind multi-view learning is that learning from these representations separately can lead to better gains than merging them into a single dataset. Hence, a classification model is created for each view, and outputs provided by each of them must be combined to provide a final class for each example.This dissertation proposes a Particle Swarm Optimization (PSO) algorithm to combine the outputs coming from different views. The PSO works in two contexts: the first takes into account only the class/confidence assigned by a classifier in the categorization of an instance, applying weights to each view. The second, besides assigning weights to views, also assigns weights to each class.Experiments were performed in two datasets, each one with three views, and compared with three different methods from the literature: the majority vote, the Borda Count algorithm and the Dempster-Shafer theory. Then, a comparison was made with the approach that uses all views together into a single dataset. The PSO obtained statistically better results than the other approaches evaluated in the majority of the experiments.
Assunto: Computação
Idioma: Português
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Tipo de Acesso: Acesso Aberto
URI: http://hdl.handle.net/1843/SLSS-8GQMAX
Data do documento: 25-Mar-2011
Aparece nas coleções:Dissertações de Mestrado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ziltoncordeirojunior.pdf2.94 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.