Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-ADLMQR
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Antonio de Padua Bragapt_BR
dc.contributor.advisor-co1Andre Paim Lemospt_BR
dc.contributor.referee1Cristiano Leite de Castropt_BR
dc.contributor.referee2David Menotti Gomespt_BR
dc.contributor.referee3Luis Enrique Záratept_BR
dc.contributor.referee4Frank Still Torrespt_BR
dc.creatorAlexandre Wagner Chagas Fariapt_BR
dc.date.accessioned2019-08-13T09:11:09Z-
dc.date.available2019-08-13T09:11:09Z-
dc.date.issued2016-08-12pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/BUBD-ADLMQR-
dc.description.abstractMultiple Instance Learning (MIL) is a generalization of the supervised learning. MIL has been used in numerous applications where the instance labeling for individual instance, for the learning step, is sometimes not possible or unfeasible in practical way. For dealing with this family of problem, MIL proposes a new paradigm by assigning asingle label (positive or negative) to a set of instances, called bag. More formally, a bag is labeled positive if it contains at least one positive instance, and it is labeled negative if all instances are certainly negative.Although there is a considerable number of algorithms to work with MIL in the literature, few works provides balanced outcomes for the majority of the datasets. Furthermore, a deeper analysis, among the existing methods, is not available. In this work are proposed two new algorithms based on instance selection by likelihood computation, using Kernel Density Estimation. The approach uses the LogitBoost algorithmas classier. The instance selection approach aim to identify the most representative instances in each positive bag, eliminating possible instance noise inside those bags, in this way, perform a more robust learning step. Statistical tests, have demonstrated that the proposal methods are comparable with the best literature algorithms, overcoming all in some datasets. It is also developed in this work a new application based on the proposed method in order to select patients that best represent each class in a Leukemia dataset. After experiments, itwas possible to reduce the training patients by half, and nd slightly better results than those when is used all patients in the dataset.pt_BR
dc.description.resumoAprendizado de Múltiplas Instâncias (AMI) é uma generalização do aprendizado supervisionado. AMI tem sido utilizado em inúmeras aplicações, em que a rotulação para cada instância na fase de aprendizado é, às vezes, impossível ou não eciente de ser realizada de forma prática. A m de lidar com essa família de problemas, o AMI propõe um novo paradigma, assinalando um único rótulo (positivo ou negativo) para um conjunto de instâncias, chamado de bags. Mais formalmente, um bag é rotulado como positivo se contém, ao menos, uma instânciapositiva e rotulado como negativo se é conhecido, com certeza, que todas as suas instâncias são negativas. Embora exista, na literatura, um número expressivo de propostas para trabalhar com AMI, poucos métodos fornecem resultados competitivos para a maioria das bases de dados avaliadas. Além disso, falta uma análise mais aprofundada entre os métodos existentes. Neste trabalho são propostos dois novos algoritmos, baseados em seleção de instâncias por meio do cálculo da probabilidade, utilizando-se Estimador de Densidade por Kernel. O método utiliza o algoritmo LogitBoost como classicador. As abordagens baseadas em seleção de instâncias visam identicar as instâncias mais representativas em cada bag positivo, eliminando possíveis ruídos dentro desses bags para, assim, realizar um treinamento mais robusto.Testes estatísticos demonstraram que as abordagens propostas são equivalentes aos melhores algoritmos da literatura, superando todos em algumas das bases avaliadas. Também foi desenvolvida nesta tese uma nova aplicação, com base na metodologia proposta, com objetivo de selecionar pacientes que melhor representem cada classe em uma base de dados conhecida de Leucemia. Os experimentos mostram que com o emprego das abordagens propostas, foi possível reduzir, pela metade, os pacientes de treinamento e encontrar resultados ligeiramente melhores em relação àqueles que aqueles quando empregados todos os pacientes da base.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectEngenharia elétricapt_BR
dc.subject.otherEngenharia elétricapt_BR
dc.subject.otherAprendizado de múltiplas instânciaspt_BR
dc.subject.otherKernel, Funções dept_BR
dc.titleUma nova abordagem para aprendizado de múltiplas instâncias, baseada em seleção de instâncias via estimador de densidade por Kernelpt_BR
dc.typeTese de Doutoradopt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_ppgee_239_alexandre_wagner_chagas_faria.pdf20.73 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.