Generative models for open set image recognition

Marcos Felipe Vendramini Carvalho

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/49031

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Jefersson Alex Dos Santos	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/2171782600728348	pt_BR
dc.contributor.advisor-co1	Alexei Manso Correa Machado	pt_BR
dc.contributor.referee1	Hugo Neves de Oliveira	pt_BR
dc.contributor.referee2	Matheus Pinheiro Ferreira	pt_BR
dc.contributor.referee3	Fabrício Murai Ferreira	pt_BR
dc.creator	Marcos Felipe Vendramini Carvalho	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/8206412711416236	pt_BR
dc.date.accessioned	2023-01-20T14:02:44Z	-
dc.date.available	2023-01-20T14:02:44Z	-
dc.date.issued	2021-12-10	-
dc.identifier.uri	http://hdl.handle.net/1843/49031	-
dc.description.abstract	Os métodos de classificação de imagens geralmente são treinados para realizar previsões levando em consideração um grupo predefinido de classes conhecidas. Problemas do mundo real, no entanto, podem não permitir um conhecimento completo de todas as entrada e rótulos do espaço, fazendo com que as falhas no reconhecimento seja um problema para o aprendizado visual profundo. Os métodos de reconhecimento de conjunto aberto são caracterizados pela capacidade de identificar corretamente as entradas de classes conhecidas e desconhecidas. Neste contexto, propomos GeMOS: módulos de reconhecimento de conjunto aberto simples que podem ser anexados a Redes Neurais Profundas pré-treinadas para reconhecimento visual. O framework GeMOS emparelha redes neurais convolucionais pré-treinadas com modelos generativos para introduzir o reconhecimento de conjunto aberto através da extração de pontuações para cada amostra, permitindo o reconhecimento de falha em tarefas de reconhecimento de objeto. Conduzimos uma avaliação completa do método proposto em comparação com algoritmos do estado-da-arte de conjunto aberto. Nesses testes foram utilizados diferentes datasets como dentro e fora da distribuição, onde, com o MNIST dentro da distribuição, atingimos o F1-score de 0.91 enquanto o melhor baseline do teste referente atingiu 0.85, e, para o CIFAR10 dentro da distribuição, atingimos o F1-score de 0.93 enquanto o melhor baseline do teste referente atingiu 0.81. Também foram realizados teste utilizando um mesmo dataset como dentro e fora da distribuição, um caso mais complexo que mostrou a dependência do método a acurácia das redes pré treinadas. Os resultados mostraram que o GeMOS compete com modelos mais complexos e caros e em muitos casos os superam. Para os trabalhos futuros propomos inicialmente aplicar o método a outros domínios e a problemas do mundo real, e modificar o método para outras tarefas de visão computacional.	pt_BR
dc.description.resumo	Image classification methods are usually trained to perform predictions taking into account a predefined group of known classes. Real-world problems, however, may not allow for a full knowledge of the input and label spaces, making failures in recognition a hazard to deep visual learning. Open set recognition methods are characterized by the ability to correctly identify inputs of known and unknown classes. In this context, we propose GeMOS: simple and plug-and-play open set recognition modules that can be attached to pre-trained Deep Neural Networks for visual recognition. The GeMOS framework pairs pre-trained Convolutional Neural Networks with generative models for open set recognition to extract open set scores for each sample, allowing for failure recognition in object recognition tasks. We conduct a thorough evaluation of the proposed method against state-of-the-art open set algorithms. In these tests, different datasets were used, such as in and out of distribution, with the MNIST as in distribution, we reached the F1-score of 0.91 while the best baseline of the referent test reached 0.85, and, for the CIFAR10 as in distribution, we reached the F1-score of 0.93 while the best baseline of the benchmark test reached 0.81. Tests were also performed using the same dataset as in and out of distribution, a more complex case that showed the dependence of the method on the accuracy of pre-trained networks. The results showed that GeMOS competes with more complex and expensive models and in many cases outperforms them. For future work, we initially propose to apply the method to other domains and real-world problems, and to modify the method for other computer vision tasks.	pt_BR
dc.description.sponsorship	FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Computer vision	pt_BR
dc.subject	Neural networks	pt_BR
dc.subject	Open set recognition	pt_BR
dc.subject.other	Computação – Teses	pt_BR
dc.subject.other	Visão computacional –Teses	pt_BR
dc.subject.other	Redes neurais (Computação) – Teses	pt_BR
dc.subject.other	Reconhecimento de conjunto aberto –Teses.	pt_BR
dc.title	Generative models for open set image recognition	pt_BR
dc.title.alternative	Modelos generativos para reconhecimento de imagens em conjunto aberto	pt_BR
dc.type	Dissertação	pt_BR
Appears in Collections:	Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
Marcos Felipe Vendramini - Revisado 08dez.pdf		4.31 MB	Adobe PDF	View/Open

Show simple item record