LDMAT: função de custo baseada em matrizes de distâncias para o treinamento de redes neurais convolucionais

Eduardo da Silva Ribeiro

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/39773

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Antônio de Pádua Braga	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/1130012055294645	pt_BR
dc.contributor.referee1	Cristiano Leite de Castro	pt_BR
dc.contributor.referee2	Frederico Gadelha Guimarães	pt_BR
dc.contributor.referee3	Alexei Manso Correa Machado	pt_BR
dc.contributor.referee4	Raul Fonseca Neto	pt_BR
dc.creator	Eduardo da Silva Ribeiro	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/5036975831625237	pt_BR
dc.date.accessioned	2022-03-03T15:34:26Z	-
dc.date.available	2022-03-03T15:34:26Z	-
dc.date.issued	2021-12-17	-
dc.identifier.uri	http://hdl.handle.net/1843/39773	-
dc.description.abstract	Convolutional Neural Networks (CNNs) have been on the forefront of neural network research in recent years. Their breakthrough performance in fields such as image classification has gathered efforts in the development of new CNN-based architectures, but recently a search for new loss functions for CNNs has emerged. Softmax loss remains the most popular loss function due mainly to its efficiency in class separation, but the function is unsatisfactory in terms of intra-class compactness. In this thesis, a new loss function based on distance matrices (LDMAT) is presented, which performs a pairwise analysis of a set of features and operates directly on the features extracted by convolutional filters, thus allowing its use in arbitrary classifiers. A regularization method by inserting a disturbance in the label distance matrix is also presented, with performance similar to dropout. The proposed approach allows the combination of trained models with the LDMAT loss function with different levels of regularization, which improves the generalization of the final model. In order to validate the proposed loss function, experiments were performed to demonstrate its efficiency in training CNNs during classification tasks. In the FMNIST, EMNIST, CIFAR10, CIFAR100 and SVHN datasets, the LDMAT loss function outperforms other approaches that use similar architectures, and in the MNIST dataset, the accuracy were close to results of other loss functions proposed in the literature.	pt_BR
dc.description.resumo	As Redes Neurais Convolucionais (CNNs) têm estado na vanguarda em pesquisas de redes neurais nos últimos anos, seu desempenho inovador em áreas como classificação de imagens reuniu esforços para o desenvolvimento de novas arquiteturas, porém recentemente surgiu uma busca por novas funções custo para CNNs. A função de custo de entropia cruzada (softmax loss) vem sendo amplamente utilizada devido a sua eficiência na separação de classes, entretanto existe uma deficiência em projetar uma margem adequada de separação das classes e compacidade intraclasse das características. Embora alguns estudos tenham abordado esse problema, a maioria das soluções apresentam refinamentos da função de custo de entropia cruzada ou realizam a combinação da mesma com outros componentes para melhorar a generalização do modelo. Nesta tese apresenta-se uma função de custo nova baseada em matrizes de distâncias (LDMAT) que faz análise pareada de um conjunto de características e opera diretamente nas características extraídas pelos filtros convolucionais, permitindo assim, seu uso em classificadores arbitrários. É apresentado também um método de regularização pela inserção de uma perturbação na matriz de distâncias de rótulos, tendo desempenho similar ao desligamento de conexões (dropout). A abordagem proposta permite a combinação de modelos treinados com a função de custo LDMAT com diversos níveis de regularização, o que melhora a generalização do modelo final. Para validar a função de custo proposta, experimentos foram realizados para demonstrar a sua eficiência no treinamento de CNNs em tarefas de classificação. Nos conjuntos de dados FMNIST, EMNIST, CIFAR10, CIFAR100 e SVHN a função de custo LDMAT supera outras abordagens que utilizam arquiteturas similares, e na base MNIST os resultados são comparáveis com outras funções de custo propostas na literatura.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	ENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/pt/	*
dc.subject	Função de custo	pt_BR
dc.subject	Redes neurais convolucionais	pt_BR
dc.subject	Matrizes de distâncias	pt_BR
dc.subject.other	Engenharia elétrica	pt_BR
dc.subject.other	Redes neurais (Computação)	pt_BR
dc.subject.other	Matrizes (Matemática)	pt_BR
dc.title	LDMAT: função de custo baseada em matrizes de distâncias para o treinamento de redes neurais convolucionais	pt_BR
dc.type	Tese	pt_BR
dc.identifier.orcid	https://orcid.org/0000-0002-7510-3878	pt_BR
Appears in Collections:	Teses de Doutorado

Files in This Item:

File	Description	Size	Format
teseEduardoDaSilvaRibeiroPDFA.pdf		2.64 MB	Adobe PDF	View/Open

Show simple item record

This item is licensed under a Creative Commons License