Aprendizado de operadores de agregação do tipo média ponderada ordenada em redes neurais convolucionais
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Janier Arias García
Cristiano Leite de Castro
Cristiano Leite de Castro
Resumo
Nas redes neurais convolucionais são realizadas operações de agregação nas camadas de
convolução, pooling e nas densas completamente conectadas. Resultados promissores foram
obtidos nos últimos anos ao utilizar operadores de agregação do tipo media ponderada
ordenada, mais conhecidos como operadores OWA, para agregar dados dentro das redes
neurais convolucionais. Há trabalhos recentes demonstrando que há um ganho de performance signiőcativo ao utilizar os operadores OWA, treinando os seus pesos, para realizar
a operação de pooling, quando comparado com os operadores mais usuais (máximo e
médio). Outros estudos demonstraram que os operadores OWA podem ser utilizados para
aprender informações a partir do ordenamento dos canais de uma determinada camada, e
as informações recém-geradas são usadas para complementar ou substituir os dados de
entrada para a camada seguinte. O objetivo desta dissertação é analisar e combinar as
duas ideias mencionadas. Vários testes foram feitos para avaliar a mudança de desempenho
ao aplicar operadores OWA para classiőcar imagens, usando os modelos VGG13, Network
in Network e AlexNet e os conjuntos de dados CIFAR-10 e CIFAR-100.
Abstract
In convolutional neural networks, aggregation operations are performed in the convolution,
pooling and fully connected dense layers. Promising results have been obtained in recent
years when using ordered weighted averaging operators, better known as OWA operators, to
aggregate data within convolutional neural networks. There are recent works demonstrating
that there is a performance gain when using OWA operators, training their weights, to
perform the pooling operation, when compared with the most usual operators (maximum
and average). Other studies have shown that OWA operators can be used to learn additional
order-based information from the feature maps of a certain layer, and the newly generated
information is used to complement or replace the input data for the next layer. The
purpose of this dissertation is to analyze and combine the two mentioned ideas. Several
tests were done to evaluate the performance change when applying OWA operators to
classify images, using the VGG13, Network in Network and AlexNet models and the
CIFAR-10 and CIFAR-100 datasets.
Assunto
Engenharia elétrica, Redes neurais convolucionais, Aprendizado profundo, Otimização multiobjetivo
Palavras-chave
Redes neurais convolucionais, Operadores OWA, Aprendizado profundo, Funções de agregação, Classificação de imagens