Treinamento de redes neurais artificiais através de otimização multi-objetivo: uma nova abordagem para o equilíbrio entre a polarização e a variância
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Geraldo Robson Mateus
Andre Carlos Ponce de Leon Ferreira de Carvalho
Takashi Yoneyama
Andre Carlos Ponce de Leon Ferreira de Carvalho
Takashi Yoneyama
Resumo
Neste trabalho é desenvolvido um novo método para treinamento de Redes Neurais Artificiais (RNAS) do tipo Perceptron Multi·camadas (Multilayer Perceptron-MLP) utilizando- se técnicas de otimização multi-objetivo para encontrar soluções com alta capacidade de generalização. Na abordagem proposta, além de ser utilizado o erro quadrático como função de custo, utiliza·se também a função norma do vetor de pesos como um segundo objetivo. Estas duas funções são minimizadas e como consequência deste processo, obtém·se um conjunto de soluções chamadas Pareto-ótimas. Através de um decisor, estas soluções são avaliadas e apenas uma delas é escolhida como solução final, a qual equilibra os efeitos da polarização e da variância resultando em alta capacidade de generalização dada uma determinada realização do conjunto de treinamentos O método multi-objetivo proposto controla a flexibilidade do modelo independentemente da quantidade de pesos existente na rede, a partir de uma estrutura mínima, Além disso, a utilização de parâmetros de treinamento apesar de ser necessária, influencia pouco a solução final, O que faz com que a escolha destes parâmetros seja uma tarefa simples. Além do algoritmo multi-objetivo proposto e do algoritmo Backpropagation, métodos conhecidos os quais também visam ao aumento da capacidade de generalização como 10· Fold Cross-Validation, Early Stopping, Optimal Bmin Damage, Weight Decuy e Support Vector Mcchines são abordados Uma analise qualitativa e quantitativa dos algoritmos é feita, através da qual pode-se observar a superioridade do método proposto, sendo o mesmo capaz de gerar soluções com alta capacidade de generalização de forma simples e eficiente.
Abstract
Assunto
Engenharia elétrica, Redes neurais
Palavras-chave
Redes Neurais, Otimização Multiobjetivo