Desenvolvimento e avaliação de uma metodologia para geração de agentes genéricos para jogos de tabuleiro
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Adriano Alonso Veloso
Leandro Soriano Marcolino
Leandro Soriano Marcolino
Resumo
Um agente de General Game Playing (GGP) deve ser capaz de jogar efetivamente diferentes jogos talvez com algum processo inicial de aprendizagem. Dadas as regras de um jogo qualquer, como gerar um agente inteligente que seja competitivo em comparação a agentes específicos para o jogo? Neste trabalho, propomos um método denominado UCT-CCNN para o aprendizado off-line de função de valor para estados de jogos de tabuleiro. No método UCT-CCNN inúmeras partidas são jogadas pelos agentes MCTS com política da árvore conhecida como Upper Confidence Bounds for Tree (UCT) em um processo off-line que gera uma base de dados de exemplos de estado-utilidade. A partir desses exemplos uma função de valor para os estados de jogo é aprendida com o uso de redes neurais construtivas denominadas Cascade Correlation Neural Networks. Os jogos Othello e Trilha foram submetidos ao método UCT-CCNN e os agentes obtidos foram capazes de ganhar de agentes específicos do domínio.
Abstract
Assunto
Monte Carlo tree search, General Game Playing, Método de entropia cruzada, Computação, Rede correlação em cascata
Palavras-chave
Cascade Correlation Neural Networks, General Game Playing, Monte Carlo Tree Search, Cross-Entropy Method, Upper Confidence Bounds for Trees