Desenvolvimento e avaliação de uma metodologia para geração de agentes genéricos para jogos de tabuleiro

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Adriano Alonso Veloso
Leandro Soriano Marcolino

Resumo

Um agente de General Game Playing (GGP) deve ser capaz de jogar efetivamente diferentes jogos talvez com algum processo inicial de aprendizagem. Dadas as regras de um jogo qualquer, como gerar um agente inteligente que seja competitivo em comparação a agentes específicos para o jogo? Neste trabalho, propomos um método denominado UCT-CCNN para o aprendizado off-line de função de valor para estados de jogos de tabuleiro. No método UCT-CCNN inúmeras partidas são jogadas pelos agentes MCTS com política da árvore conhecida como Upper Confidence Bounds for Tree (UCT) em um processo off-line que gera uma base de dados de exemplos de estado-utilidade. A partir desses exemplos uma função de valor para os estados de jogo é aprendida com o uso de redes neurais construtivas denominadas Cascade Correlation Neural Networks. Os jogos Othello e Trilha foram submetidos ao método UCT-CCNN e os agentes obtidos foram capazes de ganhar de agentes específicos do domínio.

Abstract

Assunto

Monte Carlo tree search, General Game Playing, Método de entropia cruzada, Computação, Rede correlação em cascata

Palavras-chave

Cascade Correlation Neural Networks, General Game Playing, Monte Carlo Tree Search, Cross-Entropy Method, Upper Confidence Bounds for Trees

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por