Desenvolvimento e avaliação de uma metodologia para geração de agentes genéricos para jogos de tabuleiro
| dc.creator | Mateus Andrade Rezende | |
| dc.date.accessioned | 2019-08-13T04:37:20Z | |
| dc.date.accessioned | 2025-09-09T00:36:54Z | |
| dc.date.available | 2019-08-13T04:37:20Z | |
| dc.date.issued | 2017-06-02 | |
| dc.identifier.uri | https://hdl.handle.net/1843/ESBF-AQ2PXY | |
| dc.language | Português | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.rights | Acesso Aberto | |
| dc.subject | Monte Carlo tree search | |
| dc.subject | General Game Playing | |
| dc.subject | Método de entropia cruzada | |
| dc.subject | Computação | |
| dc.subject | Rede correlação em cascata | |
| dc.subject.other | Cascade Correlation Neural Networks | |
| dc.subject.other | General Game Playing | |
| dc.subject.other | Monte Carlo Tree Search | |
| dc.subject.other | Cross-Entropy Method | |
| dc.subject.other | Upper Confidence Bounds for Trees | |
| dc.title | Desenvolvimento e avaliação de uma metodologia para geração de agentes genéricos para jogos de tabuleiro | |
| dc.type | Dissertação de mestrado | |
| local.contributor.advisor1 | Luiz Chaimowicz | |
| local.contributor.referee1 | Adriano Alonso Veloso | |
| local.contributor.referee1 | Leandro Soriano Marcolino | |
| local.description.resumo | Um agente de General Game Playing (GGP) deve ser capaz de jogar efetivamente diferentes jogos talvez com algum processo inicial de aprendizagem. Dadas as regras de um jogo qualquer, como gerar um agente inteligente que seja competitivo em comparação a agentes específicos para o jogo? Neste trabalho, propomos um método denominado UCT-CCNN para o aprendizado off-line de função de valor para estados de jogos de tabuleiro. No método UCT-CCNN inúmeras partidas são jogadas pelos agentes MCTS com política da árvore conhecida como Upper Confidence Bounds for Tree (UCT) em um processo off-line que gera uma base de dados de exemplos de estado-utilidade. A partir desses exemplos uma função de valor para os estados de jogo é aprendida com o uso de redes neurais construtivas denominadas Cascade Correlation Neural Networks. Os jogos Othello e Trilha foram submetidos ao método UCT-CCNN e os agentes obtidos foram capazes de ganhar de agentes específicos do domínio. | |
| local.publisher.initials | UFMG |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- mateusandraderezende.pdf
- Tamanho:
- 1.16 MB
- Formato:
- Adobe Portable Document Format