Um arcabouço computacional para caracterizar sorte e habilidade em ligas esportivas
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Pedro Olmo Stancioli Vaz de Melo
Jussara Marques de Almeida
Jussara Marques de Almeida
Resumo
Prever o resultado de eventos esportivos é uma tarefa muito desafiadora. Este trabalho quantifica essa dificuldade através de um coeficiente que mede a distância entre o resultado final observado em ligas esportivas e o idealizado em competições completamente balanceadas em termos de habilidade. Este coeficiente indica a presença relativa de sorte e habilidade no campeonato. Foram coletados e analisados todos os jogos de 198 ligas esportivas, compostas de 1503 temporadas, oriundas de 84 países diferentes em 4 esportes: basquete, futebol, voleibol e handebol. Foi medida a competitividade por país e esporte. Também foram identificadas em cada temporada quais equipes deveriam ser removidas para que a liga ficasse completamente aleatória. Surpreendentemente, não é necessária a remoção de muitas equipes. Outra contribuição deste trabalho um modelo gráfico probabilístico cujo objetivo é aprender sobre as habilidades das equipes e decompor o peso relativo da sorte e da habilidade em cada partida. O componente da habilidade foi separado em variáveis associadas às características da equipe. O modelo também permite estimar como 0.36 a probabilidade do pior time, o chamado underdog, vencer uma partida na liga americana de basquete NBA. Como mostrado na primeira parte deste trabalho, a sorte está substancialmente presente mesmo nos campeonatos mais competitivos, o que parcialmente explica porque modelos sofisticados e complexos dificilmente conseguem ter resultados melhores que modelos mais simples na tarefa de prever resultados esportivos.
Abstract
It is well know that predicting the outcome of sports events from feature-based models is a very challenging task. This work quantifies that difficulty by proposing a coefficient that measures the impact of luck and skill on final results of sport leagues. It was collected and analyzed all games from 1503 seasons of 84 countries in 4 different sports: basketball, soccer, volleyball and handball. Though the proposed coefficient, it was possible to measure the competitiveness by countries and sports. Another contribution of this work is the fitting of a probabilistic graphical model in order to learn about the teams' skill in situations where skill has a large impact on the results according with the proposed coefficient. The model finds on National Basketball Association (NBA) championship a correlation of about 0.7 between the estimated skill and the number of wins throughout the season.
Assunto
Computação, Análise esportiva, Teoria bayesiana de decisão estatistica, Modelos gráficos probabilísticos
Palavras-chave
Estatística Bayesiana, Análise Esportiva, Modelos Gráficos Probabilísticos