Acessando informação de esporte através do SofaScore

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Accessing sports information through SofaScore

Primeiro orientador

Membros da banca

Fabio Nogueira Demarqui
Walmes Marques Zeviani

Resumo

Jogos esportivos têm-se tornado cada vez mais populares, sendo o futebol, por exemplo, acompanhado por cerca de quatro bilhões de pessoas em todo o mundo. Tal popularidade tem proporcionado não só importantes transformações culturais, mas também trouxe grande impacto econômico. Visto o aumento das discussões e do interesse em analisar as partidas, torna-se necessária a disponibilização de bases de dados estruturadas, de forma a universalizar o acesso aos dados futebolísticos. Junto a essa necessidade existe a dificuldade de obter dados atualizados e confiáveis para a população geral de forma que as informações possam ser facilmente analisadas e estudadas. Pensando nos pontos anteriores, o presente trabalho visa fornecer dados futebolísticos de forma fácil e prática a todas as pessoas, atingindo diferentes categorias de usuários. Para isso, foi selecionado o site SofaScore, uma fonte de dados autêntica e especializada para extração das informações. Este site é um dos maiores sites de consultas de partidas esportivas, que possui uma audiência de 22 milhões de pessoas e 22 anos de mercado, por esses motivos foi escolhido para a extração. Através das ferramentas existentes na ciência de dados foram selecionados dados referentes ao Campeonato Brasileiro da série A, por ser um campeonato com espectadores muito ativos, grande número de rodadas e um dos mais relevantes em âmbito mundial. Neste trabalho, utilizamos o software R combinado com a técnica de coleta de dados chamada web scraping, responsável por, de forma automática, encontrar páginas, selecionar conteúdo e extraí-los. Dessa forma, foi desenvolvido um pacote com diversas funcionalidades que auxilia o usuários a extrair informações de interesse de maneira direta e simples.

Abstract

Sports games have become popular, and football being the main one of these sports, followed by around four billion people worldwide. Such popularity has not only provided important cultural transformations, but has also had a large economic impact. Because of the increase in discussions and interest in analyzing soccer matches, it became necessary to provide structured database to universalize access to this data. Along with this need, there is the difficulty of obtaining updated and reliable data for the general population, so that the information can be easily analyzed and studied. Thinking about the previous comments, the present work intends to deliver football data in an easy and practical way to all people, reaching different types of users. The SofaScore site was selected for these reasons and for being an authentic and expert data source for extracting the information. This site is one of the biggest references in consultations on sports matches, having an audience of 22 million people and 22 years of market, for these reasons it was chosen for the extraction. Through the data science tools were selected data from the Brazilian championship of the A series, for being a championship with very active spectators, many rounds and one of the most relevant tournaments in the world. In this work, we use the R software combined with the data collection technique called web scraping, responsible for automatically finding pages, selecting, and extracting the desired content.In this way, a package with several features was developed that helps users extract information of interest in a direct and simple way.

Assunto

Estatística – Teses, Ciência de dados – Teses, Banco de Dados – Esportes - Teses, Mineração de dados (Sistemas de recuperação da informação) – Teses

Palavras-chave

banco de dados, coleta, automática, R, SofaScore, web scraping

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por