Acessando informação de esporte através do SofaScore
| dc.creator | Vitor Faria de Carvalho Oliveira | |
| dc.date.accessioned | 2024-10-09T15:08:16Z | |
| dc.date.accessioned | 2025-09-08T23:32:15Z | |
| dc.date.available | 2024-10-09T15:08:16Z | |
| dc.date.issued | 2022-03-22 | |
| dc.description.abstract | Sports games have become popular, and football being the main one of these sports, followed by around four billion people worldwide. Such popularity has not only provided important cultural transformations, but has also had a large economic impact. Because of the increase in discussions and interest in analyzing soccer matches, it became necessary to provide structured database to universalize access to this data. Along with this need, there is the difficulty of obtaining updated and reliable data for the general population, so that the information can be easily analyzed and studied. Thinking about the previous comments, the present work intends to deliver football data in an easy and practical way to all people, reaching different types of users. The SofaScore site was selected for these reasons and for being an authentic and expert data source for extracting the information. This site is one of the biggest references in consultations on sports matches, having an audience of 22 million people and 22 years of market, for these reasons it was chosen for the extraction. Through the data science tools were selected data from the Brazilian championship of the A series, for being a championship with very active spectators, many rounds and one of the most relevant tournaments in the world. In this work, we use the R software combined with the data collection technique called web scraping, responsible for automatically finding pages, selecting, and extracting the desired content.In this way, a package with several features was developed that helps users extract information of interest in a direct and simple way. | |
| dc.description.sponsorship | CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico | |
| dc.description.sponsorship | FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais | |
| dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | |
| dc.identifier.uri | https://hdl.handle.net/1843/77330 | |
| dc.language | por | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.rights | Acesso Aberto | |
| dc.subject | Estatística – Teses | |
| dc.subject | Ciência de dados – Teses | |
| dc.subject | Banco de Dados – Esportes - Teses | |
| dc.subject | Mineração de dados (Sistemas de recuperação da informação) – Teses | |
| dc.subject.other | banco de dados | |
| dc.subject.other | coleta | |
| dc.subject.other | automática | |
| dc.subject.other | R | |
| dc.subject.other | SofaScore | |
| dc.subject.other | web scraping | |
| dc.title | Acessando informação de esporte através do SofaScore | |
| dc.title.alternative | Accessing sports information through SofaScore | |
| dc.type | Dissertação de mestrado | |
| local.contributor.advisor1 | Marcos Oliveira Prates | |
| local.contributor.advisor1Lattes | http://lattes.cnpq.br/7893235207392165 | |
| local.contributor.referee1 | Fabio Nogueira Demarqui | |
| local.contributor.referee1 | Walmes Marques Zeviani | |
| local.creator.Lattes | http://lattes.cnpq.br/8524633782402123 | |
| local.description.resumo | Jogos esportivos têm-se tornado cada vez mais populares, sendo o futebol, por exemplo, acompanhado por cerca de quatro bilhões de pessoas em todo o mundo. Tal popularidade tem proporcionado não só importantes transformações culturais, mas também trouxe grande impacto econômico. Visto o aumento das discussões e do interesse em analisar as partidas, torna-se necessária a disponibilização de bases de dados estruturadas, de forma a universalizar o acesso aos dados futebolísticos. Junto a essa necessidade existe a dificuldade de obter dados atualizados e confiáveis para a população geral de forma que as informações possam ser facilmente analisadas e estudadas. Pensando nos pontos anteriores, o presente trabalho visa fornecer dados futebolísticos de forma fácil e prática a todas as pessoas, atingindo diferentes categorias de usuários. Para isso, foi selecionado o site SofaScore, uma fonte de dados autêntica e especializada para extração das informações. Este site é um dos maiores sites de consultas de partidas esportivas, que possui uma audiência de 22 milhões de pessoas e 22 anos de mercado, por esses motivos foi escolhido para a extração. Através das ferramentas existentes na ciência de dados foram selecionados dados referentes ao Campeonato Brasileiro da série A, por ser um campeonato com espectadores muito ativos, grande número de rodadas e um dos mais relevantes em âmbito mundial. Neste trabalho, utilizamos o software R combinado com a técnica de coleta de dados chamada web scraping, responsável por, de forma automática, encontrar páginas, selecionar conteúdo e extraí-los. Dessa forma, foi desenvolvido um pacote com diversas funcionalidades que auxilia o usuários a extrair informações de interesse de maneira direta e simples. | |
| local.identifier.orcid | https://orcid.org/0000-0002-7894-6395 | |
| local.publisher.country | Brasil | |
| local.publisher.department | ICX - DEPARTAMENTO DE ESTATÍSTICA | |
| local.publisher.initials | UFMG | |
| local.publisher.program | Programa de Pós-Graduação em Estatística |