Acessando informação de esporte através do SofaScore

dc.creatorVitor Faria de Carvalho Oliveira
dc.date.accessioned2024-10-09T15:08:16Z
dc.date.accessioned2025-09-08T23:32:15Z
dc.date.available2024-10-09T15:08:16Z
dc.date.issued2022-03-22
dc.description.abstractSports games have become popular, and football being the main one of these sports, followed by around four billion people worldwide. Such popularity has not only provided important cultural transformations, but has also had a large economic impact. Because of the increase in discussions and interest in analyzing soccer matches, it became necessary to provide structured database to universalize access to this data. Along with this need, there is the difficulty of obtaining updated and reliable data for the general population, so that the information can be easily analyzed and studied. Thinking about the previous comments, the present work intends to deliver football data in an easy and practical way to all people, reaching different types of users. The SofaScore site was selected for these reasons and for being an authentic and expert data source for extracting the information. This site is one of the biggest references in consultations on sports matches, having an audience of 22 million people and 22 years of market, for these reasons it was chosen for the extraction. Through the data science tools were selected data from the Brazilian championship of the A series, for being a championship with very active spectators, many rounds and one of the most relevant tournaments in the world. In this work, we use the R software combined with the data collection technique called web scraping, responsible for automatically finding pages, selecting, and extracting the desired content.In this way, a package with several features was developed that helps users extract information of interest in a direct and simple way.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/77330
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectEstatística – Teses
dc.subjectCiência de dados – Teses
dc.subjectBanco de Dados – Esportes - Teses
dc.subjectMineração de dados (Sistemas de recuperação da informação) – Teses
dc.subject.otherbanco de dados
dc.subject.othercoleta
dc.subject.otherautomática
dc.subject.otherR
dc.subject.otherSofaScore
dc.subject.otherweb scraping
dc.titleAcessando informação de esporte através do SofaScore
dc.title.alternativeAccessing sports information through SofaScore
dc.typeDissertação de mestrado
local.contributor.advisor1Marcos Oliveira Prates
local.contributor.advisor1Latteshttp://lattes.cnpq.br/7893235207392165
local.contributor.referee1Fabio Nogueira Demarqui
local.contributor.referee1Walmes Marques Zeviani
local.creator.Latteshttp://lattes.cnpq.br/8524633782402123
local.description.resumoJogos esportivos têm-se tornado cada vez mais populares, sendo o futebol, por exemplo, acompanhado por cerca de quatro bilhões de pessoas em todo o mundo. Tal popularidade tem proporcionado não só importantes transformações culturais, mas também trouxe grande impacto econômico. Visto o aumento das discussões e do interesse em analisar as partidas, torna-se necessária a disponibilização de bases de dados estruturadas, de forma a universalizar o acesso aos dados futebolísticos. Junto a essa necessidade existe a dificuldade de obter dados atualizados e confiáveis para a população geral de forma que as informações possam ser facilmente analisadas e estudadas. Pensando nos pontos anteriores, o presente trabalho visa fornecer dados futebolísticos de forma fácil e prática a todas as pessoas, atingindo diferentes categorias de usuários. Para isso, foi selecionado o site SofaScore, uma fonte de dados autêntica e especializada para extração das informações. Este site é um dos maiores sites de consultas de partidas esportivas, que possui uma audiência de 22 milhões de pessoas e 22 anos de mercado, por esses motivos foi escolhido para a extração. Através das ferramentas existentes na ciência de dados foram selecionados dados referentes ao Campeonato Brasileiro da série A, por ser um campeonato com espectadores muito ativos, grande número de rodadas e um dos mais relevantes em âmbito mundial. Neste trabalho, utilizamos o software R combinado com a técnica de coleta de dados chamada web scraping, responsável por, de forma automática, encontrar páginas, selecionar conteúdo e extraí-los. Dessa forma, foi desenvolvido um pacote com diversas funcionalidades que auxilia o usuários a extrair informações de interesse de maneira direta e simples.
local.identifier.orcidhttps://orcid.org/0000-0002-7894-6395
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE ESTATÍSTICA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Estatística

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao.pdf
Tamanho:
1.03 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: