Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/73921
Type: Artigo de Periódico
Title: A comprehensive dataset of brazilian fact-checking stories
Authors: Igor Marques de Araújo
Isadora Salles
João M. M. Couto
Breno C. Pimenta
Samuel Assis
Julio Cesar Soares dos Reis
Ana Paula Couto da Silva
Jussara M. de Almeida
Fabrício Benevenuto
Abstract: In recent years, digital platforms have become a powerful means for large scale information diffusion world-wide, particularly in Brazil. Understanding key aspects driving the misinformation diffusion process is of paramount importance to the design and implementation of new tools to automatically detect misinformation content. In this scenario, fact-checking performed by high credibility agencies provide rich labeled data, which is fundamental to build tools capable of detecting and mitigating the effects of misinformation. This paper opens a novel dataset, referred to as FactCenter, to the research community, containing fact-check instances collected from 6 different Brazilian fact-checking agencies. This dataset has 11 647 fact-check instances, covering several topics and domains. We present an initial analysis of the data collected, enriched by data from Facebook, which demonstrates the potential of our repository for future studies.
Abstract: Nos últimos anos, as plataformas digitais tornaram-se um meio poderoso para difusão de informações em larga escala em todo o mundo, especialmente no Brasil. Compreender os principais aspectos que impulsionam o processo de difusão da desinformação é de fundamental importância para a concepção e implementação de novas ferramentas para detectar automaticamente conteúdos de desinformação. Neste cenário, a checagem de fatos realizada por agências de alta credibilidade fornece dados rotulados ricos, o que é fundamental para construir ferramentas capazes de detectar e mitigar os efeitos da desinformação. Este artigo abre um novo conjunto de dados, conhecido como FactCenter, para a comunidade de pesquisa, contendo instâncias de verificação de fatos coletadas de 6 diferentes agências brasileiras de verificação de fatos. Este conjunto de dados possui 11.647 instâncias de verificação de fatos, abrangendo diversos tópicos e domínios. Apresentamos uma análise inicial dos dados recolhidos, enriquecida por dados do Facebook, que demonstra o potencial do nosso repositório para estudos futuros.
Subject: Mídias sociais
Desinformação
Fake news
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
Rights: Acesso Aberto
metadata.dc.identifier.doi: https://doi.org/10.5753/jidm.2022.2354
URI: http://hdl.handle.net/1843/73921
Issue Date: 2022
metadata.dc.url.externa: https://journals-sol.sbc.org.br/index.php/jidm/article/view/2354
metadata.dc.relation.ispartof: Journal of Information and Data Management
Appears in Collections:Artigo de Periódico

Files in This Item:
File Description SizeFormat 
A comprehensive dataset of brazilian fact-checking stories.pdf927.61 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.