Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/73921
Type: | Artigo de Periódico |
Title: | A comprehensive dataset of brazilian fact-checking stories |
Authors: | Igor Marques de Araújo Isadora Salles João M. M. Couto Breno C. Pimenta Samuel Assis Julio Cesar Soares dos Reis Ana Paula Couto da Silva Jussara M. de Almeida Fabrício Benevenuto |
Abstract: | In recent years, digital platforms have become a powerful means for large scale information diffusion world-wide, particularly in Brazil. Understanding key aspects driving the misinformation diffusion process is of paramount importance to the design and implementation of new tools to automatically detect misinformation content. In this scenario, fact-checking performed by high credibility agencies provide rich labeled data, which is fundamental to build tools capable of detecting and mitigating the effects of misinformation. This paper opens a novel dataset, referred to as FactCenter, to the research community, containing fact-check instances collected from 6 different Brazilian fact-checking agencies. This dataset has 11 647 fact-check instances, covering several topics and domains. We present an initial analysis of the data collected, enriched by data from Facebook, which demonstrates the potential of our repository for future studies. |
Abstract: | Nos últimos anos, as plataformas digitais tornaram-se um meio poderoso para difusão de informações em larga escala em todo o mundo, especialmente no Brasil. Compreender os principais aspectos que impulsionam o processo de difusão da desinformação é de fundamental importância para a concepção e implementação de novas ferramentas para detectar automaticamente conteúdos de desinformação. Neste cenário, a checagem de fatos realizada por agências de alta credibilidade fornece dados rotulados ricos, o que é fundamental para construir ferramentas capazes de detectar e mitigar os efeitos da desinformação. Este artigo abre um novo conjunto de dados, conhecido como FactCenter, para a comunidade de pesquisa, contendo instâncias de verificação de fatos coletadas de 6 diferentes agências brasileiras de verificação de fatos. Este conjunto de dados possui 11.647 instâncias de verificação de fatos, abrangendo diversos tópicos e domínios. Apresentamos uma análise inicial dos dados recolhidos, enriquecida por dados do Facebook, que demonstra o potencial do nosso repositório para estudos futuros. |
Subject: | Mídias sociais Desinformação Fake news |
language: | eng |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.department: | ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO |
Rights: | Acesso Aberto |
metadata.dc.identifier.doi: | https://doi.org/10.5753/jidm.2022.2354 |
URI: | http://hdl.handle.net/1843/73921 |
Issue Date: | 2022 |
metadata.dc.url.externa: | https://journals-sol.sbc.org.br/index.php/jidm/article/view/2354 |
metadata.dc.relation.ispartof: | Journal of Information and Data Management |
Appears in Collections: | Artigo de Periódico |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
A comprehensive dataset of brazilian fact-checking stories.pdf | 927.61 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.