A comprehensive dataset of brazilian fact-checking stories

dc.creatorIgor Marques de Araújo
dc.creatorIsadora Salles
dc.creatorJoão M. M. Couto
dc.creatorBreno C. Pimenta
dc.creatorSamuel Assis
dc.creatorJulio Cesar Soares dos Reis
dc.creatorAna Paula Couto da Silva
dc.creatorJussara M. de Almeida
dc.creatorFabrício Benevenuto
dc.date.accessioned2024-08-13T21:24:03Z
dc.date.accessioned2025-09-08T23:37:46Z
dc.date.available2024-08-13T21:24:03Z
dc.date.issued2022
dc.description.abstractNos últimos anos, as plataformas digitais tornaram-se um meio poderoso para difusão de informações em larga escala em todo o mundo, especialmente no Brasil. Compreender os principais aspectos que impulsionam o processo de difusão da desinformação é de fundamental importância para a concepção e implementação de novas ferramentas para detectar automaticamente conteúdos de desinformação. Neste cenário, a checagem de fatos realizada por agências de alta credibilidade fornece dados rotulados ricos, o que é fundamental para construir ferramentas capazes de detectar e mitigar os efeitos da desinformação. Este artigo abre um novo conjunto de dados, conhecido como FactCenter, para a comunidade de pesquisa, contendo instâncias de verificação de fatos coletadas de 6 diferentes agências brasileiras de verificação de fatos. Este conjunto de dados possui 11.647 instâncias de verificação de fatos, abrangendo diversos tópicos e domínios. Apresentamos uma análise inicial dos dados recolhidos, enriquecida por dados do Facebook, que demonstra o potencial do nosso repositório para estudos futuros.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.description.sponsorshipOutra Agência
dc.format.mimetypepdf
dc.identifier.doihttps://doi.org/10.5753/jidm.2022.2354
dc.identifier.issn2178-7107
dc.identifier.urihttps://hdl.handle.net/1843/73921
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofJournal of Information and Data Management
dc.rightsAcesso Aberto
dc.subjectMídias sociais
dc.subjectDesinformação
dc.subjectFake news
dc.subject.otherFact-checking
dc.subject.otherSocial media
dc.subject.otherMisinformation
dc.subject.otherFake news
dc.titleA comprehensive dataset of brazilian fact-checking stories
dc.typeArtigo de periódico
local.citation.epage142
local.citation.spage127
local.citation.volume13
local.description.resumoIn recent years, digital platforms have become a powerful means for large scale information diffusion world-wide, particularly in Brazil. Understanding key aspects driving the misinformation diffusion process is of paramount importance to the design and implementation of new tools to automatically detect misinformation content. In this scenario, fact-checking performed by high credibility agencies provide rich labeled data, which is fundamental to build tools capable of detecting and mitigating the effects of misinformation. This paper opens a novel dataset, referred to as FactCenter, to the research community, containing fact-check instances collected from 6 different Brazilian fact-checking agencies. This dataset has 11 647 fact-check instances, covering several topics and domains. We present an initial analysis of the data collected, enriched by data from Facebook, which demonstrates the potential of our repository for future studies.
local.identifier.orcidhttps://orcid.org/0000-0002-3784-3664
local.identifier.orcidhttps://orcid.org/0000-0001-8913-6294
local.identifier.orcidhttps://orcid.org/0000-0001-8882-6525
local.identifier.orcidhttps://orcid.org/0000-0001-5951-3562
local.identifier.orcidhttps://orcid.org/0000-0001-9142-2919
local.identifier.orcidhttps://orcid.org/0000-0001-6875-6259
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.url.externahttps://journals-sol.sbc.org.br/index.php/jidm/article/view/2354

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
A comprehensive dataset of brazilian fact-checking stories.pdf
Tamanho:
927.61 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: