Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/38119
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Jussara Marques de Almeidapt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3286329883412205pt_BR
dc.contributor.advisor-co1Marisa Affonso Vasconcelospt_BR
dc.contributor.referee1Ana Paula Couto da Silvapt_BR
dc.contributor.referee2Fabrício Murai Ferreirapt_BR
dc.contributor.referee3Humberto Torres Marques Netopt_BR
dc.creatorAlexandre Marospt_BR
dc.creator.Latteshttp://lattes.cnpq.br/8199983259880335pt_BR
dc.date.accessioned2021-09-22T00:10:23Z-
dc.date.available2021-09-22T00:10:23Z-
dc.date.issued2020-11-20-
dc.identifier.urihttp://hdl.handle.net/1843/38119-
dc.description.abstractO WhatsApp é um aplicativo de mensagens gratuito com mais de 1,5 bilhão de usuários ativos mensais que se tornou uma das principais plataformas de comunicação em muitos países, incluindo Alemanha, Malásia e Brasil. Além de permitir a troca direta de mensagens entre pares de usuários, o aplicativo também possibilita conversas em grupo, onde várias pessoas podem interagir entre si. Muitos estudos recentes têm mostrado que os grupos de WhatsApp desempenham um papel significativo como plataforma de disseminação de informações, especialmente durante eventos importantes de mobilização social. Nesta dissertação, complementamos esses estudos anteriores ao examinar o uso de mensagens de áudio em grupos de WhatsApp, um tipo de conteúdo que está se tornando cada vez mais importante na plataforma. Apresentamos uma metodologia para analisar mensagens de áudio compartilhadas em grupos publicamente acessíveis do WhatsApp, composta por várias etapas: (1) pré-processamento, (2) detecção de similaridade (para agrupar áudios com conteúdo equivalente), (3) reconhecimento de voz para transcrever os áudios, (4) detecção de desinformação, (5) categorização do tipo de áudio (para distinguir entre fala e música, assim como o gênero do locutor), (6) uma análise qualitativa com usuários voluntários e (7) análise de conteúdo e propagação. Analisamos mais de 40 mil mensagens de áudio em seis meses, compartilhadas em 364 grupos. Primeiro, examinamos o conteúdo das mensagens de áudio fazendo uma análise de tópicos. Identificamos oito tópicos de discussão, quatro relacionados à política e contendo a maior fração de desinformação. Em seguida, extraímos características linguísticas psicológicas e identificamos que os áudios com desinformação tem uma presença maior de emoções negativas. Eles também costumam usar frases no tempo futuro e falam diretamente com o ouvinte usando palavras como "você''. Em contraste, estudos anteriores sobre desinformação em mensagens textuais compartilhadas no WhatsApp identificaram uma maior frequência do tempo presente e de termos para agregar a comunidade, como "nós''. A análise qualitativa mostrou que áudios com desinformação tendem a fazer o ouvinte sentir emoções negativas, como raiva. Os voluntários notaram que os áudios com desinformação tentaram dar crédito a suas afirmações com fontes externas; no entanto, eles consideraram essas fontes como não confiáveis. O tom do locutor nos áudios com desinformação também foi considerado menos amigável e natural do que os áudios com conteúdo não verificado. Por fim, nossa análise de propagação mostrou que os áudios são compartilhados em intervalos curtos, com mais da metade deles sendo compartilhados em três horas, mas se espalhando mais lentamente do que o conteúdo textual e de imagem. Também descobrimos que os áudios contendo música costumam ser mais compartilhados do que apenas fala e tem uma vida mais longa. Além disso, os áudios com desinformação tendem a se espalhar mais rápido do que áudios com conteúdo não verificado e duram muito mais tempo na rede. Em suma, realizamos um estudo que, até onde sabemos, é o primeiro a abordar a comunicação de áudio em grupos de WhatsApp, demonstrando como analisar esse tipo de mídia, observando o conteúdo e a dinâmica de propagação, e comparando-a com outros tipos de mídia (texto e imagens), tipos de áudios distintos e áudios contendo desinformação. Nosso trabalho revelou que essa forma de comunicação segue padrões distintos de conteúdo de texto e imagem, principalmente no que diz respeito à desinformação, complementando assim a literatura.pt_BR
dc.description.resumoWhatsApp is a free messaging app with more than 1.5 billion active monthly users that has become one of the leading communication platforms in many countries, including Germany, Malaysia, and Brazil. In addition to allowing the direct exchange of messages among pairs of users, the application also enables group conversations, where multiple people can interact with each other. Many recent studies have shown that WhatsApp groups play a significant role as an information dissemination platform, especially during important social mobilization events. In this thesis, we build upon those prior efforts by looking into the use of audio messages in WhatsApp groups, a type of content that is becoming increasingly important in the platform. We present a methodology to analyze audio messages shared in publicly accessible WhatsApp groups composed of several steps: (1) pre-processing, (2) similarity detection (to group audios with equivalent content), (3) speech recognition to transcribe the audios, (4) misinformation detection, (5) audio type categorization (to distinguish between speech and music, as well as by speaker's gender), (6) a qualitative analysis with volunteers users, and (7) content and propagation analysis. We analyzed more than 40 thousand audio messages across six months shared in over 364 groups. We first looked into the content of the audio messages by doing a topic analysis. We identified eight topics of discussion, four related to politics, and containing the largest fraction of misinformation. We then extracted psychological linguistic features and identified that audios with misinformation had a higher presence of negative emotions. They also often used phrases in the future tense and talked directly to the listener by using words such as "you''. In contrast, prior studies on misinformation in textual messages shared on Whatsapp identified a higher frequency of the present tense and terms to aggregate the community, such as "we". The qualitative analysis showed that audios with misinformation tend to make the listener feel negative emotions, such as anger. The volunteers noted that audios with misinformation tried to back their claims with sources; however, they often saw these sources as unreliable. The speaker's tone from the audios with misinformation was also considered less friendly and natural than audios with unchecked content. Lastly, our propagation analysis showed that audios are re-shared within short intervals, with more than half of them being re-shared within three hours but spreading more slowly than textual and image content. We also found that audios containing music were often shared more than speech and had a longer lifetime. Moreover, audios with misinformation tend to spread quicker than unchecked content and last significantly longer in the network. In sum, we performed a study that, to our knowledge, is the first to tackle audio communication in WhatsApp groups, going over how to analyze this type of media, looking into content and propagation dynamics, and comparing it to other types of media (text and images), multiple audio types, and audios containing misinformation. Our work revealed that this form of communication follows different patterns from text and image content, especially when it comes to misinformation, thus complementing the literature.pt_BR
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológicopt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectWhatsApppt_BR
dc.subjectAudio Communicationpt_BR
dc.subjectInformation Disseminationpt_BR
dc.subjectMisinformationpt_BR
dc.subject.otherComputação – Teses.pt_BR
dc.subject.otherWhatsApp (Aplicativo de mensagens) – Teses.pt_BR
dc.subject.otherDesinformação – Teses.pt_BR
dc.subject.otherDisseminação da informação - Tesespt_BR
dc.titleAn analysis of audio messages shared in WhatsApp groupspt_BR
dc.title.alternativeUma análise de mensagens de áudio compartilhadas em grupos do WhatsApppt_BR
dc.typeDissertaçãopt_BR
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
AlexandreMaros_Dissertacao_PPGCC_2.pdf4.45 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.