Infection hot spot mining from social media trajectories

dc.creatorRoberto Carlos Soares Nalon Pereira Souza
dc.creatorRenato Martins Assunção
dc.creatorDerick Matheus de Oliveira
dc.creatorDenise Ester Fonseca de Brito
dc.creatorWagner Meira Junior
dc.date.accessioned2024-08-12T21:22:25Z
dc.date.accessioned2025-09-09T00:06:03Z
dc.date.available2024-08-12T21:22:25Z
dc.date.issued2016
dc.description.abstractTradicionalmente, na vigilância sanitária, as zonas de alto risco são identificadas apenas com base no endereço de residência ou local de trabalho do doente indivíduos. Isto fornece pouca informação sobre os locais onde as pessoas estão infectadas, a informação verdadeiramente importante para o controlo da doença. O disponibilidade recente de dados espaciais gerados por mídias sociais georreferenciadas postagens oferecem uma oportunidade única: identificar e acompanhar doenças indivíduos, obtemos uma coleção de eventos sequenciais geo-localizados, cada um sequência sendo emitida por um usuário de mídia social. A sequência de posições do mapa fornece implicitamente uma estimativa das trajetórias sociais dos usuários conforme eles flutuam no mapa. As técnicas existentes de mineração de dados para detecção de cluster não aborda essa nova configuração, pois exige um único localização para cada indivíduo em análise. Neste artigo apresentamos dois modelos estocásticos com seus algoritmos associados para explorar este novo tipo de dados. O Modelo de Visita encontra as zonas mais prováveis ​​que uma pessoa doente visita, enquanto o Modelo de Infecção encontra as zonas mais prováveis ​​onde uma pessoa doente pessoa é infectada durante uma visita. Demonstramos a aplicabilidade e eficácia dos nossos modelos propostos, aplicando-os a mais de 100 milhões de tweets com geo-tags do Brasil em 2015. Em particular, visamos o identificação de focos de infecção associados à dengue, doença transmitida por mosquitos que afeta milhões de pessoas no Brasil anualmente, e bilhões em todo o mundo. Aplicamos nossos algoritmos a dados de 11 grandes cidades do Brasil e encontraram focos de infecção, mostrando a utilidade do nossos métodos de vigilância de doenças.
dc.format.mimetypepdf
dc.identifier.urihttps://hdl.handle.net/1843/73821
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofEuropean Conference on Machine Learning and Knowledge Discovery in Databases
dc.rightsAcesso Aberto
dc.subjectRedes Sociais On-line
dc.subjectMineração de dados (Computação)
dc.subjectVigilância Eletrônica
dc.subject.otherSocial networking, Web sites
dc.subject.otherMining, Data
dc.subject.otherSurveillance, Electronic
dc.titleInfection hot spot mining from social media trajectories
dc.title.alternativeMineração de pontos críticos de infecção a partir de trajetórias de mídia social
dc.typeArtigo de evento
local.citation.epage755
local.citation.spage739
local.description.resumoTraditionally, in health surveillance, high risk zones are identified based only on the residence address or the working place of diseased individuals. This provides little information about the places where people are infected, the truly important information for disease control. The recent availability of spatial data generated by geotagged social media posts offers a unique opportunity: by identifying and following diseased individuals, we obtain a collection of sequential geo-located events, each sequence being issued by a social media user. The sequence of map positions implicitly provides an estimation of the users’ social trajectories as they drift on the map. The existing data mining techniques for spatial cluster detection fail to address this new setting as they require a single location to each individual under analysis. In this paper we present two stochastic models with their associated algorithms to mine this new type of data. The Visit Model finds the most likely zones that a diseased person visits, while the Infection Model finds the most likely zones where a person gets infected while visiting. We demonstrate the applicability and effectiveness of our proposed models by applying them to more than 100 million geotagged tweets from Brazil in 2015. In particular, we target the identification of infection hot spots associated with dengue, a mosquitotransmitted disease that affects millions of people in Brazil annually, and billions worldwide. We applied our algorithms to data from 11 large cities in Brazil and found infection hot spots, showing the usefulness of our methods for disease surveillance.
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.url.externahttps://link.springer.com/chapter/10.1007/978-3-319-46227-1_46

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Infection Hot Spot Mining.pdfA.pdf
Tamanho:
752.57 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: