Infection hot spot mining from social media trajectories
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de evento
Título alternativo
Mineração de pontos críticos de infecção a partir de trajetórias de mídia social
Primeiro orientador
Membros da banca
Resumo
Traditionally, in health surveillance, high risk zones are identified based only on the residence address or the working place of diseased
individuals. This provides little information about the places where people are infected, the truly important information for disease control. The
recent availability of spatial data generated by geotagged social media
posts offers a unique opportunity: by identifying and following diseased
individuals, we obtain a collection of sequential geo-located events, each
sequence being issued by a social media user. The sequence of map positions implicitly provides an estimation of the users’ social trajectories as
they drift on the map. The existing data mining techniques for spatial
cluster detection fail to address this new setting as they require a single
location to each individual under analysis. In this paper we present two
stochastic models with their associated algorithms to mine this new type
of data. The Visit Model finds the most likely zones that a diseased person visits, while the Infection Model finds the most likely zones where a
person gets infected while visiting. We demonstrate the applicability and
effectiveness of our proposed models by applying them to more than 100
million geotagged tweets from Brazil in 2015. In particular, we target the
identification of infection hot spots associated with dengue, a mosquitotransmitted disease that affects millions of people in Brazil annually,
and billions worldwide. We applied our algorithms to data from 11 large
cities in Brazil and found infection hot spots, showing the usefulness of
our methods for disease surveillance.
Abstract
Tradicionalmente, na vigilância sanitária, as zonas de alto risco são identificadas apenas com base no endereço de residência ou local de trabalho do doente
indivíduos. Isto fornece pouca informação sobre os locais onde as pessoas estão infectadas, a informação verdadeiramente importante para o controlo da doença. O
disponibilidade recente de dados espaciais gerados por mídias sociais georreferenciadas
postagens oferecem uma oportunidade única: identificar e acompanhar doenças
indivíduos, obtemos uma coleção de eventos sequenciais geo-localizados, cada um
sequência sendo emitida por um usuário de mídia social. A sequência de posições do mapa fornece implicitamente uma estimativa das trajetórias sociais dos usuários conforme
eles flutuam no mapa. As técnicas existentes de mineração de dados para
detecção de cluster não aborda essa nova configuração, pois exige um único
localização para cada indivíduo em análise. Neste artigo apresentamos dois
modelos estocásticos com seus algoritmos associados para explorar este novo tipo
de dados. O Modelo de Visita encontra as zonas mais prováveis que uma pessoa doente visita, enquanto o Modelo de Infecção encontra as zonas mais prováveis onde uma pessoa doente
pessoa é infectada durante uma visita. Demonstramos a aplicabilidade e
eficácia dos nossos modelos propostos, aplicando-os a mais de 100
milhões de tweets com geo-tags do Brasil em 2015. Em particular, visamos o
identificação de focos de infecção associados à dengue, doença transmitida por mosquitos que afeta milhões de pessoas no Brasil anualmente,
e bilhões em todo o mundo. Aplicamos nossos algoritmos a dados de 11 grandes
cidades do Brasil e encontraram focos de infecção, mostrando a utilidade do
nossos métodos de vigilância de doenças.
Assunto
Redes Sociais On-line, Mineração de dados (Computação), Vigilância Eletrônica
Palavras-chave
Social networking, Web sites, Mining, Data, Surveillance, Electronic
Citação
Departamento
Curso
Endereço externo
https://link.springer.com/chapter/10.1007/978-3-319-46227-1_46