Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/73821
Tipo: Artigo de Evento
Título: Infection hot spot mining from social media trajectories
Título(s) alternativo(s): Mineração de pontos críticos de infecção a partir de trajetórias de mídia social
Autor(es): Roberto Carlos Soares Nalon Pereira Souza
Renato Martins Assunção
Derick Matheus de Oliveira
Denise Ester Fonseca de Brito
Wagner Meira Junior
Resumo: Traditionally, in health surveillance, high risk zones are identified based only on the residence address or the working place of diseased individuals. This provides little information about the places where people are infected, the truly important information for disease control. The recent availability of spatial data generated by geotagged social media posts offers a unique opportunity: by identifying and following diseased individuals, we obtain a collection of sequential geo-located events, each sequence being issued by a social media user. The sequence of map positions implicitly provides an estimation of the users’ social trajectories as they drift on the map. The existing data mining techniques for spatial cluster detection fail to address this new setting as they require a single location to each individual under analysis. In this paper we present two stochastic models with their associated algorithms to mine this new type of data. The Visit Model finds the most likely zones that a diseased person visits, while the Infection Model finds the most likely zones where a person gets infected while visiting. We demonstrate the applicability and effectiveness of our proposed models by applying them to more than 100 million geotagged tweets from Brazil in 2015. In particular, we target the identification of infection hot spots associated with dengue, a mosquitotransmitted disease that affects millions of people in Brazil annually, and billions worldwide. We applied our algorithms to data from 11 large cities in Brazil and found infection hot spots, showing the usefulness of our methods for disease surveillance.
Abstract: Tradicionalmente, na vigilância sanitária, as zonas de alto risco são identificadas apenas com base no endereço de residência ou local de trabalho do doente indivíduos. Isto fornece pouca informação sobre os locais onde as pessoas estão infectadas, a informação verdadeiramente importante para o controlo da doença. O disponibilidade recente de dados espaciais gerados por mídias sociais georreferenciadas postagens oferecem uma oportunidade única: identificar e acompanhar doenças indivíduos, obtemos uma coleção de eventos sequenciais geo-localizados, cada um sequência sendo emitida por um usuário de mídia social. A sequência de posições do mapa fornece implicitamente uma estimativa das trajetórias sociais dos usuários conforme eles flutuam no mapa. As técnicas existentes de mineração de dados para detecção de cluster não aborda essa nova configuração, pois exige um único localização para cada indivíduo em análise. Neste artigo apresentamos dois modelos estocásticos com seus algoritmos associados para explorar este novo tipo de dados. O Modelo de Visita encontra as zonas mais prováveis ​​que uma pessoa doente visita, enquanto o Modelo de Infecção encontra as zonas mais prováveis ​​onde uma pessoa doente pessoa é infectada durante uma visita. Demonstramos a aplicabilidade e eficácia dos nossos modelos propostos, aplicando-os a mais de 100 milhões de tweets com geo-tags do Brasil em 2015. Em particular, visamos o identificação de focos de infecção associados à dengue, doença transmitida por mosquitos que afeta milhões de pessoas no Brasil anualmente, e bilhões em todo o mundo. Aplicamos nossos algoritmos a dados de 11 grandes cidades do Brasil e encontraram focos de infecção, mostrando a utilidade do nossos métodos de vigilância de doenças.
Assunto: Redes Sociais On-line
Mineração de dados (Computação)
Vigilância Eletrônica
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
Tipo de Acesso: Acesso Aberto
URI: http://hdl.handle.net/1843/73821
Data do documento: 2016
metadata.dc.url.externa: https://link.springer.com/chapter/10.1007/978-3-319-46227-1_46
metadata.dc.relation.ispartof: European Conference on Machine Learning and Knowledge Discovery in Databases
Aparece nas coleções:Artigo de Evento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Infection Hot Spot Mining.pdfA.pdf752.57 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.