Enhancement of epidemiological models for dengue fever based on twitter data
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de evento
Título alternativo
Aprimoramento de modelos epidemiológicos para Dengue com base em dados do Twitter
Primeiro orientador
Membros da banca
Resumo
Epidemiological early warning systems for dengue fever rely on up-to-date epidemiological data to forecast future incidence. However, epidemiological data typically requires time to be available, due to the application of time-consuming laboratorial tests. This implies that epidemiological models need to issue predictions with larger antecedence, making their task even more difficult. On the other hand, online platforms, such as Twitter or Google, allow us to obtain samples of users' interaction in near real-time and can be used as sensors to monitor current incidence. In this work, we propose a framework to exploit online data sources to mitigate the lack of up-to-date epidemiological data by obtaining estimates of current incidence, which are then explored by traditional epidemiological models. We show that the proposed framework obtains more accurate predictions than alternative approaches, with statistically better results for delays greater or equal to 4 weeks.
Abstract
Os sistemas epidemiológicos de alerta precoce para a dengue baseiam-se em dados epidemiológicos atualizados para prever a incidência futura. No entanto, os dados epidemiológicos normalmente requerem tempo para estarem disponíveis, devido à aplicação de testes laboratoriais demorados. Isto implica que os modelos epidemiológicos necessitam emitir previsões com maior antecedência, tornando a sua tarefa ainda mais difícil. Por outro lado, plataformas online, como o Twitter ou o Google, permitem-nos obter amostras da interação dos utilizadores quase em tempo real e podem ser utilizadas como sensores para monitorizar a incidência atual. Neste trabalho, propomos uma estrutura para explorar fontes de dados online para mitigar a falta de dados epidemiológicos atualizados, obtendo estimativas da incidência atual, que são então exploradas por modelos epidemiológicos tradicionais. Mostramos que a estrutura proposta obtém previsões mais precisas do que abordagens alternativas, com resultados estatisticamente melhores para atrasos maiores ou iguais a 4 semanas.
Assunto
Redes Sociais On-line, Compressão de dados (Computação), Mineração de dados (Computação), Epidemiologia
Palavras-chave
Social networking, Web sites, Compression of data (Computer science), Mining, Data, Epidemiology
Citação
Departamento
Curso
Endereço externo
https://arxiv.org/abs/1705.07879