Counting process and derivations: an application for environmental and epidemiological data
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Pascal Thierry Bondon
Márton Ispány
Josu Arteche
Glaura da Conceicao Franco
Márton Ispány
Josu Arteche
Glaura da Conceicao Franco
Resumo
The generalized linear autoregressive moving average (GLARMA) model has been used in
epidemiological studies to evaluate the impact of air pollutants in the atmosphere on human
health. This impact is commonly quantified through the relative risk (RR) measure. Due to
the nature of the data, care is required when the GLARMA model is applied to environmental
variables. First, the inference for the RR is usually based on the asymptotic properties of the
maximum likelihood estimator, which can be problematic for small sample sizes. Secondly, the
air pollutants can present high peaks, or abrupt observations, that can be identified as additive
outliers and typically cause consequences on the statistical properties of sample functions, such
as mean, variance, auto-correlation, and partial autocorrelation. In addition, the atmosphere
is composed of a mixture of gases, including air pollutants, which are time series presenting
complex properties. These contaminants also display the multicollinearity property, which
can inflate the variance of the estimates and can cause a significant bias if ignored. This
thesis proposes methodologies for the complex system formed by environmental data using the
GLARMA model. Different bootstrap methods are studied to calculate confidence intervals for
the RR without any assumption about the data distribution. Besides, a robust approach for the
GLARMA model is proposed to deal with outlying observations. Numerical studies are realized
to evaluate the performance of the proposed methodologies considering distinct scenarios. Real
data analyses are performed considering atmospheric and epidemiological variables in the cities
of Belo Horizonte, MG, and Vitória, ES, Brazil.
Abstract
O modelo linear autorregressivo média móvel autorregressiva (GLARMA) tem sido utilizado em
estudos epidemiológicos para avaliar o impacto de poluentes atmosféricos na saúde. Esse impacto
é comumente quantificado por meio da medida de risco relativo (RR). Devido à natureza dos
dados, é necessário atenção ao aplicar o modelo GLARMA em variáveis ambientais. Primeiramente, em geral, a inferência para o RR é baseada nas propriedades assintóticas do estimador de
máxima verossimilhança, o que pode ser problemático para amostras pequenas. Em segundo
lugar, os poluentes atmosféricos podem apresentar picos elevados, ou observações abruptas, que
podem ser identificados como aditivos outliers e normalmente impactam as propriedades estatísticas das funções amostrais, como média, variância, autocorrelação e autocorrelação parcial.
Além disso, a atmosfera é composta por uma mistura de gases, incluindo poluentes atmosféricos,
que são séries temporais e apresentam propriedades complexas. Esses contaminantes também
exibem a propriedade de multicolinearidade, que pode inflar a variância das estimativas e causar
um viés significativo se ignorado. Esta tese propõe metodologias para o complexo sistema
formado por variáveis ambientais utilizando o modelo GLARMA. Diferentes métodos bootstrap
são estudados a fim de calcular intervalos de confiança para o RR sem qualquer suposição sobre
a distribuição dos dados. Além disso, uma abordagem robusta para o modelo GLARMA é
proposta para lidar com observações abruptas. Estudos numéricos são realizados para avaliar
o desempenho das metodologias propostas considerando cenários distintos. Análises de dados
reais são realizadas considerando variáveis atmosféricas e epidemiológicas nas cidades de Belo
Horizonte, MG, e Vitória, ES, Brasil.
Assunto
Estatística – Teses, Séries temporais de contagem – Teses, Modelo GLARMA – Teses, M-estimadores – Teses, Bootstrap (Estatística) – Teses, Doenças respiratórias – Epidemiologia – Teses
Palavras-chave
Count time series, GLARMA, Bootstrap, M-estimators, Additive outliers, Respiratory diseases, Air pollution