Challenges in modeling count data: Bayesian models for correction of underreporting bias and estimation of mortality schedules

Guilherme Lopes de Oliveira

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/37509

Type:	Tese
Title:	Challenges in modeling count data: Bayesian models for correction of underreporting bias and estimation of mortality schedules
Other Titles:	Desafios na modelagem de dados de contagem: modelos Bayesianos para correção de viés de subnotificação e estimação de curvas de mortalidade Desafíos en el modelado de datos de recuento: modelos Bayesianos para la corrección del sesgo de subregistro y la estimación de curvas de mortalidad Défis de la modélisation des données de comptage: modèles Bayésiens pour la correction du biais de sous-déclaration et l'estimation des courbes de mortalité
Authors:	Guilherme Lopes de Oliveira
First Advisor:	Rosangela Helena Loschi
First Co-advisor:	Renato Martins Assunção
First Referee:	Flávio Bambirra Gonçalves
Second Referee:	Leonardo Soares Bastos
Third Referee:	Thais Cristina Oliveira da Fonseca
metadata.dc.contributor.referee4:	Wagner Barreto de Souza
Abstract:	In several fields, such as epidemiology and demography, count data is collected in order to assess or to monitor the risks associated with the events of interest. However, in many situations only a fraction of the true total of events is observed, characterizing the phenomenon known as underreporting, which is very common in epidemiological studies. If the underreporting occurs and it is not accounted for, the inference made from the observed counts will be biased and, consequently, the risks related to the events of interest will be underestimated. In addition to the issue of underreporting, in some studies the observed counts may be highly sparse, as usually occurs in the analysis of mortality patterns in demographic studies. In this dissertation, we address these challenging problems commonly faced when analyzing count data. Among the proposed models, there are two approaches for the correction of underreporting bias, which have been published in relevant journals in statistics, as well as an alternative methodology for estimating and smoothing mortality curves by age and sex in the presence of sparse data, which is been improved. A broader introduction to the practical problems addressed in the dissertation is provided in the opening chapter, which also provides a detailed description of the contributions related to each proposed model. The subsequent chapters corresponds to a collection of papers, which present independent methodologies with individual discussions of the problems addressed. In all cases, the inference process is made under the Bayesian paradigm. Some approaches available in the statistical literature are discussed and, in some cases, used for comparison with the proposed models. Simulated data as well as real datasets are used to explore and to illustrate the main features of the models. The final chapter summarizes the methods and results obtained throughout the dissertation, highlighting some interesting points for future research.
Abstract:	Em diversas áreas do conhecimento como, por exemplo, Epidemiologia e Demografia, dados de contagem são coletados com o intuito de avaliar ou monitorar os riscos associados aos eventos de interesse. No entanto, muitas vezes esses dados não são completamente registrados. Em vez disso, apenas uma fração do verdadeiro total de eventos é observada, caracterizando o fenômeno conhecido por subnotificação, muito comum em estudos epidemiológicos. Se a subnotificação ocorre e não é levada em consideração, as inferências feitas a partir das contagens observadas serão viesadas e, consequentemente, os riscos relacionados aos eventos de interesse serão subestimados. Além da questão da subnotificação, dados de contagem podem apresentar alta esparcidade, como geralmente ocorre em estudos demográficos a respeito dos padrões de mortalidade em populações humanas. Nesta tese, nós abordamos estes problemas desafiadores comumente presentes na análise estatística baseada em dados de contagem. Dentre os modelos propostos, tem-se duas abordagens para a correção do viés de subnotificação, as quais foram publicadas em periódicos relevantes em Estatística, além de uma metodologia alternativa para a estimação e suavização de curvas de mortalidade por idade e sexo na presença de dados esparsos, a qual está em estágio de aprimoramento. Um introdução mais aprofundada sobre os problemas práticos abordados é fornecida no capítulo inicial, o qual também traz uma descrição detalhada das contribuições em cada modelo proposto. Os capítulos sequentes são apresentados no formato de coleção de artigos, os quais apresentam metodologias independentes com discussões individuais dos problemas abordados. Em todos os casos, o processo de inferência é feito sob o paradigma Bayesiano. Algumas abordagens disponíveis na literatura são discutidas e, em certos casos, utilizadas para comparação com os modelos propostos. Dados simulados e conjuntos de dados reais são utilizados para explorar e ilustrar as principais características dos modelos. O capítulo final traz um resumo compacto dos métodos e resultados obtidos nos estudos desenvolvidos ao longo da tese, destacando alguns pontos interessantes para estudos futuros.
Subject:	Estatística – Teses. Método de Monte Carlo – Teses. Bioestatística – Teses. Teoria bayesiana de decisão estatística – Teses. Poisson, Distribuição de – Teses. Recém-nascidos – Mortalidade – Teses
language:	eng
metadata.dc.publisher.country:	Brasil
Publisher:	Universidade Federal de Minas Gerais
Publisher Initials:	UFMG
metadata.dc.publisher.department:	ICX - DEPARTAMENTO DE ESTATÍSTICA
metadata.dc.publisher.program:	Programa de Pós-Graduação em Estatística
Rights:	Acesso Aberto
URI:	http://hdl.handle.net/1843/37509
Issue Date:	3-Nov-2020
Appears in Collections:	Teses de Doutorado

Files in This Item:

File	Description	Size	Format
_Tese_GuilhermeOliveira_FinalVersionBiblioteca.pdf		35.1 MB	Adobe PDF	View/Open

Show full item record