Challenges in modeling count data: Bayesian models for correction of underreporting bias and estimation of mortality schedules

dc.creatorGuilherme Lopes de Oliveira
dc.date.accessioned2021-08-16T15:12:10Z
dc.date.accessioned2025-09-08T23:49:46Z
dc.date.available2021-08-16T15:12:10Z
dc.date.issued2020-11-03
dc.description.abstractEm diversas áreas do conhecimento como, por exemplo, Epidemiologia e Demografia, dados de contagem são coletados com o intuito de avaliar ou monitorar os riscos associados aos eventos de interesse. No entanto, muitas vezes esses dados não são completamente registrados. Em vez disso, apenas uma fração do verdadeiro total de eventos é observada, caracterizando o fenômeno conhecido por subnotificação, muito comum em estudos epidemiológicos. Se a subnotificação ocorre e não é levada em consideração, as inferências feitas a partir das contagens observadas serão viesadas e, consequentemente, os riscos relacionados aos eventos de interesse serão subestimados. Além da questão da subnotificação, dados de contagem podem apresentar alta esparcidade, como geralmente ocorre em estudos demográficos a respeito dos padrões de mortalidade em populações humanas. Nesta tese, nós abordamos estes problemas desafiadores comumente presentes na análise estatística baseada em dados de contagem. Dentre os modelos propostos, tem-se duas abordagens para a correção do viés de subnotificação, as quais foram publicadas em periódicos relevantes em Estatística, além de uma metodologia alternativa para a estimação e suavização de curvas de mortalidade por idade e sexo na presença de dados esparsos, a qual está em estágio de aprimoramento. Um introdução mais aprofundada sobre os problemas práticos abordados é fornecida no capítulo inicial, o qual também traz uma descrição detalhada das contribuições em cada modelo proposto. Os capítulos sequentes são apresentados no formato de coleção de artigos, os quais apresentam metodologias independentes com discussões individuais dos problemas abordados. Em todos os casos, o processo de inferência é feito sob o paradigma Bayesiano. Algumas abordagens disponíveis na literatura são discutidas e, em certos casos, utilizadas para comparação com os modelos propostos. Dados simulados e conjuntos de dados reais são utilizados para explorar e ilustrar as principais características dos modelos. O capítulo final traz um resumo compacto dos métodos e resultados obtidos nos estudos desenvolvidos ao longo da tese, destacando alguns pontos interessantes para estudos futuros.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/37509
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectEstatística – Teses.
dc.subjectMétodo de Monte Carlo – Teses.
dc.subjectBioestatística – Teses.
dc.subjectTeoria bayesiana de decisão estatística – Teses.
dc.subjectPoisson, Distribuição de – Teses.
dc.subjectRecém-nascidos – Mortalidade – Teses
dc.subject.otherBayesian inference
dc.subject.otherCensored Poisson model
dc.subject.otherCompound Poisson model
dc.subject.otherData augmentation
dc.subject.otherMarkov chain Monte Carlo methods
dc.subject.otherModel identifiability
dc.subject.otherMortality schedules
dc.subject.otherNeonatal mortality
dc.subject.othertuberculosis incidence
dc.subject.otherUnderreporting
dc.titleChallenges in modeling count data: Bayesian models for correction of underreporting bias and estimation of mortality schedules
dc.title.alternativeDesafios na modelagem de dados de contagem: modelos Bayesianos para correção de viés de subnotificação e estimação de curvas de mortalidade
dc.title.alternativeDesafíos en el modelado de datos de recuento: modelos Bayesianos para la corrección del sesgo de subregistro y la estimación de curvas de mortalidad
dc.title.alternativeDéfis de la modélisation des données de comptage: modèles Bayésiens pour la correction du biais de sous-déclaration et l'estimation des courbes de mortalité
dc.typeTese de doutorado
local.contributor.advisor-co1Renato Martins Assunção
local.contributor.advisor1Rosangela Helena Loschi
local.contributor.advisor1Latteshttp://lattes.cnpq.br/8443300958745785
local.contributor.referee1Flávio Bambirra Gonçalves
local.contributor.referee1Leonardo Soares Bastos
local.contributor.referee1Thais Cristina Oliveira da Fonseca
local.contributor.referee1Wagner Barreto de Souza
local.creator.Latteshttp://lattes.cnpq.br/2909498413150072
local.description.resumoIn several fields, such as epidemiology and demography, count data is collected in order to assess or to monitor the risks associated with the events of interest. However, in many situations only a fraction of the true total of events is observed, characterizing the phenomenon known as underreporting, which is very common in epidemiological studies. If the underreporting occurs and it is not accounted for, the inference made from the observed counts will be biased and, consequently, the risks related to the events of interest will be underestimated. In addition to the issue of underreporting, in some studies the observed counts may be highly sparse, as usually occurs in the analysis of mortality patterns in demographic studies. In this dissertation, we address these challenging problems commonly faced when analyzing count data. Among the proposed models, there are two approaches for the correction of underreporting bias, which have been published in relevant journals in statistics, as well as an alternative methodology for estimating and smoothing mortality curves by age and sex in the presence of sparse data, which is been improved. A broader introduction to the practical problems addressed in the dissertation is provided in the opening chapter, which also provides a detailed description of the contributions related to each proposed model. The subsequent chapters corresponds to a collection of papers, which present independent methodologies with individual discussions of the problems addressed. In all cases, the inference process is made under the Bayesian paradigm. Some approaches available in the statistical literature are discussed and, in some cases, used for comparison with the proposed models. Simulated data as well as real datasets are used to explore and to illustrate the main features of the models. The final chapter summarizes the methods and results obtained throughout the dissertation, highlighting some interesting points for future research.
local.identifier.orcidhttps://orcid.org/0000-0003-3220-6356
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE ESTATÍSTICA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Estatística

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
_Tese_GuilhermeOliveira_FinalVersionBiblioteca.pdf
Tamanho:
34.27 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: