Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/46110
Tipo: Tese
Título: Regression models for correlated count data with applications
Autor(es): Jussiane Nader Gonçalves
Primeiro Orientador: Wagner Barreto de Souza
Primeiro Coorientador: Hernando Ombao
Primeiro membro da banca : Gilberto Alvarenga Paula
Segundo membro da banca: Clarice Garcia Borges Demétrio
Terceiro membro da banca: Rosangela Helena Loschi
Quarto membro da banca: Bernardo Lanza Queiroz
Quinto membro da banca: Thiago Rezende dos Santos
Resumo: Count data are present in several fields. In particular, in the actuarial community, it is essential to provide a reliable estimate of the number of claim events in an insurance portfolio to establish a fair rate premium. However, current methods for analyzing such data usually assume that these events are independent, although this assumption is often unrealistic and likely to produce misleading results. Besides, count data are commonly affected by the overdispersion phenomenon. Therefore, we have proposed two novel modeling approaches to consider the overdispersion phenomenon and correlation in count data analysis. These models are encouraged according to the nature of the dataset and, mainly, the practitioner’s objectives. Following, we briefly describe the contents of each methodology. Firstly, we introduce a new model to handle overdispersed and correlated clustered counts. To account for correlation within clusters, we propose a Poisson regression model where the observations within the same cluster are driven by the same latent random effect that follows the Birnbaum-Saunders distribution. This novel multivariate count model is called Clustered Poisson Birnbaum-Saunders (CPBS) regression. An Expectation-Maximization (EM) algorithm is developed for parameters estimation. Furthermore, there are sundry practical situations in which paired count variables are correlated, requiring a joint estimation method. Thus, in a second approach, we introduce a flexible class of regression models called Bivariate Mixed Poisson (BMP) models, which settle into an exponential-family-distributed component for the unobserved heterogeneity. This novel class stands for positive and negative correlation, an advantage over some current models. The maximum likelihood method is proposed for parameters inference. For both methodologies, we address simulation studies to evaluate the finite-sample performance of the estimators. Also, we provide diagnostic tools for checking model adequacy. An empirical application concerning the number of inpatient admissions to hospital emergency rooms, from the Medical Expenditure Panel Survey (MEPS), illustrates the usefulness of the CPBS model. Regarding the BMP models, we consider an empirical application about the number of doctor consultations and nonprescribed medications, from the Australian Health Survey (AHS).
Abstract: Dados de contagem estão presentes em diversas áreas. Para a comunidade atuarial, em particular, é essencial obter uma estimativa confiável do número eventos de sinistros em um portfólio de seguros, o que permite o estabelecimento de prêmio justo. No entanto, muitos dos métodos existentes assumem que os eventos são independentes, embora essa premissa geralmente não se sustente na prática. Logo, eles estão susceptíveis a resultados enganosos. Além disso, os dados de contagem são, com frequência, sobredispersos. Assim, propõe-se neste trabalho duas novas modelagens que levam em consideração a sobredispersão, bem como a correlação na análise de dados de contagem. O uso desses modelos é encorajado de acordo com a natureza dos dados e, principalmente, os objetivos de modelagem pelo profissional. A seguir, descreve-se brevemente o conteúdo de cada metodologia. Primeiramente, introduz-se um novo modelo de regressão para lidar com a sobredispersão e correlação em dados de contagem agrupados (clusterizados). Para acomodar a correlação intra-clusters, propõe-se um modelo de regressão Poisson onde indivíduos do mesmo cluster são submetidos ao mesmo efeito aleatório latente, o qual assume distribuição Birnbaum-Saunders. Esse novo modelo multivariado será chamado de regressão Clusterizada Poisson Birnbaum-Saunders (CPBS). Para inferência do modelo, propõe-se um algoritmo EM para implementação do método de máxima verossimilhança. Ademais, em situações práticas, é comum as variáveis de contagem serem intrinsecamente correlacionadas, exigindo uma modelagem conjunta. Portanto, a segunda frente de trabalho consiste em uma classe flexível de modelos chamada Poisson Mista Bivariada (BMP), na qual o componente para a heterogeneidade não observada assume distribuição da família exponencial. Essa nova classe permite correlação positiva e negativa, uma vantagem sobre alguns modelos existentes. Propõe-se o método de máxima verossimilhança para a inferência do modelo. Para ambas as metodologias, realizou-se estudos de simulação para avaliar o desempenho dos estimadores em amostras finitas, bem como foram propostas medidas para avaliar a adequação do modelo. Uma ilustração empírica sobre o número de visitas em emergência de hospitais, do Medical Expenditure Panel Survey (MEPS), ilustra a utilidade do modelo CPBS. Para os modelos BMP, considerou-se uma ilustração sobre o número de consultas médicas e de medicações adquiridas sem prescrição médica, do Australian Health Survey (AHS).
Assunto: Estatística – Teses
Correlação (Estatística) – Teses
Algoritmo EM – Teses
Poisson, Distribuição de – Teses
Verossimilhança (Estatistica) – Teses
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: ICX - DEPARTAMENTO DE ESTATÍSTICA
Curso: Programa de Pós-Graduação em Estatística
Tipo de Acesso: Acesso Restrito
URI: http://hdl.handle.net/1843/46110
Data do documento: 22-Mar-2022
Término do Embargo: 22-Mar-2025
Aparece nas coleções:Teses de Doutorado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Tese_Regression Models for Correlated Count Data with Applications.pdf
  Até 2025-03-22
2.5 MBAdobe PDFVisualizar/Abrir    Solictar uma cópia


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.