Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/46110
Type: | Tese |
Title: | Regression models for correlated count data with applications |
Authors: | Jussiane Nader Gonçalves |
First Advisor: | Wagner Barreto de Souza |
First Co-advisor: | Hernando Ombao |
First Referee: | Gilberto Alvarenga Paula |
Second Referee: | Clarice Garcia Borges Demétrio |
Third Referee: | Rosangela Helena Loschi |
metadata.dc.contributor.referee4: | Bernardo Lanza Queiroz |
metadata.dc.contributor.referee5: | Thiago Rezende dos Santos |
Abstract: | Count data are present in several fields. In particular, in the actuarial community, it is essential to provide a reliable estimate of the number of claim events in an insurance portfolio to establish a fair rate premium. However, current methods for analyzing such data usually assume that these events are independent, although this assumption is often unrealistic and likely to produce misleading results. Besides, count data are commonly affected by the overdispersion phenomenon. Therefore, we have proposed two novel modeling approaches to consider the overdispersion phenomenon and correlation in count data analysis. These models are encouraged according to the nature of the dataset and, mainly, the practitioner’s objectives. Following, we briefly describe the contents of each methodology. Firstly, we introduce a new model to handle overdispersed and correlated clustered counts. To account for correlation within clusters, we propose a Poisson regression model where the observations within the same cluster are driven by the same latent random effect that follows the Birnbaum-Saunders distribution. This novel multivariate count model is called Clustered Poisson Birnbaum-Saunders (CPBS) regression. An Expectation-Maximization (EM) algorithm is developed for parameters estimation. Furthermore, there are sundry practical situations in which paired count variables are correlated, requiring a joint estimation method. Thus, in a second approach, we introduce a flexible class of regression models called Bivariate Mixed Poisson (BMP) models, which settle into an exponential-family-distributed component for the unobserved heterogeneity. This novel class stands for positive and negative correlation, an advantage over some current models. The maximum likelihood method is proposed for parameters inference. For both methodologies, we address simulation studies to evaluate the finite-sample performance of the estimators. Also, we provide diagnostic tools for checking model adequacy. An empirical application concerning the number of inpatient admissions to hospital emergency rooms, from the Medical Expenditure Panel Survey (MEPS), illustrates the usefulness of the CPBS model. Regarding the BMP models, we consider an empirical application about the number of doctor consultations and nonprescribed medications, from the Australian Health Survey (AHS). |
Abstract: | Dados de contagem estão presentes em diversas áreas. Para a comunidade atuarial, em particular, é essencial obter uma estimativa confiável do número eventos de sinistros em um portfólio de seguros, o que permite o estabelecimento de prêmio justo. No entanto, muitos dos métodos existentes assumem que os eventos são independentes, embora essa premissa geralmente não se sustente na prática. Logo, eles estão susceptíveis a resultados enganosos. Além disso, os dados de contagem são, com frequência, sobredispersos. Assim, propõe-se neste trabalho duas novas modelagens que levam em consideração a sobredispersão, bem como a correlação na análise de dados de contagem. O uso desses modelos é encorajado de acordo com a natureza dos dados e, principalmente, os objetivos de modelagem pelo profissional. A seguir, descreve-se brevemente o conteúdo de cada metodologia. Primeiramente, introduz-se um novo modelo de regressão para lidar com a sobredispersão e correlação em dados de contagem agrupados (clusterizados). Para acomodar a correlação intra-clusters, propõe-se um modelo de regressão Poisson onde indivíduos do mesmo cluster são submetidos ao mesmo efeito aleatório latente, o qual assume distribuição Birnbaum-Saunders. Esse novo modelo multivariado será chamado de regressão Clusterizada Poisson Birnbaum-Saunders (CPBS). Para inferência do modelo, propõe-se um algoritmo EM para implementação do método de máxima verossimilhança. Ademais, em situações práticas, é comum as variáveis de contagem serem intrinsecamente correlacionadas, exigindo uma modelagem conjunta. Portanto, a segunda frente de trabalho consiste em uma classe flexível de modelos chamada Poisson Mista Bivariada (BMP), na qual o componente para a heterogeneidade não observada assume distribuição da família exponencial. Essa nova classe permite correlação positiva e negativa, uma vantagem sobre alguns modelos existentes. Propõe-se o método de máxima verossimilhança para a inferência do modelo. Para ambas as metodologias, realizou-se estudos de simulação para avaliar o desempenho dos estimadores em amostras finitas, bem como foram propostas medidas para avaliar a adequação do modelo. Uma ilustração empírica sobre o número de visitas em emergência de hospitais, do Medical Expenditure Panel Survey (MEPS), ilustra a utilidade do modelo CPBS. Para os modelos BMP, considerou-se uma ilustração sobre o número de consultas médicas e de medicações adquiridas sem prescrição médica, do Australian Health Survey (AHS). |
Subject: | Estatística – Teses Correlação (Estatística) – Teses Algoritmo EM – Teses Poisson, Distribuição de – Teses Verossimilhança (Estatistica) – Teses |
language: | eng |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.department: | ICX - DEPARTAMENTO DE ESTATÍSTICA |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Estatística |
Rights: | Acesso Restrito |
URI: | http://hdl.handle.net/1843/46110 |
Issue Date: | 22-Mar-2022 |
metadata.dc.description.embargo: | 22-Mar-2025 |
Appears in Collections: | Teses de Doutorado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tese_Regression Models for Correlated Count Data with Applications.pdf ???org.dspace.app.webui.jsptag.ItemTag.restrictionUntil??? 2025-03-22 | 2.5 MB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.