Zero-inflated mixed Poisson regression models
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Rosangela Helena Loschi
Marcos Oliveira Prates
Marcos Oliveira Prates
Resumo
Contudo, o excesso de zeros em dados de contagem é um fator que leva à sobredispersao e, quando a taxa de inflação de zeros é muito elevada, os modelos de mistura de Poisson não são suficientes para adequar a variabilidade, conforme explicam Dean and Nielsen (2007). Então, para contornar esse problema, modelos zero-inflados são facilmente encontrados na literatura, como é o caso dos modelos de regressão Poisson zero-inflado, introduzido por Lambert (1992), binomial negativa zero-inflado, utilizado por Yau et al. (2003), e Poisson generalizada zero-inflado, introduzida por Famoye and Singh (2006). Além disso, dados zero-inflacionados são encontrados em diversas áreas, como biologia [Oliveira et al. (2016)], manufatura e engenharia [Lambert (1992), Li et al. (1999)], agricultura [Ridout et al. (2001)], saúde [Mwalili et al. (2008), Lim et al. (2014)], ciências sociais [Famoye and Singh (2006)], entre outras.Dessa forma, o objetivo deste trabalho é fornecer suporte apropriado para lidar com dados de contagem sobredispersados e o excesso de zeros e, para tal, propõe-se um modelo de regressão geral com base numa classe de distribuições de misturas de Poisson zero-infladas, onde unifica-se modelos já consolidados, como os modelos ZINB e ZIPIG, bem como permite o surgimento de novos modelos zero-inflados. Portanto, está sendo proposto uma classe geral de modelos de regressao de Poisson misturada zero-inflado para lidar, simultaneamente, com a sobredispersão e o excesso de zeros. Logo, em relação aos recursos computacionais, propôs-se obter as estimativas dos parâmetros do modelo por meio do algoritmo EM, que consegue lidar com a estrutura latente existente. Além disso, são fornecidas as expressoes explícitas para obtenção da matriz de informação sendo possível, dessa forma, obter os desvios padrão das estimativas dos parâmetros, o que permite, por exemplo, a construção de intervalos de confiança.Um estudo de simulação foi executado para avaliar o comportamento das estimativas obtidas por meio do algoritmo EM, como por exemplo o comportamento para amostras de tamanho pequeno, bem como também avaliar a matriz de informação estimada. Ademais, para investigar pontos discrepantes e sua possível influência, uma análise de resíduos foi executada, com base na simulação de envelopes. Com o objetivo de aferir a influência global de outliers, está sendo utilizada a distância de Cook generalizada, proposta por Zhu et al. (2001), tendo sido fornecidas as expressões explícitas dessa medida para o modelo proposto, objetivando assim checar a adequabilidade da distribuição assumida para a variável resposta.
Abstract
Assunto
Análise de regressão, Estatística, Algoritmo EM, Estatistica, Poisson, Distribuição de
Palavras-chave
algoritmo EM, modelos de regressao para contagens, sobredispersao, excesso de zeros