Zero-inflated mixed Poisson regression models

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Rosangela Helena Loschi
Marcos Oliveira Prates

Resumo

Contudo, o excesso de zeros em dados de contagem é um fator que leva à sobredispersao e, quando a taxa de inflação de zeros é muito elevada, os modelos de mistura de Poisson não são suficientes para adequar a variabilidade, conforme explicam Dean and Nielsen (2007). Então, para contornar esse problema, modelos zero-inflados são facilmente encontrados na literatura, como é o caso dos modelos de regressão Poisson zero-inflado, introduzido por Lambert (1992), binomial negativa zero-inflado, utilizado por Yau et al. (2003), e Poisson generalizada zero-inflado, introduzida por Famoye and Singh (2006). Além disso, dados zero-inflacionados são encontrados em diversas áreas, como biologia [Oliveira et al. (2016)], manufatura e engenharia [Lambert (1992), Li et al. (1999)], agricultura [Ridout et al. (2001)], saúde [Mwalili et al. (2008), Lim et al. (2014)], ciências sociais [Famoye and Singh (2006)], entre outras.Dessa forma, o objetivo deste trabalho é fornecer suporte apropriado para lidar com dados de contagem sobredispersados e o excesso de zeros e, para tal, propõe-se um modelo de regressão geral com base numa classe de distribuições de misturas de Poisson zero-infladas, onde unifica-se modelos já consolidados, como os modelos ZINB e ZIPIG, bem como permite o surgimento de novos modelos zero-inflados. Portanto, está sendo proposto uma classe geral de modelos de regressao de Poisson misturada zero-inflado para lidar, simultaneamente, com a sobredispersão e o excesso de zeros. Logo, em relação aos recursos computacionais, propôs-se obter as estimativas dos parâmetros do modelo por meio do algoritmo EM, que consegue lidar com a estrutura latente existente. Além disso, são fornecidas as expressoes explícitas para obtenção da matriz de informação sendo possível, dessa forma, obter os desvios padrão das estimativas dos parâmetros, o que permite, por exemplo, a construção de intervalos de confiança.Um estudo de simulação foi executado para avaliar o comportamento das estimativas obtidas por meio do algoritmo EM, como por exemplo o comportamento para amostras de tamanho pequeno, bem como também avaliar a matriz de informação estimada. Ademais, para investigar pontos discrepantes e sua possível influência, uma análise de resíduos foi executada, com base na simulação de envelopes. Com o objetivo de aferir a influência global de outliers, está sendo utilizada a distância de Cook generalizada, proposta por Zhu et al. (2001), tendo sido fornecidas as expressões explícitas dessa medida para o modelo proposto, objetivando assim checar a adequabilidade da distribuição assumida para a variável resposta.

Abstract

Assunto

Análise de regressão, Estatística, Algoritmo EM, Estatistica, Poisson, Distribuição de

Palavras-chave

algoritmo EM, modelos de regressao para contagens, sobredispersao, excesso de zeros

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por