New extensions of the generalized mixed spatiotemporal modeling with random effect via factor analysis

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Novas extensões da modelagem espaciotemporal mista generalizada com efeito aleatório via análise fatorial

Primeiro orientador

Membros da banca

Marcos Oliveira Prates
Thaís Cristina Oliveira da Fonseca

Resumo

Generalized Linear Mixed Models (GLMM) are used when there is an interest in modeling fixed and random effects in regression with response belonging to the exponential family. In this work, a GLMM with a random effect is modeled via factor analysis (FA) with nonlinear interaction between the factor scores. We consider in the framework a spatiotemporal effect. The spatial dependence is established via CAR model (Conditional Autoregressive model) for the columns of the loadings matrix defined FA part of the model. The temporal dependence is related to the rows of the factor score matrix in an AR(1) model- first-order Autoregressive model. One goal of considering a model with nonlinear interactions between latent factors is to enable capturing complex levels of associations between regions and factors. Another goal is to diversify the types of clusters (groups of regions) established by combinations of effects involving the main factors and the interaction. Identification problems can occur in factor modeling, and here we present some strategies to make the model identifiable. The focus of this work is to model continuous responses, such as those from Normal, Gamma, and Beta distributions. A comprehensive simulation study is developed to verify performance and explore the models. A Monte Carlo scheme with replications is also considered in the analysis. Finally, the Beta model is illustrated in a real application using data (from INEP) about individuals taking the Brazilian national exam ENEM (period 2015−2021) in the State of Minas Gerais in order to relate the linear combination of the scores of the objective tests with other covariates. One of the goals is to find clusters that show spatial and temporal patterns of the scores of individuals present in the study.

Abstract

Modelos Lineares Mistos Generalizados (GLMM) são utilizados quando há interesse em modelar efeitos fixos e aleatórios em uma regressão com variável resposta pertencente à família exponencial. Neste trabalho um GLMM com efeito aleatório é modelado via análise fatorial com interação não linear entre os escores fatoriais. Além disso, consideramos no estudo um efeito espaço-temporal. A dependência espacial é estabelecida através das colunas da matriz de cargas da abordagem fatorial usando a modelagem CAR (modelo Autorregressivo Condicional). A dependência temporal está relacionada às linhas da matriz de escores de fatores em uma estrutura AR(1)- modelo Autorregressivo. Um objetivo de se considerar um modelo com interação não linear entre fatores latentes é possibilitar a captura de níveis complexos de associações entre regiões e fatores. Um segundo objetivo é diversificar os tipos de clusters (grupos de regiões) estabelecidos por combinações de efeitos envolvendo fatores principais e a interação. Problemas de identificação podem ocorrer na modelagem de fatores, e aqui apresentamos algumas estratégias para tornar o modelo identificável. O foco deste trabalho é estabelecer uma proposta de modelagem para variável resposta contínua, como a Normal, Gama e Beta. Um estudo simulado é realizado para explorar a performance dos modelos. Um esquema Monte Carlo com replicações é também usado na análise. Finalmente, o modelo Beta é ilustrado em uma aplicação real usando dados (do INEP) sobre indivíduos que fizeram o Exame Nacional do Ensino Médio (período 2015−2021) no Estado de Minas Gerais de modo a relacionar a combinação linear das notas das provas objetivas com outras covariáveis. Um dos objetivos é encontrar clusters que evidenciam padrões espaciais e temporais das notas dos indivíduos presentes no estudo.

Assunto

Estatística - Teses, Análise de regressão - Teses, Processos gaussianos - Teses, Análise fatorial - Teses

Palavras-chave

Regression, Interaction, MCMC, Gaussian process, CAR model

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por