Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/1843/79700
Tipo: | Dissertação |
Título: | New extensions of the generalized mixed spatiotemporal modeling with random effect via factor analysis |
Título(s) alternativo(s): | Novas extensões da modelagem espaciotemporal mista generalizada com efeito aleatório via análise fatorial |
Autor(es): | Natália Caroline Costa de Oliveira |
Primeiro Orientador: | Vinícius Diniz Mayrink |
Primeiro membro da banca : | Marcos Oliveira Prates |
Segundo membro da banca: | Thaís Cristina Oliveira da Fonseca |
Resumo: | Generalized Linear Mixed Models (GLMM) are used when there is an interest in modeling fixed and random effects in regression with response belonging to the exponential family. In this work, a GLMM with a random effect is modeled via factor analysis (FA) with nonlinear interaction between the factor scores. We consider in the framework a spatiotemporal effect. The spatial dependence is established via CAR model (Conditional Autoregressive model) for the columns of the loadings matrix defined FA part of the model. The temporal dependence is related to the rows of the factor score matrix in an AR(1) model- first-order Autoregressive model. One goal of considering a model with nonlinear interactions between latent factors is to enable capturing complex levels of associations between regions and factors. Another goal is to diversify the types of clusters (groups of regions) established by combinations of effects involving the main factors and the interaction. Identification problems can occur in factor modeling, and here we present some strategies to make the model identifiable. The focus of this work is to model continuous responses, such as those from Normal, Gamma, and Beta distributions. A comprehensive simulation study is developed to verify performance and explore the models. A Monte Carlo scheme with replications is also considered in the analysis. Finally, the Beta model is illustrated in a real application using data (from INEP) about individuals taking the Brazilian national exam ENEM (period 2015−2021) in the State of Minas Gerais in order to relate the linear combination of the scores of the objective tests with other covariates. One of the goals is to find clusters that show spatial and temporal patterns of the scores of individuals present in the study. |
Abstract: | Modelos Lineares Mistos Generalizados (GLMM) são utilizados quando há interesse em modelar efeitos fixos e aleatórios em uma regressão com variável resposta pertencente à família exponencial. Neste trabalho um GLMM com efeito aleatório é modelado via análise fatorial com interação não linear entre os escores fatoriais. Além disso, consideramos no estudo um efeito espaço-temporal. A dependência espacial é estabelecida através das colunas da matriz de cargas da abordagem fatorial usando a modelagem CAR (modelo Autorregressivo Condicional). A dependência temporal está relacionada às linhas da matriz de escores de fatores em uma estrutura AR(1)- modelo Autorregressivo. Um objetivo de se considerar um modelo com interação não linear entre fatores latentes é possibilitar a captura de níveis complexos de associações entre regiões e fatores. Um segundo objetivo é diversificar os tipos de clusters (grupos de regiões) estabelecidos por combinações de efeitos envolvendo fatores principais e a interação. Problemas de identificação podem ocorrer na modelagem de fatores, e aqui apresentamos algumas estratégias para tornar o modelo identificável. O foco deste trabalho é estabelecer uma proposta de modelagem para variável resposta contínua, como a Normal, Gama e Beta. Um estudo simulado é realizado para explorar a performance dos modelos. Um esquema Monte Carlo com replicações é também usado na análise. Finalmente, o modelo Beta é ilustrado em uma aplicação real usando dados (do INEP) sobre indivíduos que fizeram o Exame Nacional do Ensino Médio (período 2015−2021) no Estado de Minas Gerais de modo a relacionar a combinação linear das notas das provas objetivas com outras covariáveis. Um dos objetivos é encontrar clusters que evidenciam padrões espaciais e temporais das notas dos indivíduos presentes no estudo. |
Assunto: | Estatística - Teses Análise de regressão - Teses Processos gaussianos - Teses Análise fatorial - Teses |
Idioma: | eng |
País: | Brasil |
Editor: | Universidade Federal de Minas Gerais |
Sigla da Instituição: | UFMG |
Departamento: | ICX - DEPARTAMENTO DE ESTATÍSTICA |
Curso: | Programa de Pós-Graduação em Estatística |
Tipo de Acesso: | Acesso Aberto |
URI: | http://hdl.handle.net/1843/79700 |
Data do documento: | 28-Fev-2023 |
Aparece nas coleções: | Dissertações de Mestrado |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MasterDissertation_NataliaOliveira.pdf | 3.93 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.