Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-A89QGT
Type: Dissertação de Mestrado
Title: Influência de funções de covariâncias sobre o modelo fatorial latente esparso com interações
Authors: Erick da Conceição Amorim
First Advisor: Vinicius Diniz Mayrink
First Referee: Marcos Oliveira Prates
Second Referee: Michelle Ferreira Miranda
Abstract: A analise fatorial é uma ferramenta estatistica bastante utilizada para identificar um numero reduzido de fatores que explicam o relacionamento entre diversas variaveis em um conjunto de dados. Neste trabalho, exploramos essa tecnica com uma abordagem Bayesianano contexto de analise de expressãoo de genes. Inicialmente, estudamos o modelo fatorial latente simples e verificamos seu ajuste a um conjunto de dados simulados. Em seguida, analisamos o modelo fatorial latente com interacões juntamente com distribuições a priori esparsas para testar se os fatores, definidos para regioes com alteração do numero de copias, estariam afetando genes localizados em outras regiões do genoma. A interação não linear foi introduzida no modelo por meio de um Processo Gaussiano que apresenta em sua estrutura uma função de covariâncias que seria o foco principal neste trabalho. O comportamento e desempenho do modelo fatorial latente esparso com interações sera avaliado a partir de simulações utilizando diferentes funções s de covariâncias: exponencial quadratica, como abordado em Mayrink e Lucas (2013), exponencial potência e funções da classe Matern que se distinguem em termos da escolha dos parâmetros suavizadores. Uma analise de sensibilidade e realizada considerando estas configurações, os resultados indicam que algumas especificações fornecem melhores ajustes que outras. Para analizar, uma aplicação a dados reais é mostrada considerando a configuração de covariâncias com indicação de melhores resultados no caso simulado.
Abstract: The factor analysis is an statistical tool widely used to identify a reduced number of factors supposed to explain the relationship between many variables in a data set. In this work, we explore this technique using the Bayesian approach in context of the analysis of gene expression. Initially, we study the simple latent factor model and verify its performance to t simulated data. Next, we evaluate the latent factor model withinteractions assuming sparse prior distributions to test whether the factors, dened for regions with copy number alterations, would aect genes located in other regions of the genome. The interaction was introduced in the model through a Gaussian process having in its structure a covariance function which is a key element in our study. The behavior and performance of the sparse latent factor model with interactions was evaluated through simulations using dierent covariances functions: quadratic exponential, as discussed inMayrink and Lucas (2013), power exponential and some functions options in the Matern class that dier in terms of the choice of the smoothing parameters. A sensitivity analysis is made considering these settings and the results indicate that some specications providea better model t than others. Finally, an application involving
Subject: Series hipergeometricas
Estatistica
Inferencia (Logica)
Teoria bayesiana de decisão estatistica
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUBD-A89QGT
Issue Date: 26-Feb-2016
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
principal.pdf5.76 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.