Influência de funções de covariâncias sobre o modelo fatorial latente esparso com interações

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Marcos Oliveira Prates
Michelle Ferreira Miranda

Resumo

A analise fatorial é uma ferramenta estatistica bastante utilizada para identificar um numero reduzido de fatores que explicam o relacionamento entre diversas variaveis em um conjunto de dados. Neste trabalho, exploramos essa tecnica com uma abordagem Bayesianano contexto de analise de expressãoo de genes. Inicialmente, estudamos o modelo fatorial latente simples e verificamos seu ajuste a um conjunto de dados simulados. Em seguida, analisamos o modelo fatorial latente com interacões juntamente com distribuições a priori esparsas para testar se os fatores, definidos para regioes com alteração do numero de copias, estariam afetando genes localizados em outras regiões do genoma. A interação não linear foi introduzida no modelo por meio de um Processo Gaussiano que apresenta em sua estrutura uma função de covariâncias que seria o foco principal neste trabalho. O comportamento e desempenho do modelo fatorial latente esparso com interações sera avaliado a partir de simulações utilizando diferentes funções s de covariâncias: exponencial quadratica, como abordado em Mayrink e Lucas (2013), exponencial potência e funções da classe Matern que se distinguem em termos da escolha dos parâmetros suavizadores. Uma analise de sensibilidade e realizada considerando estas configurações, os resultados indicam que algumas especificações fornecem melhores ajustes que outras. Para analizar, uma aplicação a dados reais é mostrada considerando a configuração de covariâncias com indicação de melhores resultados no caso simulado.

Abstract

The factor analysis is an statistical tool widely used to identify a reduced number of factors supposed to explain the relationship between many variables in a data set. In this work, we explore this technique using the Bayesian approach in context of the analysis of gene expression. Initially, we study the simple latent factor model and verify its performance to t simulated data. Next, we evaluate the latent factor model withinteractions assuming sparse prior distributions to test whether the factors, dened for regions with copy number alterations, would aect genes located in other regions of the genome. The interaction was introduced in the model through a Gaussian process having in its structure a covariance function which is a key element in our study. The behavior and performance of the sparse latent factor model with interactions was evaluated through simulations using dierent covariances functions: quadratic exponential, as discussed inMayrink and Lucas (2013), power exponential and some functions options in the Matern class that dier in terms of the choice of the smoothing parameters. A sensitivity analysis is made considering these settings and the results indicate that some specications providea better model t than others. Finally, an application involving

Assunto

Series hipergeometricas, Estatistica, Inferencia (Logica), Teoria bayesiana de decisão estatistica

Palavras-chave

Priori esparsa, Genoma, Inferência bayesiana, Processo gaussiano

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por