Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/56441
Tipo: Artigo de Periódico
Título: SLFM: an R package to evaluate coherent patterns in microarray data via factor analysis
Título(s) alternativo(s): SLFM: um pacote R para avaliar padrões coerentes em dados de microarray via análise fatorial
Autor(es): João Daniel Nunes Duarte
Vinícius Diniz Mayrink
Resumo: The development of simulation-based methods, such as Markov chain Monte Carlo (MCMC), has contributed to an increased interest in the Bayesian framework as an alternative to deal with factor models. Many studies have used Bayesian factor analysis to explore gene expression data. We are particularly interested in the application of a sparse latent factor model (SLFM) based on sparsity priors (mixtures) to assess the significance of factors. The SLFM measures how strong the observed coherent expression pattern is in the data, which is an important source of information to evaluate gene activity. In the literature, this type of model has shown better results than other approaches intended for identification of patterns and metagene groups related to the underlying biology. However, a full Bayesian factor model relying on MCMC algorithms has an expensive computational cost, which makes it unattractive for general users. In this paper, we present the package slfm which uses C++ implementation via Rcpp to improve the computational performance of the SLFM within the widely used statistical tool R. We investigate real and simulated microarray data related to breast cancer.
Abstract: O desenvolvimento de métodos baseados em simulação, como a cadeia de Markov Monte Carlo (MCMC), tem contribuído para um aumento do interesse no framework Bayesiano como uma alternativa para lidar com modelos fatoriais. Muitos estudos usaram análise fatorial bayesiana para explorar dados de expressão gênica. Estamos particularmente interessados ​​na aplicação de um modelo de fator latente esparso (SLFM) baseado em prioris de esparsidade (misturas) para avaliar a significância dos fatores. O SLFM mede a força do padrão de expressão coerente observado nos dados, o que é uma importante fonte de informação para avaliar a atividade do gene. Na literatura, esse tipo de modelo tem mostrado melhores resultados do que outras abordagens destinadas à identificação de padrões e grupos metagênicos relacionados à biologia subjacente. No entanto, um modelo de fator bayesiano completo baseado em algoritmos MCMC tem um custo computacional caro, o que o torna pouco atraente para usuários em geral. Neste artigo, apresentamos o pacote slfm que usa implementação C++ via Rcpp para melhorar o desempenho computacional do SLFM dentro da ferramenta estatística amplamente utilizada R. Investigamos dados reais e simulados de microarray relacionados ao câncer de mama.
Assunto: Estatística
Probabilidades
Teoria bayesiana de decisão estatistica
C++ (Linguagem de programação de computador)
R (Linguagem de programação de computador)
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: ICX - DEPARTAMENTO DE ESTATÍSTICA
Tipo de Acesso: Acesso Aberto
Identificador DOI: https://doi.org/10.18637/jss.v090.i09
URI: http://hdl.handle.net/1843/56441
Data do documento: 31-Jul-2019
metadata.dc.url.externa: https://www.jstatsoft.org/article/view/v090i09
metadata.dc.relation.ispartof: Journal of Statistical Software
Aparece nas coleções:Artigo de Periódico

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
SLFM an R package to evaluate coherent patterns in microarray data via factor analysis.pdf937.7 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.