Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/56441
Type: | Artigo de Periódico |
Title: | SLFM: an R package to evaluate coherent patterns in microarray data via factor analysis |
Other Titles: | SLFM: um pacote R para avaliar padrões coerentes em dados de microarray via análise fatorial |
Authors: | João Daniel Nunes Duarte Vinícius Diniz Mayrink |
Abstract: | The development of simulation-based methods, such as Markov chain Monte Carlo (MCMC), has contributed to an increased interest in the Bayesian framework as an alternative to deal with factor models. Many studies have used Bayesian factor analysis to explore gene expression data. We are particularly interested in the application of a sparse latent factor model (SLFM) based on sparsity priors (mixtures) to assess the significance of factors. The SLFM measures how strong the observed coherent expression pattern is in the data, which is an important source of information to evaluate gene activity. In the literature, this type of model has shown better results than other approaches intended for identification of patterns and metagene groups related to the underlying biology. However, a full Bayesian factor model relying on MCMC algorithms has an expensive computational cost, which makes it unattractive for general users. In this paper, we present the package slfm which uses C++ implementation via Rcpp to improve the computational performance of the SLFM within the widely used statistical tool R. We investigate real and simulated microarray data related to breast cancer. |
Abstract: | O desenvolvimento de métodos baseados em simulação, como a cadeia de Markov Monte Carlo (MCMC), tem contribuído para um aumento do interesse no framework Bayesiano como uma alternativa para lidar com modelos fatoriais. Muitos estudos usaram análise fatorial bayesiana para explorar dados de expressão gênica. Estamos particularmente interessados na aplicação de um modelo de fator latente esparso (SLFM) baseado em prioris de esparsidade (misturas) para avaliar a significância dos fatores. O SLFM mede a força do padrão de expressão coerente observado nos dados, o que é uma importante fonte de informação para avaliar a atividade do gene. Na literatura, esse tipo de modelo tem mostrado melhores resultados do que outras abordagens destinadas à identificação de padrões e grupos metagênicos relacionados à biologia subjacente. No entanto, um modelo de fator bayesiano completo baseado em algoritmos MCMC tem um custo computacional caro, o que o torna pouco atraente para usuários em geral. Neste artigo, apresentamos o pacote slfm que usa implementação C++ via Rcpp para melhorar o desempenho computacional do SLFM dentro da ferramenta estatística amplamente utilizada R. Investigamos dados reais e simulados de microarray relacionados ao câncer de mama. |
Subject: | Estatística Probabilidades Teoria bayesiana de decisão estatistica C++ (Linguagem de programação de computador) R (Linguagem de programação de computador) |
language: | eng |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.department: | ICX - DEPARTAMENTO DE ESTATÍSTICA |
Rights: | Acesso Aberto |
metadata.dc.identifier.doi: | https://doi.org/10.18637/jss.v090.i09 |
URI: | http://hdl.handle.net/1843/56441 |
Issue Date: | 31-Jul-2019 |
metadata.dc.url.externa: | https://www.jstatsoft.org/article/view/v090i09 |
metadata.dc.relation.ispartof: | Journal of Statistical Software |
Appears in Collections: | Artigo de Periódico |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
SLFM an R package to evaluate coherent patterns in microarray data via factor analysis.pdf | 937.7 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.