Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/30015
Type: Tese
Title: FC-R2: A comprehensive atlas of human long non-coding RNAs expression using a standardized pipeline
Other Titles: FC-R2: Um atlas completo de expressão de ARNs não codificadores utilizando um pipeline padronizado
Authors: Eddie Luidy Imada
First Advisor: GLÓRIA REGINA FRANCO
First Co-advisor: LUIGI MARCHIONNI
First Referee: EMMANUAL DIAS-NETO
Second Referee: WAGNER CARLOS SANTOS MAGALHÃES
Third Referee: JOÃO TRINDADE MARQUES
metadata.dc.contributor.referee4: RENATO SANTANA DE AGUIAR
Abstract: In recent years, in depth exploration of genomes structure and function has revealed a central role for non-coding RNAs (ncRNAs) in orchestrating key biological and cellular processes through the fine tuning of gene expression regulation. Most importantly, the understanding of the role for ncRNAs has also started to emerge in human disease pathogenesis. This further speaks to the importance of an in-depth characterization of ncRNA involvement in diseases, including cancer. In this work, we have built a comprehensive atlas of gene expression, named FC-R2, across the human transcriptome containing over 100,000 genes by leveraging two publicly available resources: the FANTOM CAGE Associated Transcriptome (FANTOM-CAT), and recount2. The FANTOM-CAT is a comprehensive meta-assembly of the human transcriptome encompassing coding and non-coding genes, including promoters, enhancers, and lncRNAs. recount2 is the largest, available collection of human RNA-seq data processed and quantified using a unified pipeline, containing over 4.4 trillion reads from over 70,000 human samples from the SRA, GTEx and TCGA projects. Using FC-R2 gene expression summaries across human tissue samples from the GTEx project, we validated our approach by reproducing key findings recently described by the FANTOM consortium and the TCGA Pan-Cancer atlas. We also demonstrated the power and usability of the FC-R2 by performing two case studies in prostate cancer highlighting potential “novel” lncRNAs players involved in the clinically relevant prostate cancer phenotype. Finally, we make the FC-R2 atlas available as a public tool to empower other researchers to study important biological and clinical phenotypes and identify new candidate ncRNAs for further investigation.
Abstract: Recentemente, estudos à fundo das funções e estrutura de genomas revelou que RNAs não codificadores desempenham um papel essencial no controle e regulação de processos biológicos e celulares através da regulação da expressão gênica. Estes mecanismos também começaram a ser elucidados em doenças humanas, destacando a importância da caracterização dos papéis desempenhados pelos RNAs não-codificadores em doenças, como o câncer. Neste trabalho, nós construímos um atlas de expressão gênica do transcriptoma humano contendo mais de 100.000 genes fazendo uso de dois recursos públicos: o transcriptoma associado à CAGE do projeto FANTOM (do inglês FANTOM-CAT) e o recount2, denominado FC-R2. O FANTOM-CAT é uma meta-montagem completa do transcriptoma humano contendo ambos genes codificadores e não-codificadores, incluindo promotores, enhancers e RNAs não codificadores longos. Recount2 é a maior coleção disponível de dados de RNA-seq humano processados e quantificados utilizando um pipeline unificado contendo mais de 4,4 trilhões de bases e mais de 70.000 amostras humanas derivadas do SRA e dos projetos TCGA e GTEx. Utilizando dados do GTEx derivados do FC-R2, nós validamos nossa abordagem ao reproduzir diversas descobertas importantes descritas recentemente pelo projeto FANTOM e do Pan-cancer atlas do TCGA. Em dois estudos de caso, nós também demonstramos a utilidade e capacidade do FC-R2 em recuperar novos RNAs não-codificadores longos potencialmente envolvidos em fenótipos de importância clínica. Concluindo, nós disponibilizamos o atlas FC-R2 como uma ferramenta publica para permitir que outros pesquisadores sejam capazes de identificar novos RNAs não-codificadores em fenótipos de interesse.
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICB - DEPARTAMENTO DE BIOQUÍMICA E IMUNOLOGIA
metadata.dc.publisher.program: Programa de Pós-Graduação em Bioinformatica
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/30015
Issue Date: 23-May-2019
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Final.pdfTese9.18 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.