Evolutionary hallmarks of the human proteome: chasing the age and coregulation of protein-coding genes
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de periódico
Título alternativo
Características evolutivas do proteoma humano: rastreando a idade e a corregulação dos genes codificadores de proteínas
Primeiro orientador
Membros da banca
Resumo
Contexto:
O desenvolvimento de tecnologias em larga escala para transcriptômica quantitativa possibilitou a análise abrangente dos perfis de expressão gênica em genomas completos. O RNA-Seq permite a mensuração dos níveis de expressão gênica de maneira muito mais precisa e global do que os métodos anteriores. Estudos que utilizam essa tecnologia estão alterando nossa visão sobre a extensão e a complexidade dos transcriptomas eucarióticos. Nesse sentido, diversos esforços têm sido feitos para determinar e analisar os padrões de expressão gênica de tipos celulares humanos em diferentes condições, tanto em estados normais quanto patológicos. Contudo, até recentemente, pouco se havia relatado sobre as marcas evolutivas presentes em genes humanos codificadores de proteínas, particularmente sob a perspectiva combinada da expressão gênica e da evolução proteica.
Resultados:
Apresentamos uma análise combinada do perfil de expressão de genes codificadores de proteínas humanas e do mapeamento de ancestralidade em escala temporal, que posiciona os genes em clados taxonômicos e revela oito etapas evolutivas principais (“marcas distintivas”), incluindo agrupamentos de proteínas funcionalmente coerentes. Os genes humanos expressos são analisados utilizando um conjunto de dados de RNA-Seq de 116 amostras de 32 tecidos. A análise evolutiva das proteínas humanas é realizada combinando informações de: (i) um banco de dados de proteínas ortólogas (OMA), (ii) o mapeamento taxonômico dos genes em clados de linhagem (do NCBI Taxonomy) e (iii) o mapeamento da escala temporal da evolução fornecido pelo TimeTree (Timescale of Life). Os genes codificadores de proteínas humanas também são inseridos em um contexto relacional baseado na construção de uma robusta rede de coexpressão gênica, que revela ligações mais estreitas entre genes codificadores de proteínas relacionados à idade e identifica módulos gênicos funcionalmente coerentes.
Conclusões:
Compreender o panorama relacional dos genes humanos codificadores de proteínas é essencial para interpretar os elementos e módulos funcionais do nosso genoma ativo. Além disso, decifrar a história evolutiva dos genes humanos pode fornecer informações muito valiosas para revelar ou desvendar sua origem e função.
Abstract
Background
The development of large-scale technologies for quantitative transcriptomics has enabled comprehensive analysis of the gene expression profiles in complete genomes. RNA-Seq allows the measurement of gene expression levels in a manner far more precise and global than previous methods. Studies using this technology are altering our view about the extent and complexity of the eukaryotic transcriptomes. In this respect, multiple efforts have been done to determine and analyse the gene expression patterns of human cell types in different conditions, either in normal or pathological states. However, until recently, little has been reported about the evolutionary marks present in human protein-coding genes, particularly from the combined perspective of gene expression and protein evolution.
Results
We present a combined analysis of human protein-coding gene expression profiling and time-scale ancestry mapping, that places the genes in taxonomy clades and reveals eight evolutionary major steps (“hallmarks”), that include clusters of functionally coherent proteins. The human expressed genes are analysed using a RNA-Seq dataset of 116 samples from 32 tissues. The evolutionary analysis of the human proteins is performed combining the information from: (i) a database of orthologous proteins (OMA), (ii) the taxonomy mapping of genes to lineage clades (from NCBI Taxonomy) and (iii) the evolution time-scale mapping provided by TimeTree (Timescale of Life). The human protein-coding genes are also placed in a relational context based in the construction of a robust gene coexpression network, that reveals tighter links between age-related protein-coding genes and finds functionally coherent gene modules.
Conclusions
Understanding the relational landscape of the human protein-coding genes is essential for interpreting the functional elements and modules of our active genome. Moreover, decoding the evolutionary history of the human genes can provide very valuable information to reveal or uncover their origin and function.
Assunto
RNA-Seq, Expressão gênica, Transcriptoma, Evolução molecular
Palavras-chave
Human protein evolution, Human gene evolution, Transcriptomics, RNA-seq, Tissue transcriptomics, Protein families, Gene coexpression, Gene house-keeping, Gene tissue-enriched
Citação
Curso
Endereço externo
https://link.springer.com/article/10.1186/s12864-016-3062-y