Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUOS-B7UN89
Type: Tese de Doutorado
Title: Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
Authors: Henrique Velloso Ferreira Melo
First Advisor: Jose Miguel Ortega
Abstract: A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMG
Abstract: The origins of genes have always fascinated scientists, and the list of proposed mechanisms for the origin of new genes has progressively increased. The exploitation of such mechanisms would greatly benefit from a description of the scenario underlying the rise of genes throughout evolution. This work creates tools for the description of this scenario andassesses the emergence of genes on large scale, not in chronological time, but in a cladistic context. The generated tools, all available online, can be grouped into three products: (i) a set of tools and services named BioTools Service (ii) the Genesis website and (iii) a Web services platform called BOWS. BioTools Service is a suite of scripts and services targeted to process taxonomy data and infer the origin of genes. It consists of four byproducts: TaxSimple, GetAllChildren, LCA and GeneOriginUEKO. TaxSimple flattens the hierarchical taxonomicdata from NCBI in order to facilitate taxonomic queries. GetAllChildren is a Web service that returns all leaf nodes descendants of a given clade in the tree of life. LCA (Lowest Common Ancestor) is a script that returns the common ancestor of two or more given nodes. GeneOriginUEKO can infer the origin of genes using UEKO clusters of orthologous (anenriched version of the KEGG ORTHOLOGY database). Graphs generated based on the results show wave patterns of human gene emergence with peaks in certain clades, such as Euteleostomi and Eutheria. It was also observed that some human metabolic pathways were increasingly gaining elements throughout evolution, as seen for the JAK-STAT signaling pathway. However, it was found that horizontal transfer events could cause the LCA to incorrectly move toward the root of the tree of life. To work around this issue, the multiple LCA was developed, which isolates horizontal transfers with the aid of complete genomes and thereby infer multiple origins of a gene. The Genesis website, built based on this algorithm, provides a graphical interface to the main results of the gene multiple origins analysis and also permits performing of analyses with custom input data. At least this work presents the BOWS platform, a system that centralizes and provides universal and secure access to bioinformatics tools installed on remote computational clusters. BOWS can be installed in any lab and is already being used successfully in Biodados Lab at UFMG
Subject: Genes
Bioinformática
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUOS-B7UN89
Issue Date: 31-Jul-2014
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_velloso_final.pdf5.39 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.