Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUOS-9TDGLR
Type: Tese de Doutorado
Title: Divergenome: uma plataforma bioinformática para o estudo da diversidade genética humana e aplicações na identificação de episódios de seleção natural na evolução humana
Authors: Wagner Carlos Santos Magalhaes
First Advisor: Eduardo Martin Tarazona Santos
Abstract: Neste trabalho desenvolvemos uma plataforma de gerenciamento de dados e projetos, provenientes de estudos de genética de populações e epidemiologia genética, a DIVERGENOME. A plataforma apresenta dois componentes funcionais: A) uma base de dados relacional, o DIVERGENOMEdb, desenvolvida com o objetivo de armazenar os dados de forma segura e organizada e integrar diferentes fontes de informação (disponíveis em repositórios públicos e gerados localmente), dados genéticos (genótipos e haplótipos, provenientes de diferentes tipos de polimorfismos) e informações epidemiológicas (fenótipos, constituídos de variáveis qualitativas e quantitativas); e B) um conjunto de scripts para manipulação de formatos de arquivos, o DIVERGENOMEtools, com o objetivo de otimizar a tarefa de conversão de formatos para análises em diferentes software, tarefa comprovadamente árdua e fonte de grande número de erros evidenciados nos resultados finais das análises. Nossa plataforma apresenta uma nova metodologia para a integração de diferentes scripts permitindo maior número possível de conversões e fácilitando sua extensão. Uma primeira versão da ferramenta pode ser acessada em (www.cebio.org/pipelineldgh/). Os diferentes componentes da plataforma foram utilizados na condução dos trabalhos sobre a ação dos fatores evolutivos que moldam a diversidade genética apresentados na dissertação, mostrando-se eficientes às suas propostas. Para garantir a o acesso de forma rápida e ampla utilização de nossa plataforma pela comunidade científica desenvolvemos ainda uma interface web dessa forma não exigindo do usuário conhecimentos prévios de programação e gerenciamento de bancos de dados.
Abstract: At this work we developed a management platform for data and projects from population genetics and genetic epidemiology fields called DIVERGENOME. It is composed of two functional components: A) a relational database, which aims to safely store, organize and integrate different sources of information and datasets (available at public repositories and locally produced), as well as genetic data (genotypes and haplotypes inferred using different types of polymorphisms) and epidemiologic information (phenotypes, characterized by quantitative and qualitative variables); and B) a set of scripts written using the programming language Perl, called DIVERGENOMEtools, that enables users to handle and change file formats according to their and software required for data analysis, a step which bears several basic but error-prone tasks. Our conversion tool outlines a new strategy, graph based, that integrates the scripts available by creating dynamic conversion pipelines attempting to maximize the number of formats available and to easy incorporate new scripts to the system. A first version of DIVERGENOMEtools may be accessed at (www.cebio.org/pipelineldgh/). The different modules of our platform demonstrated to be efficient to their objective. Finally, we developed a web interface to make easy the access of all functionalities of our system.
Subject: Bioinformática
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUOS-9TDGLR
Issue Date: 24-Jan-2011
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_final.pdf5.43 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.