Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/BUOS-9TDGLR
Tipo: Tese de Doutorado
Título: Divergenome: uma plataforma bioinformática para o estudo da diversidade genética humana e aplicações na identificação de episódios de seleção natural na evolução humana
Autor(es): Wagner Carlos Santos Magalhaes
primer Tutor: Eduardo Martin Tarazona Santos
Resumen: Neste trabalho desenvolvemos uma plataforma de gerenciamento de dados e projetos, provenientes de estudos de genética de populações e epidemiologia genética, a DIVERGENOME. A plataforma apresenta dois componentes funcionais: A) uma base de dados relacional, o DIVERGENOMEdb, desenvolvida com o objetivo de armazenar os dados de forma segura e organizada e integrar diferentes fontes de informação (disponíveis em repositórios públicos e gerados localmente), dados genéticos (genótipos e haplótipos, provenientes de diferentes tipos de polimorfismos) e informações epidemiológicas (fenótipos, constituídos de variáveis qualitativas e quantitativas); e B) um conjunto de scripts para manipulação de formatos de arquivos, o DIVERGENOMEtools, com o objetivo de otimizar a tarefa de conversão de formatos para análises em diferentes software, tarefa comprovadamente árdua e fonte de grande número de erros evidenciados nos resultados finais das análises. Nossa plataforma apresenta uma nova metodologia para a integração de diferentes scripts permitindo maior número possível de conversões e fácilitando sua extensão. Uma primeira versão da ferramenta pode ser acessada em (www.cebio.org/pipelineldgh/). Os diferentes componentes da plataforma foram utilizados na condução dos trabalhos sobre a ação dos fatores evolutivos que moldam a diversidade genética apresentados na dissertação, mostrando-se eficientes às suas propostas. Para garantir a o acesso de forma rápida e ampla utilização de nossa plataforma pela comunidade científica desenvolvemos ainda uma interface web dessa forma não exigindo do usuário conhecimentos prévios de programação e gerenciamento de bancos de dados.
Abstract: At this work we developed a management platform for data and projects from population genetics and genetic epidemiology fields called DIVERGENOME. It is composed of two functional components: A) a relational database, which aims to safely store, organize and integrate different sources of information and datasets (available at public repositories and locally produced), as well as genetic data (genotypes and haplotypes inferred using different types of polymorphisms) and epidemiologic information (phenotypes, characterized by quantitative and qualitative variables); and B) a set of scripts written using the programming language Perl, called DIVERGENOMEtools, that enables users to handle and change file formats according to their and software required for data analysis, a step which bears several basic but error-prone tasks. Our conversion tool outlines a new strategy, graph based, that integrates the scripts available by creating dynamic conversion pipelines attempting to maximize the number of formats available and to easy incorporate new scripts to the system. A first version of DIVERGENOMEtools may be accessed at (www.cebio.org/pipelineldgh/). The different modules of our platform demonstrated to be efficient to their objective. Finally, we developed a web interface to make easy the access of all functionalities of our system.
Asunto: Bioinformática
Idioma: Português
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Tipo de acceso: Acesso Aberto
URI: http://hdl.handle.net/1843/BUOS-9TDGLR
Fecha del documento: 24-ene-2011
Aparece en las colecciones:Teses de Doutorado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
tese_final.pdf5.43 MBAdobe PDFVisualizar/Abrir


Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.