Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-A3QNAQ
Type: Dissertação de Mestrado
Title: SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
Authors: Diego César Batista Mariano
First Advisor: Vasco Ariston de Carvalho Azevedo
First Co-advisor: Rommel Thiago Juca Ramos
First Referee: Rommel Thiago Juca Ramos
Abstract: A evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>.
Abstract: The evolution of large-scale sequencing platforms has reduced the time taken for the process of DNA fingerprinting at a reduced cost and in less time. However, sequencers still have limitations, such as the maximum size of DNA fragments that are capable of reading. What drives the need to break the DNA into small pieces before sequencing, being necessary after this step, to rearrange the fragments (reads) so that it can represent the original genome. This process is known as genome assembly. The genome assembly is a complex process dependent on the limitations of sequencers, so there is the need to use several computer programs. In recent years, several strategies for genome assembly have been proposed, but there is still no consensus on the best approach. In this context, we propose a pipeline for the assembly of bacterial genomes, which will be managed by a web application with user-friendly interface called SIMBA (Simple Bacterial Manager for Assemblies). To evaluate its performance, we assembled the strains Corynebacterium pseudotuberculosis 1002 (originally sequenced in Sanger and Roche 454 platforms) and Corynebacterium pseudotuberculosis 258 (originally sequenced on SOLiD v3 platform) using five different assembly software: Mira3, Mira4, Minia, Newbler and SPAdes. Both strains were resequenced with simple fragments libraries of approximate size to 200pb in the semiconductor Ion PGM platform. After assembly, was chosen one of them to perform the closing of gaps through two approaches: reference-based and optical mapping. Finally, it was observed that the SIMBA tool allows fast and easy execution of the assembly process and curation of genomes. The download of the tool is available at the website: <http://ufmgsimba. sourceforge.net>.
Subject: Bioinformática
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUBD-A3QNAQ
Issue Date: 26-Feb-2015
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
disserta__o_v5.9_final.pdf6.25 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.