Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/64802
Type: Tese
Title: Desenvolvimento e comparação de ferramentas e pipelines para análises ômicas nos estudos de conservação da diversidade vegetal
Other Titles: Development and comparison of tools and pipelines for omics analysis in studies of plant diversity conservation
Authors: Renato Renison Moreira Oliveira
First Advisor: Guilherme Corrêa de Oliveira
First Co-advisor: Thomas Sicheritz-Pontén
First Referee: Ana Maria Benko Iseppon
Second Referee: Alessandro de Mello Varani
Third Referee: Thannya Nascimento Soares
metadata.dc.contributor.referee4: Henrique Vieira Figueiró
Abstract: As plantas desempenham um papel fundamental na manutenção da vida no planeta, e diante de ameaças, principalmente antrópicas, é essencial conduzir estudos de conservação para garantir o conhecimento, proteção e perpetuação das espécies. Entre as diversas abordagens nesses estudos, se destacam a Genética e Genômica da Conservação, sendo esta última capaz de fornecer informações que permitam um melhor entendimento de características adaptativas, variabilidade genética e estudos adaptativos sob diferentes estresses ambientais. A Genômica da Conservação ganhou maior relevância com o surgimento das tecnologias de sequenciamento, permitindo um crescimento exponencial na quantidade de genomas depositados nos bancos de dados públicos. Apesar dos custos de sequenciamento terem diminuído consideravelmente e a quantidade de dados gerados ter aumentado, montar genomas grandes de eucariotos, especialmente plantas, ainda é uma atividade complexa e custosa. Características inerentes aos genomas de plantas, como poliploidia, tamanho do genoma e regiões repetitivas ainda causam problemas nos processos de montagem desses genomas. Para solucionar tais problemas, uma grande diversidade de softwares montadores foram desenvolvidos, cada um funcionando de uma forma específica. Além do desenvolvimento de diversos softwares montadores para superar esses problemas em montagens de genomas grandes e complexos, outras técnicas que vem sendo desenvolvidas e bastante utilizadas nos estudos de biodiversidade são as técnicas de barcoding e metabacording, que juntas permitem a identificação rápida e precisa de espécies presentes em amostras ambientais, além de atuarem na realização de estudos evolutivos. Este trabalho identificou três necessidades nas áreas de genômica ambiental e, por meio da elaboração de três artigos, procurou suprir tais necessidades. O primeiro artigo apresenta o SPLACE, uma ferramenta que permite o alinhamento e concatenação de genes de forma automatizada, rápida e precisa, tratando os dados faltantes e gerando uma supermatriz que pode ser utilizada para a inferência de árvores filogenômicas. O segundo artigo apresenta o PIMBA, um pipeline para realizar análises de metabarcoding de forma rápida e abrangente, permitindo escolher diferentes abordagens de análise e seus diversos parâmetros, além de possibilitar o uso de bancos de dados de referência próprios, além dos bancos tradicionais existentes e do GenBank. Por fim, foi produzido um manuscrito onde buscou-se suprir a necessidade de trabalhos na literatura que fizessem uma comparação justa entre os diversos montadores disponíveis ao se montar os genomas de várias espécies de plantas, além de reunir informações sobre os genomas nucleares completos de plantas que já foram analisados. Estes três trabalhos publicados auxiliaram em diversos estudos importantes no planejamento de estratégias para a conservação da diversidade vegetal, podendo também ser aplicadas a outros grupos de organismos.
Abstract: Plants play a key role in maintaining life on the planet, and in the face of threats, mainly anthropogenic, it is essential to conduct conservation studies to ensure the knowledge, protection, and perpetuation of species. Among the various approaches in these studies, Conservation Genetics and Genomics stand out, the latter being able to provide information that allows a better understanding of adaptive characteristics, genetic variability and adaptive studies under different environmental stresses. Conservation Genomics gained greater relevance with the emergence of sequencing technologies, allowing an exponential growth in the amount of genomes deposited in public databases. Although the costs of sequencing have decreased considerably and the amount of data generated has increased, assembling large genomes of eukaryotes, especially plants, is still a complex and costly activity. Inherent characteristics of plant genomes, such as polyploidy, genome size, and repetitive regions still cause problems in the assembly processes of these genomes. To solve these problems, a great diversity of assembly software has been developed, each one working in a specific way. Besides the development of several software assemblers to overcome these problems in assembling large and complex genomes, other techniques that have been developed and widely used in biodiversity studies are the barcoding and metabarcoding techniques, which together allow the rapid and accurate identification of species present in environmental samples, as well as to perform evolutionary studies. This work identified three needs in the areas of environmental genomics and, through the elaboration of three articles, sought to supply those needs. The first paper introduces SPLACE, a tool that allows for the alignment and concatenation of genes in an automated, fast, and accurate manner, addressing missing data and generating a supermatrix that can be used for the inference of phylogenomic trees. The second paper presents PIMBA, a pipeline to conduct metabarcoding analyses quickly and comprehensively, allowing users to choose different analysis approaches and their various parameters, and also facilitating the use of one's own reference databases, in addition to the existing traditional databases and GenBank. Lastly, a manuscript was produced aiming to fill a gap in the literature by fairly comparing the various genome assemblers available for several plant species and gathering information about the complete nuclear genomes of plants that have already been analyzed. These three published works assisted in various important studies planning strategies for the conservation of plant diversity and can also be applied to other groups of organisms.
Subject: Bioinformática
Conservação da Diversidade Biológica
Genoma de Planta
Filogenia
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Bioinformatica
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/64802
Issue Date: 16-Aug-2023
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese-Renato Oliveira-final.pdfTese de Doutorado - Renato Oliveira11.93 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons