Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-9ZWJLV
Type: Tese de Doutorado
Title: Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
Authors: Rodrigo de Paula Baptista
First Advisor: Andrea Mara Macedo
First Co-advisor: Daniella Castanheira Bartholomeu
Abstract: A doença de Chagas, causada pelo protozoário Trypanosoma cruzi, apresenta diferentes manifestações clínicas, resultantes de uma interação complexa entre fatores ambientais e genéticos tanto do hospedeiro quanto do parasito. Com relação aos fatores genéticos do parasito, uma variedade de estudos biológicos e moleculares revelou uma substancial variabilidade gênica entre populações de T. cruzi. De fato, em 2009, O táxon T. cruzi foi subdividido em seis linhagens ou DTUs principais (TcI-VI). Os aspectos epidemiológicos associados às diferentes linhagens ainda não estão bem definidos, mas já há evidências de associação, pelo menos parcial, com a distribuição geográfica, ciclos de transmissão e aspectos clínicos da doença. Todavia vários aspectos da estrutura populacional do parasito ainda necessitam esclarecimentos. Por exemplo, o modo de reprodução, a origem das seis linhagens e as relações com os seus aspectos epidemiológicos. No presente trabalho procurou-se desenvolver ou aperfeiçoar procedimentos moleculares, e computacionais que permitissem investigar e dissecar a complexidade da estrutura populacional de T. cruzi. Para tanto, foram propostos os seguintes objetivos (i) investigar a estratégia de reprodução do T. cruzi; (ii) buscar novas metodologias de caracterização molecular capazes de diferenciar as diferentes linhagens de T. cruzi em futuros ensaios multiplex de PCR; (iii) sequenciar o genoma de uma linhagem ainda não disponível nos bancos de dados públicos e realizar uma analise comparativa com seus dados genômicos a fim de resolver a origem ancestral das seis linhagens filogenéticas propostas; (iv) e, por fim, desenvolver uma metodologia computacional de agrupamento capaz de reconhecer padrões responsáveis pela divisão das linhagens e gerar regiões candidatas para o desenho de iniciadores para novos ensaios de caracterização molecular. Baseados em marcadores nucleares e mitocondriais e em parâmetros de genética populacional, analisamos dois grupos de isolados de T. cruzi: um proveniente diferentes regiões da América Latina e outros obtidos exclusivamente de pacientes do Estado de Minas Gerais. Nossos resultados, ao contrário daqueles majoritariamente encontrados na literatura, não suportam uma estrutura de população essencialmente clonal para T. cruzi, ao menos para TcII coexistindo em uma mesma área geográfica, sugerindo que as trocas genéticas entre cepas estreitamente relacionadas geograficamente são mais frequentes do que inicialmente esperado. Baseado na técnica de caracterização alelo específica BI-PASA, nós selecionamos uma variação no gene NAD desidrogenase subunidade I (ND1) de T. cruzi, e nossos resultados demostraram que esta metodologia foi eficaz, sendo rápida e mais barata, tornando-se uma boa candidata a ser utilizada em futuros ensaios de caracterização destes haplótipos. O genoma do clone da cepa 231 pertencente à linhagem TcIII foi sequenciado e para a montagem foi desenvolvida uma abordagem de montagem combinada de diferentes metodologias capaz de melhorar a acurácia da montagem deste genoma de conteúdo altamente repetitivo. Posteriormente, nós realizamos uma análise comparativa entre o genoma da cepa 231 montado e os demais disponíveis em bancos de dados e selecionamos genes altamente conservados, que foram utilizados em análises filogenéticas. Os resultados obtidos apontam para uma nova hipótese de origem das seis linhagens filogenéticas de T. cruzi e nos permitiram concluir que a linhagem TcIII, diferentemente do que foi proposto por diversos trabalhos, não é uma linhagem híbrida. Sequências gênicas codificadoras de proteínas altamente repetivivas e variáveis, como a amastina, de diferentes linhagens do parasito foram analisadas em um script criado por nosso grupo baseado em decomposição de valores singulares e K-means juntamente com uma análise de regressão logística, resultando na geração de regiões candidatas responsáveis pela divisão destas sequências em grupos, que foram similares à divisão filogenética esperada. Esta metodologia poderá ser aplicada futuramente a outros grupos gênicos para elaboração de novas metodologias de caracterização molecular. As metodologias desenvolvidas e os resultados obtidos neste trabalho contribuem para um melhor entendimento da complexidade da estrutura populacional de T. cruzi.
Abstract: Chagas disease, caused by the protozoan parasite Trypanosoma cruzi, has different clinical manifestations, that result from complex host-parasite interactions and involves both genetic and environmental factors. Regarding the parasite genetic factors, a variety of biological and molecular studies revealed an extensive genetic variability among T. cruzi strains, which were recently classified into six major lineages or DTUs (TcI-VI). Epidemiological aspects associated with these different lineages are not well defined, but there are some evidences of association with geographic distribution, transmission cycles and clinical aspects of this disease. Thus, in order to thoroughly investigate the population structure of this parasite, the efforts of our research group have been focused on developing new methodologies for T. cruzi characterization and study of the Chagas disease molecular epidemiology. In this present work, we seek to develop molecular and computational procedures enabling us to elucidate and dissect the complexity of population structure of T. cruzi. To this end, we proposed (i) to investigate the mode of reproduction of T. cruzi and search new molecular markers able to differentiate all six T. cruzi phylogenetic lineages and that could be used to develop multiplex assays; (ii) sequencing the genome of 231 strain, a representative of TcIII, a DTU not yet sampled in T. cruzi genome projects, and perform comparative genomic analyses to better resolve the ancestral origin of these six lineages (iii) and develop a sequence clustering methodology capable of recognizing sequences patterns responsible for the division of T. cruzi DTUs and based on this analysis identify novel candidate regions for molecular characterization assays. Using population genetic approaches, we analyzed both nuclear and mitochondrial markers in two groups of T. cruzi: one using strains isolated from different regions of Latin America and another using strains isolated exclusively from the Minas Gerais state, in Brazil. Our results, unlike those mostly found in literature, does not support an clonal population structure for T. cruzi, at least for TcII coexisting in the same geographic area, suggesting that genetic exchange between geographically closely related strains are more frequent than initially expected. The perspective is to incorporate the selected target in a multiplex PCR assay suitable for the study of T. cruzi populations present in tissues of chronic chagasic patients. Based on the Bi-PASA technique of allele specific characterization, we select a SNP variation in the T. cruzi ND1 mitochondrial gene, and our results showed that this methodology was effective, faster and cheaper than the RFLP-PCR array, making it a good candidate to be used in future mitochondrial haplotypes characterization tests. The genome of the 231 clone, which belongs to the TcIII lineage, was sequenced and for the assembly we have developed a combined approach using different methodologies to improve the assembly accuracy of this highly repetitive genome. Subsequently, we performed a comparative analysis between 231 genome and the other T. cruzi genomes available in public databases to selected highly conserved genes across the different strains to perform phylogenetic analyses. Based on our results, we propose a new hypothesis for the origin of the six T. cruzi DTUs and conclude that TcIII, unlike what has been proposed by several studies, is not a hybrid lineage. Surface protein gene sequences, which are highly repetitives and variable, such as amastin, from different strains of the parasite were analyzed using an in-house script based on singular value decomposition and K-means along with a logistic regression analysis. Using this approach, we identified candidate regions that recapture the T. cruzi phylogenetic division. This methodology can be applied to other gene groups for the development of novel molecular characterization assays. The methodologies developed during this study and our results contributed to better understand the complexity of T. cruzi population structure.
Subject: Chagas, Doença de
Bioinformática
Genética de populações
Trypanosoma cruzi
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUBD-9ZWJLV
Issue Date: 19-Aug-2014
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_rodrigo_envio_biblioteca_final.pdf3.89 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.