Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-A2PGE4
Type: Tese de Doutorado
Title: Desenvolvimento de ferramentas para a identificação de marcadores moleculares e imunológicos a partir de dados genômicos como alvo para o diagnóstico de doenças parasitárias
Authors: Robson da Silva Lopes
First Advisor: Daniella Castanheira Bartholomeu
Abstract: Doenças infecciosas causadas por parasitos protozoários apresentam-se como um grande problema de saúde pública, principalmente, em países pobres e em desenvolvimento, causando milhões de mortes por ano. Para o controle e monitoramento efetivo dessas doenças é essencial que se disponha de métodos de diagnósticos cada vez mais precisos. Identificar marcadores imunológicos e moleculares, como epítopos e microssatélites, permite uma rápida seleção de potenciais alvos que podem ser utilizados em diagnósticos, protocolos vacinais e como imunoterapêuticos. Métodos experimentais de identificação de marcadores imunológicos e moleculares apresentam elevado custo e requerem longos períodos de experimentação. Uma alternativa empregada é a utilização de métodos in silico de identificação destes marcadores dada à grande quantidade sequências genômicas e proteômicas disponíveis em bancos de dados públicos. Muitos métodos e ferramentas foram desenvolvidos nos últimos anos com o objetivo de identificar marcadores imunológicos e moleculares. No que se refere à preditores de epítopos, ferramentas como PREDITOP, PEOPLE, BEPITOPE, BepiPred, ABCpred, BCPred, BayesB e BEST foram desenvolvidas utilizando técnicas de inteligência artificial que permitem aos algoritmos aprender com informações já existente, isto é, aprendizado de máquina. No entanto, estas ferramentas baseadas em técnicas de aprendizado ainda apresentam uma baixa taxa de acurácia na predição quando aplicadas em dados de protozoários, devido à baixa quantidade de dados de protozoários usada no treinamento. Para identificação de marcadores moleculares do tipo repetições em tandem, existem várias ferramentas disponíveis, tais como: IMEx, MISA, Mreps, SciRoKo, Sputnik e TROLL. No entanto, além de identificar as repetições faz-se necessário que as ferramentas apresentem outros recursos que auxiliem os pesquisadores no reconhecimento e análise dos marcadores moleculares. Diante disto, este trabalho vem apresentar o desenvolvimento de ferramentas computacionais para a identificação de marcadores moleculares e imunológicos a partir de dados genômicos, a fim de buscar novos alvos para o diagnóstico de doenças parasitárias. Na primeira parte deste trabalho foi desenvolvido uma ferramenta web e stand-alone, intitulada Proteome and Genome Repeat Finder (ProGeRF), capaz de identificar marcadores de diagnóstico do tipo repetições em tandem. Em uma segunda etapa, buscou-se verificar se a etapa de treinamento de uma ferramenta de predição de epítopos lineares de células B com dados de diferentes táxons (bactérias, vírus e protozoários) pode influenciar, significativamente, na predição de epítopos de protozoários. A ferramenta ProGeRF proposta apresenta-se como uma ferramenta eficiente, rápida e precisa, seja nos modos stand-alone ou web, sendo a única que proporciona visualização gráfica e buscas com filtros nos resultados. Além de ser capaz de ser executada tanto em dados genômicos quanto em dados proteômicos e em grandes arquivos quando comparada com as ferramentas MISA, TROLL, TRF, Sputnik, GMATo e SciRoKo, ProGeRF consegue identificar uma quantidade maior de elementos repetitivos que as demais ferramentas em um tempo, consideravelmente, mais rápido. No que diz respeito à predição de epítopos lineares de células B em dados de protozoários, ferramentas treinadas apenas com dados de bactérias de maneira geral, conduz a uma predição, em média, próxima do aleatório. No entanto, quando treinado apenas com dados de vírus, algumas espécies de protozoários apresentaram significativo grau de eficiência. Todavia, melhores resultados foram apresentados quando a base de treinamento continha dados balanceados dos três táxons ou apenas dados de protozoários o que sugere uma real influência da base de dados de treinamento na acurácia de predição de epítopos lineares de células B de protozoários.
Abstract: Infectious diseases caused by protozoan parasites is a major public health problem, especially in poor or developing, causing millions of deaths annually. For effective monitoring and control of these diseases it is essential to develop precise diagnostic methods. The identification of immunological and molecular markers, such as microsatellites and epitopes, allows rapid selection of potential targets that can be used in diagnostics, vaccination protocols and immunotherapeutic. Experimental methods for the identification of immunological and molecular markers have high costs and require long periods of experimentation. Given the large amount of genomic and protein sequences available in public databases, in silico methods for identifying these markers have been employed as an alternative approach. Recently, many methods and tools to identify immunological and molecular markers have been developed. Epitope prediction tools such as PREDITOP, PEOPLE, BEPITOPE, BepiPred, ABCpred, BCPred, BayesB and BEST were developed using machine learning techniques. These tools have better results in comparison to tools that do not use this approach. However, they are not accurate enough when applied to protozoa data, mainly due to the small protozoan datasets used for training. To identify tandem repeat markers, there are several available tools, such as IMEX, MISA, Mreps, SciRoKo, Sputnik and TROLL. However, besides identifying repetitive regions, other features have to be displayed to assist researchers in the recognition and analysis of molecular markers. In this work, we have developed tools for the identification of molecular and immunological markers from genomic data in order to seek new targets for the diagnosis of parasitic diseases. In the first part of this work, it presents a web and stand-alone tool, entitled ProGeRF (Proteome and Genome Repeat Finder), and developed to identify tandem repeats as molecular markers. The second part of this work aimed to verify whether the performance of in silico prediction tools of linear B-cell epitope could be impacted by using distinct training datasets (bacteria, viruses and protozoa). The ProGeRF tool is an efficient, fast, accurate, easy to use, either in stand-alone or web tool, provides a graphic display and allows filtering the results. Besides, it is able to run in large genomic and proteomic data. When compared with MISA, TROLL, TRF, Sputnik, SciRoKo and GMATo, ProGeRF can identify a larger number of repetitive elements and is faster than the majority of the other tools. Regarding the prediction of linear B-cell epitope from protozoa data, tools trained with bacteria data generally leads to random predictions. However, when trained only with virus data, some species of protozoa showed a significant degree of efficiency during B-cell epitope prediction. The best results were obtained when the training dataset contained balanced data from the three taxon or data only from protozoa, highlighting the importance of optimizing the performance of tools for B-cell linear epitope using adequate training datasets.
Subject: Marcadores biolocios
Variação genética
Mapeamento de epitopos
Epitopsd/análise
Doenças parasitarias/diagnostico
Genoma viral
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUBD-A2PGE4
Issue Date: 26-Aug-2015
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese___robson_da_silva_lopes.pdf3.74 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.