Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/55401
Type: Tese
Title: Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
Authors: Álvaro Salgado de Abreu
First Advisor: Luiz Carlos Júnior Alcantara
Abstract: Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real.
Abstract: Arboviruses transmitted by mosquitoes present major challenges for public health and are responsible for epidemics which cause significant impacts on the health system of the countries where they occur, with a diverse spectrum of clinical conditions. Among them, yellow fever and dengue viruses are of special interest in the Brazilian territory. Yellow fever virus is responsible for the most severe disease transmitted by mosquitoes in the tropics, and Brazil has faced recent outbreaks with high mortality rates in areas where the virus had not been reported for decades. These sites consist of densely populated urban regions with a high prevalence of unvaccinated people. Dengue virus, in turn, is a threat that puts a third of the global population at risk, especially in places where its main vector, mosquitoes of the Aedes genus, is more prevalent. In Brazil, specifically, different serotypes have caused major outbreaks in recent decades, so that genomic surveillance comes up as an important measure for early detection of emerging and reemerging viruses, as well as for investigating their dynamic behavior and dissemination. In this context, data analysis tools based on machine learning are able to extract useful information from large volumes of data and assist in the objectives of genomic surveillance. In the work presented here, we analyzed complete and almost complete genomic sequences of yellow fever and dengue viruses, associated with clinical, laboratory, epidemiological, geographic and temporal data, in order to identify genetic signatures correlated with observed biological characteristics. As a result, we identified non-synonymous nucleotide variations associated with the cycle threshold of yellow fever samples from non-human primates and the severity of yellow fever infections in humans, for which we performed in-silico structural protein modeling and discussed possible biological implications. In addition, we also identified genetic signatures that differentiate strains of dengue virus serotype 2 in a recent outbreak in Brazil, highlighting the method’s complementarity and accordance to phylogenetic analysis. Therefore, this work presents an initial, versatile and fast approach to assist in real-time genomic surveillance.
Subject: Bioinformática
Aprendizado de Máquina
Genômica
Inteligência Artificial
Vírus da Febre Amarela
Vírus da Dengue
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Bioinformatica
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/55401
Issue Date: 14-Jun-2022
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_alvaro_rev16_posdefesa.pdf3.09 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.