Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes

dc.creatorÁlvaro Salgado de Abreu
dc.date.accessioned2023-06-27T15:07:48Z
dc.date.accessioned2025-09-09T01:09:35Z
dc.date.available2023-06-27T15:07:48Z
dc.date.issued2022-06-14
dc.description.abstractArboviruses transmitted by mosquitoes present major challenges for public health and are responsible for epidemics which cause significant impacts on the health system of the countries where they occur, with a diverse spectrum of clinical conditions. Among them, yellow fever and dengue viruses are of special interest in the Brazilian territory. Yellow fever virus is responsible for the most severe disease transmitted by mosquitoes in the tropics, and Brazil has faced recent outbreaks with high mortality rates in areas where the virus had not been reported for decades. These sites consist of densely populated urban regions with a high prevalence of unvaccinated people. Dengue virus, in turn, is a threat that puts a third of the global population at risk, especially in places where its main vector, mosquitoes of the Aedes genus, is more prevalent. In Brazil, specifically, different serotypes have caused major outbreaks in recent decades, so that genomic surveillance comes up as an important measure for early detection of emerging and reemerging viruses, as well as for investigating their dynamic behavior and dissemination. In this context, data analysis tools based on machine learning are able to extract useful information from large volumes of data and assist in the objectives of genomic surveillance. In the work presented here, we analyzed complete and almost complete genomic sequences of yellow fever and dengue viruses, associated with clinical, laboratory, epidemiological, geographic and temporal data, in order to identify genetic signatures correlated with observed biological characteristics. As a result, we identified non-synonymous nucleotide variations associated with the cycle threshold of yellow fever samples from non-human primates and the severity of yellow fever infections in humans, for which we performed in-silico structural protein modeling and discussed possible biological implications. In addition, we also identified genetic signatures that differentiate strains of dengue virus serotype 2 in a recent outbreak in Brazil, highlighting the method’s complementarity and accordance to phylogenetic analysis. Therefore, this work presents an initial, versatile and fast approach to assist in real-time genomic surveillance.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/55401
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectBioinformática
dc.subjectAprendizado de Máquina
dc.subjectGenômica
dc.subjectInteligência Artificial
dc.subjectVírus da Febre Amarela
dc.subjectVírus da Dengue
dc.subject.otheraprendizado de máquina
dc.subject.othervigilância genômica
dc.titleAprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
dc.typeTese de doutorado
local.contributor.advisor1Luiz Carlos Júnior Alcantara
local.contributor.advisor1Latteshttp://lattes.cnpq.br/7428560072021675
local.creator.Latteshttp://lattes.cnpq.br/2190589411553276
local.description.resumoArbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real.
local.publisher.countryBrasil
local.publisher.departmentICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Bioinformatica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese_alvaro_rev16_posdefesa.pdf
Tamanho:
3.02 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: