Prioritizing promising compounds in virtual screening campaigns

Alexandre Victor Fassio

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/53640

Tipo:	Tese
Título:	Prioritizing promising compounds in virtual screening campaigns
Título(s) alternativo(s):	Priorizando compostos promissores em campanhas de triagem virtual
Autor(es):	Alexandre Victor Fassio
Primeiro Orientador:	Raquel Cardoso de Melo Minardi
Primeiro Coorientador:	Rafaela Salgado Ferreira
Primeiro membro da banca :	João Paulo Ataide Martins
Segundo membro da banca:	Lucas Bleicher
Terceiro membro da banca:	Rafael Victorio Carvalho Guido
Quarto membro da banca:	Leonardo Henrique Franca de Lima
Resumo:	Structural-based virtual screening (SBVS) contributes significantly to early-stage drug discovery. However, SBVS commonly depends on a thorough manual process of hit selection. Despite the existence of several semi-automatic works that propose rescoring and filtering methods, the prioritization and automatic selection of promising compounds are still an open problem. Therefore, we tackle this problem from two perspectives. First, in the descriptive aspect, we propose nAPOLI (Analysis of PrOtein-Ligand Interactions), a web server that combines large-scale analysis of conserved interactions in protein-ligand complexes at the atomic level, interactive visual representations, and comprehensive reports of the interacting residues/atoms to detect and explore conserved non-covalent interactions. In the predictive aspect, we propose LUNA and Functional Interaction FingerPrint (FIFP). LUNA is a novel Python library for drug design that permits the analysis of any molecular complex and brings together several functions for filtering and visualizing interactions. In its turn, FIFP is a novel hashed interaction fingerprint inspired by ECFP that encodes molecular complexes and their interactions either as a binary or count fingerprint. FIFP also provides several interactive and visual features to simplify fingerprint information analysis. To validate and illustrate the applicability of FIFP, we first present an exploratory evaluation of its parameters, followed by a case study where we trained different machine learning models to reproduce the observed docking scores in a data set consisting of 86,641 molecules docked against Dopamine D4. We then compared the obtained models to four competing fingerprints (ECFP, FCFP, SILIRID, and PLEC). FIFP outperformed the competing approaches with an R² of 0.55. Therefore, we envision LUNA and FIFP as promising strategies for SBVS campaigns and machine learning.
Abstract:	A triagem virtual baseada na estrutura (SBVS) contribui significativamente para as etapas iniciais da descoberta de fármacos. No entanto, o SBVS geralmente depende de um processo bastante trabalhoso que consiste na seleção manual de compostos hits. Apesar da existência de vários trabalhos semiautomáticos que propõem métodos de rescoring e filtragem, a priorização e seleção automática de compostos promissores ainda é um problema em aberto. Portanto, neste trabalho, abordamos esse problema a partir de duas perspectivas. Primeiramente, no aspecto descritivo, propomos o nAPOLI (Analysis of Protein-Ligand Interactions), um servidor web que combina análises em larga escala de interações conservadas em complexos proteína-ligante a nível atômico, representações visuais interativas e relatórios detalhados sobre resíduos/átomos que interagem com a proteína. No aspecto preditivo, propomos LUNA e Functional Interaction FingerPrint (FIFP). LUNA é uma nova biblioteca Python para a descoberta de fármacos que permite a análise de qualquer complexo molecular e reúne várias funções para filtrar e visualizar interações. Por sua vez, FIFP é um novo fingerprint de interação do tipo hash que codifica complexos moleculares e suas interações como fingerprints binários ou de contagem. FIFP também fornece vários recursos interativos e visuais para simplificar a análise de informações dos fingerprints. Para validar e ilustrar a aplicabilidade do FIFP, primeiro apresentamos uma avaliação exploratória de seus parâmetros, seguida de um estudo de caso onde treinamos diferentes modelos de aprendizado de máquina para reproduzir as pontuações de docking observadas em um conjunto de dados composto por 86.641 moléculas em complexo com o receptor Dopamina D4. Em seguida, comparamos os modelos obtidos com quatro fingerprints concorrentes (ECFP, FCFP, SILIRID e PLEC). FIFP superou as abordagens concorrentes com um R2 médio de 0,55. Portanto, vislumbramos LUNA e FIFP como estratégias promissoras para campanhas de SBVS e aprendizado de máquina.
Assunto:	Biologia computacional Reconhecimento molecular Fármacos Análise visual Receptores de Dopamina D4
Idioma:	eng
País:	Brasil
Editor:	Universidade Federal de Minas Gerais
Sigla da Instituição:	UFMG
Departamento:	ICB - DEPARTAMENTO DE BIOQUÍMICA E IMUNOLOGIA
Curso:	Programa de Pós-Graduação em Bioinformatica
Tipo de Acesso:	Acesso Aberto
metadata.dc.rights.uri:	http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI:	http://hdl.handle.net/1843/53640
Data do documento:	7-Nov-2019
Aparece nas coleções:	Teses de Doutorado

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Thesis___Corrected_with_new_guidelines.pdf		39.8 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons