Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/53640
Type: Tese
Title: Prioritizing promising compounds in virtual screening campaigns
Other Titles: Priorizando compostos promissores em campanhas de triagem virtual
Authors: Alexandre Victor Fassio
First Advisor: Raquel Cardoso de Melo Minardi
First Co-advisor: Rafaela Salgado Ferreira
First Referee: João Paulo Ataide Martins
Second Referee: Lucas Bleicher
Third Referee: Rafael Victorio Carvalho Guido
metadata.dc.contributor.referee4: Leonardo Henrique Franca de Lima
Abstract: Structural-based virtual screening (SBVS) contributes significantly to early-stage drug discovery. However, SBVS commonly depends on a thorough manual process of hit selection. Despite the existence of several semi-automatic works that propose rescoring and filtering methods, the prioritization and automatic selection of promising compounds are still an open problem. Therefore, we tackle this problem from two perspectives. First, in the descriptive aspect, we propose nAPOLI (Analysis of PrOtein-Ligand Interactions), a web server that combines large-scale analysis of conserved interactions in protein-ligand complexes at the atomic level, interactive visual representations, and comprehensive reports of the interacting residues/atoms to detect and explore conserved non-covalent interactions. In the predictive aspect, we propose LUNA and Functional Interaction FingerPrint (FIFP). LUNA is a novel Python library for drug design that permits the analysis of any molecular complex and brings together several functions for filtering and visualizing interactions. In its turn, FIFP is a novel hashed interaction fingerprint inspired by ECFP that encodes molecular complexes and their interactions either as a binary or count fingerprint. FIFP also provides several interactive and visual features to simplify fingerprint information analysis. To validate and illustrate the applicability of FIFP, we first present an exploratory evaluation of its parameters, followed by a case study where we trained different machine learning models to reproduce the observed docking scores in a data set consisting of 86,641 molecules docked against Dopamine D4. We then compared the obtained models to four competing fingerprints (ECFP, FCFP, SILIRID, and PLEC). FIFP outperformed the competing approaches with an R² of 0.55. Therefore, we envision LUNA and FIFP as promising strategies for SBVS campaigns and machine learning.
Abstract: A triagem virtual baseada na estrutura (SBVS) contribui significativamente para as etapas iniciais da descoberta de fármacos. No entanto, o SBVS geralmente depende de um processo bastante trabalhoso que consiste na seleção manual de compostos hits. Apesar da existência de vários trabalhos semiautomáticos que propõem métodos de rescoring e filtragem, a priorização e seleção automática de compostos promissores ainda é um problema em aberto. Portanto, neste trabalho, abordamos esse problema a partir de duas perspectivas. Primeiramente, no aspecto descritivo, propomos o nAPOLI (Analysis of Protein-Ligand Interactions), um servidor web que combina análises em larga escala de interações conservadas em complexos proteína-ligante a nível atômico, representações visuais interativas e relatórios detalhados sobre resíduos/átomos que interagem com a proteína. No aspecto preditivo, propomos LUNA e Functional Interaction FingerPrint (FIFP). LUNA é uma nova biblioteca Python para a descoberta de fármacos que permite a análise de qualquer complexo molecular e reúne várias funções para filtrar e visualizar interações. Por sua vez, FIFP é um novo fingerprint de interação do tipo hash que codifica complexos moleculares e suas interações como fingerprints binários ou de contagem. FIFP também fornece vários recursos interativos e visuais para simplificar a análise de informações dos fingerprints. Para validar e ilustrar a aplicabilidade do FIFP, primeiro apresentamos uma avaliação exploratória de seus parâmetros, seguida de um estudo de caso onde treinamos diferentes modelos de aprendizado de máquina para reproduzir as pontuações de docking observadas em um conjunto de dados composto por 86.641 moléculas em complexo com o receptor Dopamina D4. Em seguida, comparamos os modelos obtidos com quatro fingerprints concorrentes (ECFP, FCFP, SILIRID e PLEC). FIFP superou as abordagens concorrentes com um R2 médio de 0,55. Portanto, vislumbramos LUNA e FIFP como estratégias promissoras para campanhas de SBVS e aprendizado de máquina.
Subject: Biologia computacional
Reconhecimento molecular
Fármacos
Análise visual
Receptores de Dopamina D4
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICB - DEPARTAMENTO DE BIOQUÍMICA E IMUNOLOGIA
metadata.dc.publisher.program: Programa de Pós-Graduação em Bioinformatica
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/53640
Issue Date: 7-Nov-2019
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Thesis___Corrected_with_new_guidelines.pdf39.8 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons