Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/76020
Type: Dissertação
Title: Integração de algoritmos de aprendizado de máquina ao docking molecular para planejamento e realização de ensaios in vitro de inibidores da enzima enoil-ACP-redutase NAD(P)H-dependente (FabI) de Staphylococcus aureus e de Escherichia coli.
Other Titles: Integration of machine learning algorithms with molecular docking to design inhibitors for in vitro testing against the enoyl-ACP-reductase NAD(P)H-dependent enzyme (FabI) from Staphylococcus aureus and Escherichia coli.
Authors: Gabriel Corrêa Veríssimo
First Advisor: Vinícius Gonçalves Maltarollo
First Co-advisor: Débora Maria Abrantes Costa
First Referee: Rafaela Salgado Ferreira
Second Referee: Jadson Castro Gertrudes
Abstract: O desenvolvimento de bactérias multirresistentes é um problema de saúde no mundo todo. A Organização Mundial da Saúde (OMS) classifica as cepas de Escherichia coli resistentes a carbapenêmicos e as cepas de Staphylococcus aureus resistentes a meticilina ou vancomicina, respectivamente, como nível crítico e alto de prioridade para o desenvolvimento de antibacterianos. Métodos computacionais, como o docking molecular, estão acelerando o desenvolvimento de novos antibacterianos. Entretanto, a capacidade preditiva do docking pode ser aprimorada com o uso de algoritmos de aprendizado de máquina (ML). Nesse contexto, o objetivo com este trabalho foi de integrar modelos de ML com estudos de docking molecular visando melhorar a capacidade preditiva da inibição das enzimas FabI de S. aureus e E. coli, além de obter as enzimas FabI recombinantes das duas espécies para ensaios in vitro utilizando substâncias selecionadas por triagem virtual. Para isso, 2.352 protocolos de docking foram validados por redocking, crossdocking e curva ROC. Onze algoritmos de ML foram utilizados para gerar 220.856.328 modelos de classificação relacionando a atividade inibitória com os fingerprints de interação, calculados com base nas poses do docking. Os melhores modelos de cada enzima foram validados e selecionados com base em diversas métricas de classificação. Os três melhores modelos de cada proteína foram utilizados em uma triagem virtual para selecionar substâncias que foram testadas contra células de E. coli e S. aureus. Para obtenção das proteínas recombinantes, células Escherichia coli BL21(DE3) foram transformadas por eletroporação com plasmídeos pET28a-saFabI e pET29a-ecFabI, contendo a sequência codificante das proteínas de interesse. As células foram cultivadas a 37 ºC em meio Luria-Bertani suplementado com MgSO4 e canamicina. O IPTG foi adicionado para induzir a expressão por 18 horas a 18 ºC. A lise das células foi promovida por sonicação e a purificação das proteínas foi conduzida pelas cromatografias de afinidade, dessalinização e exclusão molecular. Ambas as proteínas foram obtidas com alto grau de pureza em sua forma tetramérica e estáveis. Em relação aos resultados dos modelos de aprendizado de máquina, foi possível obter, entre os três melhores modelos de cada enzima, valores de MCCint variando entre 0,567 e 0,846 e MCCext variando entre 0,638 e 1,000, com os algoritmos Support Vector Machine (SVM) e Multilayer Perceptron (MLP) resultando nos melhores valores e superando em diferentes métricas os resultados de docking. Esses modelos foram utilizados em uma triagem virtual, permitindo a obtenção de nove substâncias ativas nos ensaios in vitro contra as células de E. coli e S. aureus e os estudos de STD-NMR serão conduzidos para confirmar a interação dessas substâncias com as proteínas obtidas.
Abstract: The emergence of multidrug-resistant bacteria is a severe health problem worldwide. The World Health Organization (WHO) categorizes carbapenem-resistant strains of Escherichia coli and methicillin/vancomycin-resistant strains of Staphylococcus aureus as critical and high-level priorities for antibacterial drug development. Computational methods, as molecular docking, are accelerating the development of new antibacterials; however, predictability of molecular docking can be improved with machine learning (ML). In this context, the aim with this work is to integrate ML models with molecular docking studies to enhance predictive ability of ligand inhibitory activity against both S. aureus and E. coli FabI enzymes. Additionally, the aim is also to obtain recombinant FabI enzymes from both species for in vitro assays using compounds selected through virtual screening., and to obtain the S. aureus e E. coli FabI recombinant enzymes for in vitro assays with selected compounds based on ML-based virtual screening. Therefore, 2,352 docking protocols were validated using redocking, crossdocking, and ROC curve analyses. Eleven ML algorithms were deployed, generating 220,856,328 classification models correlating inhibitory activity with interaction fingerprints, calculated based on docking poses. We selected the best models for each enzyme using several classification metrics. The top three models for each protein were then utilized in a virtual screening to select substances that were subsequently tested against both E. coli and S. aureus cells. To obtain the recombinant proteins, we transformed Escherichia coli BL21(DE3) cells via electroporation with pET28a-saFabI and pET29a-ecFabI plasmids, each containing the coding sequences for the proteins of interest. These cells were cultured at 37 ºC in Luria-Bertani medium supplemented with MgSO4 and kanamycin. IPTG was used to induce expression for a duration of 18 hours at 18 ºC. Cell lysis was carried out by sonication, and protein purification was performed using affinity, desalting, and size exclusion chromatography. Both proteins were obtained in the form of highly pure and stable tetramers. With regard to the machine learning results, the top three models of each enzyme yielded MCCint values ranging from 0.567 to 0.846, and MCCext values ranging from 0.638 to 1.000. The Support Vector Machine (SVM) and Multilayer Perceptron (MLP) algorithms produced the best results, outperforming docking in all metrics These models were used in a virtual screening, allowing nine active compounds to be obtained in in vitro assays against E. coli and S. aureus cells. Subsequent STD-NMR studies will be conducted to verify the interaction of these substances with the obtained proteins.
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: FARMACIA - FACULDADE DE FARMACIA
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciências Farmacêuticas
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/76020
Issue Date: 31-Oct-2023
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
GabrielVerissimo_dissertacao.pdf10.78 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons