Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/78503
Type: | Dissertação |
Title: | Avaliação do potencial preditivo de assinaturas estruturais na identificação de interações proteína-peptídeo |
Other Titles: | Assessing the predictive potential of structural signatures for protein-peptide interaction identification |
Authors: | Giovana de Castro Fiorini Maia |
First Advisor: | Raquel Cardoso de Melo Minardi |
First Referee: | Maria Goreti de Almeida Oliveira |
Second Referee: | Sabrina de Azevedo Silveira |
Abstract: | As interações entre proteínas e peptídeos desempenham papeis vitais no funcionamento do organismo humano. Estudos in silico baseados em inteligência artificial que buscam compreender melhor essas interações são fundamentais para desenvolvimento de terapias baseadas em peptídeos. Entretanto, predizer interações proteína-peptídeo ainda é um desafio para a bioinformática estrutural devido principalmente à flexibilidade do peptídeo e a dificuldade em desenvolver métricas mais precisas para ranquear as posições esperadas dos ligantes no docking molecular. Neste trabalho buscamos avaliar o potencial preditivo de assinaturas estruturais na identificação de interações proteína-peptídeo, utilizando modelos de aprendizado de máquina. Para isso, o trabalho foi dividido em quatro partes: I. Avaliação de três ferramentas de docking e modelagem molecular para complexos proteína-peptídeo: HPEPDOCK, HDOCK e AlphaFold Multimer, II.Comparação da modelagem de peptídeos nas formas holo e apo utilizando o AlphaFold Multimer, III. Desenvolvimento de modelos de aprendizado de máquina para predição de complexos proteína-peptídeo reais e falsos, utilizando assinaturas estruturais da interface proteína-peptídeo, e IV. Desenvolvimento de modelos de aprendizado de máquina para predição de interação proteína-peptídeo, usando assinaturas estruturais da interface da proteína, e do peptídeo concatenadas. Os principais resultados revelam que as três ferramentas comparadas (HPEPDOCK, HDOCK e AlphaFold Multimer) obtiveram resultados próximos para a modelagem de complexos, conseguindo distinguir bem complexos reais de complexos falsos, sendo o HPEPDOCK a ferramenta que obteve maior mediana de valor de DockQ quando comparados os complexos preditos com os complexos experimentais (mediana de DockQ = 0.935). Em relação à comparação dos peptídeos na forma holo e apo, as modelagens ficaram semelhantes, com média de RMSD igual a 0.214. Desenvolvemos também modelos de classificação de complexos reais e falsos e obtivemos, para o melhor modelo F1-score de 0.741, usando Redes Neurais. Por fim, para os modelos de predição de interação proteína-peptídeo, obtivemos F1-score de 0.930 para o melhor modelo gerado com o algoritmo Gradient Boosting. Em resumo, as assinaturas estruturais se mostraram ferramentas úteis para treinar modelos de predição de interação proteína-peptídeo, e os modelos criados podem ser utilizados para facilitar a triagem virtual, auxiliando no desenvolvimento de terapias e fármacos baseados em peptídeos. |
Abstract: | Protein-peptide interactions are essential for the proper functioning of the human body, playing crucial roles in various biological processes. In silico studies based on artificial intelligence have become fundamental for the development of peptide-based therapies. However, predicting these interactions remains a challenge in structural bioinformatics, primarily due to the intrinsic flexibility of peptides and the difficulty in developing more accurate metrics for ranking the expected positions of ligands in molecular docking. In this study, we evaluated the predictive potential of structural signatures in identifying protein-peptide interactions using machine learning models. The dissertation is structured into four main parts: I. Evaluation of three docking and molecular modeling tools for protein-peptide complexes: HPEPDOCK, HDOCK, and AlphaFold Multimer; II. Comparison of peptide modeling in holo and apo forms using AlphaFold Multimer; III. Development of machine learning models for predicting real and fake protein-peptide complexes using structural signatures of the protein-peptide interface; and IV. Development of machine learning models for predicting protein-peptide interactions using concatenated structural signatures from protein interface and peptide. The main results indicate that the three docking tools evaluated (HPEPDOCK, HDOCK, and AlphaFold Multimer) showed similar performances in complex modeling, effectively distinguishing real complexes from false ones. HPEPDOCK stood out with the highest median DockQ score (0.935) when comparing predicted complexes with experimental ones. In the comparison between peptides modeled in holo and apo forms, the results were similar, with an average RMSD of 0.214. Machine learning models for classifying real and fake complexes were developed, achieving an F1-score of 0.741 for the best model, using Neural Networks. Additionally, for protein-peptide interaction prediction, the best model developed with the Gradient Boosting algorithm achieved an F1-score of 0.930. In summary, structural signatures proved to be valuable tools for training protein-peptide interaction prediction models. The developed models can be used to facilitate virtual peptide screening, contributing to the development of new peptide-based therapies and drugs. |
Subject: | Bioinformática Aprendizado de Máquina Peptídeos Proteínas |
language: | por |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Bioinformatica |
Rights: | Acesso Aberto |
URI: | http://hdl.handle.net/1843/78503 |
Issue Date: | 10-Sep-2024 |
Appears in Collections: | Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
dissertacaoGiovanaFiorini.pdf | 3.06 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.