Desenvolvimento de um pipeline de predição e análise de rede de interação proteina-proteina com aplicação no patossistema soja-ferrugem

dc.creatorGustavo Simões Carnivali
dc.date.accessioned2024-10-14T18:14:40Z
dc.date.accessioned2025-09-09T01:32:58Z
dc.date.available2024-10-14T18:14:40Z
dc.date.issued2024-06-24
dc.description.abstractMolecular biological networks are important for providing interactions between elements of a cell or communication between two or more organisms. Different computational approaches can be used to predict and cluster these networks. In this thesis, network prediction and analysis approaches were established to study the interactions between proteins from two different organisms, using integration of different bioinformatics programs. This established approach was applied to study the interaction of a pathogenic fungus with soybeans. Brazil is the world's largest producer of soybeans ($Glycine$ $max$), this crop is also the main contributor to Brazilian GDP associated with agribusiness, worldwide soybean trade generates around 200 billion dollars per year. Asian soybean rust, caused by the biotrophic fungus Phakopsora Pachyrhizi, is the most important disease in this crop, it is estimated that it has already caused losses of around 150 billion dollars worldwide. Proteins play a key role in the biological processes of organisms, including the interaction interface between pathogens and their hosts, promoting processes such as infection. In this way, understanding the interaction between pathogen proteins and host proteins can allow the development of new methods and approaches such as controlling Asian soybean rust. In this project, a protein-protein interaction network approach was applied specifically to the infection of $Glycine$ $max$ by $Phakopsora$ $pachyrhizi$ to identify probable effector proteins of the fungus. Initially, protein sequences predicted based on the reference genome of G. $max$ and P. $pachyrhizi$ were retrieved from public databases and aligned with protein sequences from public portals such as STRING. In-house scripts were produced to identify potential interaction pairs between proteins, using high-confidence interactions described in several portals, followed by calculation of interaction probability index and integration of data from protein subcellular localization predictors and expression data genes generated by RNASeq methodology during a G. max-P. interaction. pachyrhizi. The network will also be expanded with data from other public protein-protein interaction databases. To date, the interactions found have been modeled in the format of complex networks, which allows the application of techniques for mining and identifying key proteins in the infection process. The objective of this project is also the structural modeling of selected proteins based on the network to study the molecular mechanisms associated with the interaction interface.
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.identifier.urihttps://hdl.handle.net/1843/77419
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/pt/
dc.subjectBioinformática
dc.subjectSoja
dc.subjectFerrugem
dc.subjectPhakopsora Pachyrhizi
dc.subjectInterações Hospedeiro-Patógeno
dc.subject.otherAssociações proteicas
dc.subject.otherRedes de interações proteicas
dc.subject.otherGlycine max
dc.subject.otherPhakopsora Pachyrhizi
dc.titleDesenvolvimento de um pipeline de predição e análise de rede de interação proteina-proteina com aplicação no patossistema soja-ferrugem
dc.title.alternativeDevelopment of a pipeline for prediction and analysis of protein-protein interaction networks with application in the soybean-rust pathosystem
dc.typeTese de doutorado
local.contributor.advisor-co1Edson Mario de Andrade Silva
local.contributor.advisor1Tiago Antonio de Oliveira Mendes
local.contributor.advisor1Latteshttp://lattes.cnpq.br/6003001459902104
local.contributor.referee1José Miguel Ortega
local.contributor.referee1Carlos Cristiano Hasenclever Borges
local.contributor.referee1José Cleydson Ferreira da Silva
local.contributor.referee1Isabel Samila Lima Castro
local.creator.Latteshttp://lattes.cnpq.br/6514216871020126
local.description.resumoRedes biológicas moleculares são importantes para propiciar interações entre elementos de uma célula ou comunicação entre dois ou mais organismos. Diferentes abordagens computacionais podem ser utilizadas para realizar predição e agrupamento destas redes. Nesta tese, abordagens de predição e análise de redes foram estabelecidas para estudo das interações entre proteínas de dois diferentes organismos, utilizando integração de diferentes programas de bioinformática. Esta abordagem estabelecida foi aplicada para estudo da interação de um fungo patogênico com soja. O Brasil é o maior produtor mundial de soja ($Glycine$ $max$), esta cultura é também a principal contribuinte para o PIB brasileiro associado ao agronegócio, no mundo o comércio de soja movimenta cerca de 200 bilhões de dólares por ano. A ferrugem asiática da soja, causada pelo fungo biotrófico $Phakopsora$ $Pachyrhizi$, é a doença de maior importância nesta cultura, estima-se que ela já causou um prejuízo de cerca de 150 bilhões de dólares em todo o mundo. Proteínas desenvolvem um papel chave nos processos biológicos dos organismos, incluindo a interface de interação entre patógeno e seus hospedeiros, propiciando o processo como o de infeção. Desta forma, entender a interação entre proteínas do patógeno e proteínas do hospedeiro pode permitir o desenvolvimento de novos métodos e abordagens como o de controle da ferrugem asiática da soja. Neste projeto foi aplicada abordagem de redes de interação proteína-proteína especificamente na infecção da Glycine max pelo Phakopsora pachyrhizi para identificação de prováveis proteínas efetoras do fungo. Inicialmente, as sequências de proteínas preditas com base no genoma de referência de G. max e P. pachyrhizi foram recuperadas de bancos de dados públicos e alinhados com sequências de proteínas de portais públicos como o STRING. Scripts in house foram produzidos para identificar os potenciais pares de interação entre proteínas, utilizando as interações de alta confiança descritas em diversos portais, seguindo por cálculo de índice de probabilidade de interação e integração de dados de preditores de localização subcelular de proteínas e dados de expressão gênica gerados por metodologia de RNASeq durante um a interação G. max-P. pachyrhizi. A rede também será expandida com dados de outros bancos de dados públicos de interação proteína-proteína. Até o momento, as interações encontradas foram modeladas no formato de redes complexas, que permite aplicação de técnicas para mineração e identificação de proteínas chaves no processo de infecção. Também é objetivo deste projeto a modelagem estrutural de proteínas selecionadas com base na rede para estudo dos mecanismos moleculares associados à interface de interação.
local.identifier.orcidhttps://orcid.org/0000-0002-2924-1452x
local.publisher.countryBrasil
local.publisher.departmentICB - DEPARTAMENTO DE BIOQUÍMICA E IMUNOLOGIA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Bioinformatica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese.pdf
Tamanho:
9.39 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: