GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação

dc.creatorCharles Abreu Santana
dc.date.accessioned2023-03-22T14:55:45Z
dc.date.accessioned2025-09-09T00:33:55Z
dc.date.available2023-03-22T14:55:45Z
dc.date.issued2021-08-31
dc.description.abstractProteins are macromolecules crucial for the maintenance of biological systems and participate in vital processes for the cell. Protein activity is performed through physicochemical interactions between the protein and other molecules called ligands. These ligands comprise organic compounds, metal ions, nucleic acids or even other proteins, in which attach to the protein so that its activity is properly performed. The region on the protein where these interactions take place is called binding sites. The identification and characterization of these regions is crucial to determine the function of a protein, which is one of the necessary steps in areas such as the design and development of new drugs. Due to experimental issues, the location of these regions may not be trivial, requiring the support of automatic methods to assist in their identification. In this thesis, the GRaSP is proposed, a machine learning-based strategy for binding site prediction that uses residue neighborhood graphs as input. From experiments using databases of different protein structures, GRASP proved to be robust, presenting compatible or better results in relation to the tools already consolidated in the literature. Furthermore, due to the simple and informative modeling provided by the graphs, the algorithm proved to be efficient. While already consolidated methods take around 5 hours of processing for protein structures with approximately 300 residues, the GRASP is able to process them in an average time of 20 seconds.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/51121
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/pt/
dc.subjectProteína
dc.subjectSítio de ligação
dc.subjectGrafo
dc.subjectAprendizagem supervisionada
dc.subject.otherBiologia computacional
dc.subject.otherProteínas
dc.subject.otherSítios de ligação
dc.subject.otherTeoria dos grafos
dc.subject.otherAprendizado de máquina supervisionado
dc.titleGRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
dc.typeTese de doutorado
local.contributor.advisor-co1Raquel Cardoso de Melo Minardi
local.contributor.advisor1Sabrina de Azevedo Silveira
local.contributor.advisor1Latteshttp://lattes.cnpq.br/0899817111748167
local.contributor.referee1Maria Goreti de Almeida Oliveira
local.contributor.referee1Lucas Bleicher
local.contributor.referee1Mariana Torquato Quezado de Magalhaes
local.contributor.referee1Carlos Henrique da Silveira
local.creator.Latteshttp://lattes.cnpq.br/3259792549323232
local.description.resumoAs proteínas são macromoléculas importantes para a manutenção dos sistemas biológicos e que participam de processos vitais para a célula. A atividade proteica é desempenhada através de interações físico-químicas entre a proteína com outras moléculas denominadas ligantes. Sejam compostos orgânicos, íons metálicos, ácidos nucleicos ou até mesmo outras proteínas, os ligantes acoplam-se à proteína para que sua atividade seja devidamente desempenhada. A região na proteína onde essas interações ocorrem são chamadas de sítios de ligação. A identificação e caracterização dessas regiões é de suma importância para determinar a função de uma proteína, que é uma das etapas necessárias em áreas como o planejamento e desenvolvimento de novos fármacos. Devido a questões experimentais, a localização dessas regiões pode não ser trivial, sendo necessário o apoio de métodos automáticos para auxiliar na sua identificação. Nesta tese é proposto o GRaSP, uma estratégia baseada em aprendizagem de máquina para previsão de sítio de ligação que utiliza como insumo grafos de vizinhança de resíduo. A partir de experimentos usando bases de dados de estruturas de proteínas diversas, o GRaSP demonstrou ser robusto, apresentando resultados compatíveis ou superiores em relação às ferramentas já consolidadas pelas literatura. Além disso, devido à modelagem simples e informativa disponibilizada pelos grafos, o algoritmo mostrou-se eficiente. Enquanto métodos já consolidados levam em torno de 5 horas de processamento, em seus servidores, para estruturas de proteínas com aproximadamente 300 resíduos, o GRaSP é capaz de processá-las com um tempo médio de 20 segundos.
local.publisher.countryBrasil
local.publisher.departmentICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Bioinformatica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
final.pdf
Tamanho:
6.2 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: