Mineração de dados usando álgebra linear para a predição de alvos drogáveis

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Primeiro orientador

Membros da banca

Vasco Ariston de Carvalho Azevedo
Marcelo Matos Santoro
Lucas Bleicher
Marcos Augusto dos Santos
Roney Santos Coimbra

Resumo

Apresenta-se o desenvolvimento de um método para recuperar proteínas que são alvos drogáveis. A partir da representação desses alvos como vetores definidos a partir das anotações do InterPro, instrumentos da álgebra linear relacionados com a decomposição por valores singulares são utilizados para organizar semanticamente o espaço vetorial e permitir a recuperação eficiente das proteínas similares a uma dada consulta. Relações não observadas prima facie são descortinadas indicando, oportunidades para reposicionamento de fármacos conhecidos, estratégias para o desenvolvimento racional de novos compostos e a predição de potenciais alvos drogáveis e de efeitos colaterais latentes. As assinaturas do InterPro mais relevantes para discriminar alvos drogáveis e não-drogáveis foram determinadas por regressão logística. Os resultados são avaliados estatisticamente por análise de curvas ROC e dados corroborados em outros trabalhos.

Abstract

This work presents the development of a method for recovering target proteins that are druggable. From the representation of drug targets defined as vectors by using InterPro annotations, tools of linear algebra related to singular value decomposition are used to organize the semantic vector space and allow the efficient recovery of proteins related to a given query. Not prima facie relationships arise and indicate drug repositioning opportunities, rational development strategies and, the prediction of potential druggable targets and latent side-effects. The InterPro signatures which are most relevant to drug target/non-drug target discriminating were selected by logistic regression. The results are statistically evaluated by ROC curves analysis and data corroborated in the literature.

Assunto

Reposicionamento de medicamentos, Descoberta de drogas, Bioinformática, Predição (Lógica), Mineração de dados (Computação), Álgebra linear

Palavras-chave

Descoberta de medicamento, Desenvolvimento de medicamento, Estudo de caso-controle, Decomposição por valores singulares, Reposicionamento de medicamento, Regressão logística, Predição, Álgebra linear, de alvos drogáveis, Mineração de dados, Recuperação de informação latente, Indexação semântica latente

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por