Protein Classification Tool: uma ferramenta para anotação de proteínas utilizando bases secundárias

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Marcos Augusto dos Santos
Alessandra Conceicao Faria Aguiar Campos

Resumo

Apesar do grande desenvolvimento das técnicas de seqüenciamento genético (digitalização do material genético) observado nos últimos tempos e do conseqüente crescimento dos bancos de dados de seqüências, a capacidade de análise dessas seqüências não conseguiu acompanhar esse desenvolvimento. Visto que seqüências não identificadas ou com identificação incorreta são de limitada utilidade científica, este trabalho tem como objetivo tratar esse problema por meio da criação de uma ferramenta que, mediante a integração de diversas funcionalidades de anotação, facilita o processo de anotação (identificação) de seqüências genéticas ao mesmo tempo que permite a obtenção de melhores resultados. A ferramenta descrita neste trabalho, a 'Protein Classification Tool', implementa as seguintes funcionalidades: comparação usando BLAST com diversas bases secundárias (GOA, COG/KOG e bases do CGAP) e o NR, análise de domínios e análise filogenética. Neste trabalho ainda se define um 'framework' para permitir a extensibilidade da ferramenta por meio da adição de bases secundárias e novas funcionalidades, de modo a permitir que a ela se mantenha atualizada, acompanhando os avanços no processo de anotação.

Abstract

Despite the great advances in genetic sequencing technology digitization of genetic material observed recently, which resulted in an exponential growth of the amount of data in sequence databases, the ability to properly analyze these sequences could not match this growth. As sequences that lack functional annotation (identification) or with incorrect annotation are of limited use to researchers, this work targets this problem by creating a tool, 'Protein Classification Tool' (PCT), that by the integration of several annotation functionalities eases the process of sequence annotation at the same time that allows the obtention of more accurate results. The PCT implements the following functionalities: BLAST sequence comparison against several secondary databases (GOA, COG/KOG and CGAP databases), domain analysis and phylogenetic analysis. Moreover, this work defines a framework so that other secondary databases and annotation functionalities may be added to the tool, in order to keep it up-to-date with new annotation techniques.

Assunto

Genomas, Bioinformática, Computação, Proteinas celulares

Palavras-chave

pct, anotação de proteínas

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por