Uso da base de dados decundária KOG como ferramenta para caracterização de expressão gênica e mineração de dados em projetos transcriptoma

dc.creatorMauricio de Alvarenga Mudado
dc.date.accessioned2019-08-14T10:17:19Z
dc.date.accessioned2025-09-09T00:01:37Z
dc.date.available2019-08-14T10:17:19Z
dc.date.issued2007-07-12
dc.description.abstractA set of new results, techniques and tools are presented in this work for datamining and to help in the analysis of Expressed Sequence Tags (EST)generated by transcriptome projects. The secondary database KOG wasutilized as a tool in the alignment and automatic annotation of ESTs from fourorganisms, A. thaliana, C. elegans, D. melanogaster e H. sapiens. Thesealignments were utilized to many purposes and in many experiments, like:inference of similarity cutoffs utilizing tBLASTn with ESTs and proteins from the same organism; development of an annotation test with EST and KOGproteins; evaluation of the quality of annotation by using the cutoff valuesdiscovered; evaluation of the quality of annotation by using uniques generatedby the TGICL software; functional characterization of ESTs with KOG; evaluation of KOG coverage with incremental EST number and inference of aminimal number of EST to cover it; creation of a web tool named K-EST thatmakes available the EST sampling data with KOG and also the conservationdata among KOG clusters; inference of gene loss, or at least loss of geneexpression in organisms belonging or not to the KOG database, by using ESTsampling data and conservation.
dc.identifier.urihttps://hdl.handle.net/1843/GRFO-7DYQ2Z
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectBioinformática
dc.subjectSequência de nucleotídios
dc.subjectMineração de dados (Computação)
dc.subjectExpressão gênica
dc.subject.otherExpressão Gênica
dc.subject.otherKOG
dc.subject.otherBase de Dados
dc.subject.otherTranscriptoma
dc.titleUso da base de dados decundária KOG como ferramenta para caracterização de expressão gênica e mineração de dados em projetos transcriptoma
dc.typeTese de doutorado
local.contributor.advisor1Jose Miguel Ortega
local.contributor.referee1Glaura da Conceicao Franco
local.contributor.referee1Gloria Regina Franco
local.contributor.referee1Arthur Gruber
local.contributor.referee1Sandro José de Souza
local.description.resumoSão apresentados neste trabalho um conjunto de novos resultados, técnicas eferramentas destinadas à mineração de dados e ao auxílio na análise deEtiquetas de Seqüências Expressas (EST) geradas em projetos transcriptoma.A base de dados de proteínas secundárias KOG foi utilizada como ferramenta no alinhamento e anotação automática de seqüências EST de quatroorganismos, A. thaliana, C. elegans, D. melanogaster e H. sapiens. Estesalinhamentos foram utilizados para diversos fins e em diversos experimentos,entre eles: inferência de valores de corte para similaridade utilizandotBLASTn entre seqüências de EST e proteínas do mesmo organismo;desenvolvimento de um teste de anotação entre EST e proteínas KOG;avaliação da qualidade da anotação usando os valores de corte inferidos;avaliação da qualidade da anotação utilizando uniques gerados pelo programaTGICL; caracterização funcional das EST com KOG; caracterização daamostragem de EST ou expressão gênica com KOG; avaliação da cobertura dabase KOG por quantidades incrementais de EST e inferência de um númeromínimo para cobri-la; criação de uma ferramenta web denominada K-EST, que disponibiliza dados de amostragem de EST por KOG e também deconservação entre agrupamentos KOG; inferência de perda de genes ou pelomenos de expressão gênica em organismos pertencentes ou não à base KOG,utilizando dados de amostragem de EST e conservação.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese_mauricio_mudado_julho_2007.pdf
Tamanho:
4.74 MB
Formato:
Adobe Portable Document Format