Cluster: um software para auxílio em estudos de dados biológicos

dc.creatorCristiano Luiz Silva Tavares
dc.date.accessioned2019-08-10T05:57:05Z
dc.date.accessioned2025-09-08T23:24:04Z
dc.date.available2019-08-10T05:57:05Z
dc.date.issued2015-11-16
dc.description.abstractThe ever increasing availability of biological data gives rise to two problems: (i) data storage and management and (ii) the extraction of useful information from these data. The latter problem is one of the main challenges in computational biology, and requires the development of tools and methods capable of transforming all these heterogeneous data into biological knowledge. Part of this knowledge involves determining variations in gene expression on biological data. Studies on biological data have contributed to the development of new techniques in agriculture, animal farming, in the treatment of diseases and in the development of policies for the preservation of endangered animal and plant species. Thus, this paper proposes a software, named Cluster, to assist research on genetic diversity. Cluster acts directly on the feature selection step of the classification problem. Cluster is able to optimize the quantity and quality of the features used to group individuals. The simple interface of the Cluster software helps its configuration and the presentation of clear results. The software is tested on databases with different properties. The specificity, sensitivity, efficiency and accuracy of the classification are metrics used to validate the feature selection mechanism proposed in Cluster. Tests performed on the software include: the determination of alleles for distinguishing sea turtles and their hybrids; the determination of genomic features for classification gastric cancer tissue and determination of morphological features for classification wheat seeds.
dc.identifier.urihttps://hdl.handle.net/1843/RAOA-BAPRBR
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectBiologia Computacional
dc.subjectEngenharia elétrica
dc.subjectAglomeração
dc.subjectReconhecimento de padrões
dc.subject.otherSeleção de características
dc.subject.otherDados biológicos
dc.subject.otherClustering
dc.subject.otherReconhecimento de padrões
dc.subject.otherOtimização
dc.titleCluster: um software para auxílio em estudos de dados biológicos
dc.typeDissertação de mestrado
local.contributor.advisor1Adriano Vilela Barbosa
local.contributor.referee1Antonio de Padua Braga
local.contributor.referee1Hani Camille Yehia
local.contributor.referee1Fabricio Rodrigues dos Santos
local.description.resumoCom crescimento acelerado da quantidade de dados de origem biológica, surgem dois problemas: (i) o armazenamento e gestão de dados e (ii) a extração de informações a partir destes dados. O segundo problema é um dos principais desafios na biologia computacional, o que requer desenvolvimento de ferramentas e métodos capazes de transformar todos esses dados heterogêneos em conhecimento biológico. Parte deste conhecimento envolve determinar variações de expressões gênicas de dados biológicos. Descobrir o significado das expressões gênicas tem contribuído no desenvolvimento de técnicas na agricultura, na pecuária, no tratamento de doenças e em políticas de preservação de espécies de animais e plantas ameaçados de extinção. Desde modo, este trabalho propõe um software, intitulado Cluster, para auxiliar pesquisas em dados biológicos. Cluster atua diretamente na seleção de características, ou expressões gênicas, para a classificação de grupos de amostras. Cluster é capaz de otimizar a quantidade e a qualidade de características responsáveis para o agrupamento de indivíduos. A interface simples do software Cluster contribui de forma a facilitar sua configuração e apresentação de resultados claros. O software é testado em bases de dados com propriedades distintas. A especificidade, sensibilidade, eficiência e acurácia de classificação das amostras são métricas utilizadas para validar a seleção de características proposta em Cluster. Dentre os testes realizados destaca-se a determinação de alelos na distinção de tartarugas marinhas e seus híbridos, a determinação de características genômicas na distinção de tecidos gástricos cancerosos e a determinação de características morfológicas para a distinção de sementes de trigo.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
disserta__o_cristiano.pdf
Tamanho:
1.96 MB
Formato:
Adobe Portable Document Format