Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/RAOA-BAPRBR
Type: Dissertação de Mestrado
Title: Cluster: um software para auxílio em estudos de dados biológicos
Authors: Cristiano Luiz Silva Tavares
First Advisor: Adriano Vilela Barbosa
First Referee: Antonio de Padua Braga
Second Referee: Hani Camille Yehia
Third Referee: Fabricio Rodrigues dos Santos
Abstract: Com crescimento acelerado da quantidade de dados de origem biológica, surgem dois problemas: (i) o armazenamento e gestão de dados e (ii) a extração de informações a partir destes dados. O segundo problema é um dos principais desafios na biologia computacional, o que requer desenvolvimento de ferramentas e métodos capazes de transformar todos esses dados heterogêneos em conhecimento biológico. Parte deste conhecimento envolve determinar variações de expressões gênicas de dados biológicos. Descobrir o significado das expressões gênicas tem contribuído no desenvolvimento de técnicas na agricultura, na pecuária, no tratamento de doenças e em políticas de preservação de espécies de animais e plantas ameaçados de extinção. Desde modo, este trabalho propõe um software, intitulado Cluster, para auxiliar pesquisas em dados biológicos. Cluster atua diretamente na seleção de características, ou expressões gênicas, para a classificação de grupos de amostras. Cluster é capaz de otimizar a quantidade e a qualidade de características responsáveis para o agrupamento de indivíduos. A interface simples do software Cluster contribui de forma a facilitar sua configuração e apresentação de resultados claros. O software é testado em bases de dados com propriedades distintas. A especificidade, sensibilidade, eficiência e acurácia de classificação das amostras são métricas utilizadas para validar a seleção de características proposta em Cluster. Dentre os testes realizados destaca-se a determinação de alelos na distinção de tartarugas marinhas e seus híbridos, a determinação de características genômicas na distinção de tecidos gástricos cancerosos e a determinação de características morfológicas para a distinção de sementes de trigo.
Abstract: The ever increasing availability of biological data gives rise to two problems: (i) data storage and management and (ii) the extraction of useful information from these data. The latter problem is one of the main challenges in computational biology, and requires the development of tools and methods capable of transforming all these heterogeneous data into biological knowledge. Part of this knowledge involves determining variations in gene expression on biological data. Studies on biological data have contributed to the development of new techniques in agriculture, animal farming, in the treatment of diseases and in the development of policies for the preservation of endangered animal and plant species. Thus, this paper proposes a software, named Cluster, to assist research on genetic diversity. Cluster acts directly on the feature selection step of the classification problem. Cluster is able to optimize the quantity and quality of the features used to group individuals. The simple interface of the Cluster software helps its configuration and the presentation of clear results. The software is tested on databases with different properties. The specificity, sensitivity, efficiency and accuracy of the classification are metrics used to validate the feature selection mechanism proposed in Cluster. Tests performed on the software include: the determination of alleles for distinguishing sea turtles and their hybrids; the determination of genomic features for classification gastric cancer tissue and determination of morphological features for classification wheat seeds.
Subject: Biologia Computacional
Engenharia elétrica
Aglomeração
Reconhecimento de padrões
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/RAOA-BAPRBR
Issue Date: 16-Nov-2015
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
disserta__o_cristiano.pdf2 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.