Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/34013
Type: Tese
Title: Método ágil de integração semântica de dados científicos baseado em ontologias
Authors: José Eugênio de Assis Goncalves
First Advisor: Marcello Peixoto Bax
First Referee: Paulo Pinheiro da Silva
Second Referee: Anísio Mendes Lacerda
Third Referee: Tatiane Cristina Moraes de Sousa
metadata.dc.contributor.referee4: Flávio Luis Cardeal Pádua
metadata.dc.contributor.referee5: Renato Rocha Souza
Abstract: Integrar dados gerados por pesquisas científicas é uma atividade cada vez mais importante para a evolução da Ciência de Dados. Tal integração pode ser realizada com o auxílio de esquemas de dados (modelos), que definem como estes devem ser compreendidos, relacionados e formatados, determinando como são organizados. Contudo, se por um lado esquemas de dados relacionais pré-definidos possam favorecer a sua integração, compartilhamento e reúso pelos membros de uma comunidade científica, por outro, retiram a flexibilidade de representação dos dados pelo pesquisador, já que este deve respeitar o esquema pré-definido, caso intencione compartilhar seus dados com a comunidade. A pesquisa visa explorar e propor uma forma de integrar dados que não se prende à rigidez de esquemas relacionais pré-definidos. Propõe-se a utilização de ontologias para permitir que cada estudo científico utilize um desenho conceitual próprio, e ainda mantenha a capacidade de integração e reúso dos dados coletados pelo estudo. A integração é obtida a partir dos conceitos comuns aos estudos, definidos formalmente por ontologias. Espera-se que o uso de ontologias contribua para a interoperabilidade de dados e sistemas. Ao invés de esquemas relacionais rígidos, utiliza-se estruturas canônicas em formato de triplas: ``sujeito'', ``predicado'' e ``objeto'',interligadas e constituindo um grafo. O objetivo da pesquisa é desenvolver um método iterativo para facilitar a realização do processo de integração semântica de dados produzidos durante pesquisas científicas. O método permite que o pesquisador conceba a ontologia de domínio (que integra os dados) em ciclos curtos de desenvolvimento, ao longo da pesquisa. Esta é a principal contribuição do método proposto. Ele dispensa o pesquisador de ter que desenvolver a ontologia de integração, para somente depois integrar os dados. Fundamentado na Agile Design Science Research Methodology, ele permite integrar os dados e evoluir a ontologia a cada ciclo, com a participação de todos os atores envolvidos. Durante a fase de validação dos resultados desta pesquisa, notou-se que a colaboração entre todos os envolvidos foi facilitada com o uso do método proposto, e as decisões puderam ser tomadas mais prontamente em vista do acesso precoce dos mesmos aos dados e informações integradas semanticamente, cuja análise foi realizada com o auxílio de artefatos elaborados para esta finalidade. O método foi validado, utilizando-se uma pesquisa que integrou dados socioeconômicos e ambientais com informações sobre casos de dengue e esquistossomose no Brasil.
Abstract: Integrating data generated by scientific research is an increasingly important activity for the evolution of Data Science. Such integration can be accomplished with the aid of data schemes (models), which define how they should be understood, related and formatted, determining how they are organized. However, if, on the one hand, predefined relational data schemes can favor their integration, sharing and reuse by members of a scientific community, on the other hand, they remove the flexibility of data representation by the researcher, since he must respect the pre-defined scheme if he intends to share your data with the community. The research aims to explore and propose a way to integrate data without the rigidity of pre-defined relational schemes. It is proposed to use ontologies to allow each scientific study to use its own conceptual design, and still maintain the ability to integrate and reuse the data collected by the study. The Integration is obtained from concepts common to studies, formally defined by ontologies. The use of ontologies is expected to contribute to the interoperability of data and systems. Instead of rigid relational schemes, canonical structures in the form of triples of ``subject'', ``predicate'' and ``object'' are used, interconnected and constituting a graph. The objective of the research is to develop an iterative method to facilitate the realization of the process of semantic integration of data produced during scientific research. The method allows the researcher to design the domain ontology (which integrates the data) in short development cycles, throughout the research. This is the main contribution of the proposed method. It frees the researcher from having to develop the integration ontology, only to later integrate the data. Based on the Agile Design Science Research Methodology, it allows integrating data and evolving ontology with each cycle, with the participation of all the actors involved. During the validation phase of the results of this research, it was noted that collaboration between all involved was facilitated with the use of the proposed method, and decisions could be made more readily in view of their early access to data and semantically integrated information, whose analysis was performed with the aid of artifacts designed for this purpose. The method was validated, using a survey that integrated socioeconomic and environmental data with information on cases of dengue and schistosomiasis in Brazil.
Subject: Ciência da informação
Ontologias (Recuperação da informação)
Web semântica
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ECI - ESCOLA DE CIENCIA DA INFORMAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Gestão e Organização do Conhecimento
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-sa/3.0/pt/
URI: http://hdl.handle.net/1843/34013
Issue Date: 3-Jul-2020
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_jeugenio___Vers_o_Final___Revis_o_defesa_A.pdfMétodo Ágil de Integração Semântica de Dados Científicos baseado em Ontologias3.23 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons