Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/32372
Type: Tese
Title: Reúso de recursos da web semântica para a construção de vocabulários controlados no contexto da ciência da informação
Other Titles: Reuse of resources from semantic web for the construction of controlled vocabularies in the context of information science
Authors: Helder Noel Monteiro Firmino
First Advisor: Gercina Ângela de Lima
First Referee: Benildes Coura Moreira dos Santos Maculan
Second Referee: Cristiane Mendes Netto
Third Referee: Marcello Peixoto Bax
metadata.dc.contributor.referee4: Maria Luiza de Almeida Campos
Abstract: Esta tese aborda como assunto o reúso de recursos da Web Semântica para a construção de instrumentos de representação do conhecimento, enquadrada na área da Biblioteconomia e Ciência da Informação (BCI). Com esta pesquisa, pretendeu-se explorar a literatura que abrange as áreas da BCI e da Ciência da Computação (CC) no que diz respeito à construção de vocabulários controlados (VC). A revisão de literatura mostrou que o reúso é reconhecido como sendo um importante passo na construção de VC. Com o reúso de recursos poupa-se tempo e esforço, ao invés de se começar a construção do zero e para além disso, promove a interoperabilidade entre agentes (humanos e máquinas). As metodologias de construção de VC que são mencionadas nesta tese citam o reúso como uma tarefa importante e que deve estar sempre presente no processo de construção de Sistemas de Organização do Conhecimento (SOC). No campo da BCI existem poucos métodos que recomendam de forma explícita o reúso dos recursos disponibilizados pela Web semântica. Para além da exploração dos assuntos relacionados com a representação do conhecimento, foi proposto um guia para auxiliar os profissionais da BCI na criação de instrumentos de representação do conhecimento e que foi batizado de OntoM4IS+ (método de reúso de recursos ontológicos e não-ontológicos para a ciência da informação). Foi baseado em diversas metodologias e também em boas práticas de modelagem de sistemas, promovendo a descrição dos dados a fim de facilitar a interoperabilidade entre agentes, propiciando deste modo, futuras reutilizações. Quanto à natureza, a pesquisa é aplicada, isto é, aquela pesquisa que não leva em conta apenas o entendimento fundamental, que é próprio da ciência básica, mas que se preocupa com as considerações de uso. Relativamente aos objetivos, a pesquisa é exploratória, e quanto à abordagem ao problema, ela é qualitativa. O método de investigação adotado foi a Design Science Research (DSR), método que tem uma abordagem qualitativa e que se insere no espectro do Pragmatismo. Relativamente aos procedimentos de coleta de dados, primeiramente foram definidas as palavras-chave que foram utilizadas para recuperação de documentos nas principais bases de dados nacionais (Portal de Periódicos da CAPES) e internacionais (Web of Science, RCAAP, Scopus, NDLTD). Posteriormente, foram combinadas outras técnicas de tratamento de dados como a grelha de leitura e para além disso, criou-se uma matriz de conceitos sobre todos os documentos recuperados. O Referencial teórico foi montado tendo como base as teorias e práticas da BCI no que se refere à organização do conhecimento e outrossim com o recurso às tecnologias e padrões da Web Semântica para representação dos dados, de onde se destacam de entre outros o Resource Description Framework (RDF) e a Web Ontology Language (OWL). Referem-se igualmente os diversos formatos de serialização como por exemplo o RDF/XML e o Turtle, sempre à luz dos princípios de publicação de dados abertos (Linked Data). A avaliação do OntoM4IS+ foi realizada de forma iterativa e incremental. Numa primeira fase, consistiu na submissão de artigos à eventos e revistas científicas na modalidade peer review. Recebeu-se ainda contribuições resultantes de uma reunião com um dos mais renomados especialistas internacionais da área de organização do conhecimento, Dagobert Soergel, professor da University at Buffalo/State University of New York. Numa fase mais adiantada, o OntoM4IS+ foi avaliado na situação experimental com a avaliação da ontologia de domínio OntoAgroHidro da Embrapa, à luz do que estabelece o OntoM4IS+. Como resultados, acredita-se que para além do artefato resultante da pesquisa, o trabalho contribuiu para trazer para a BCI um método de investigação que ainda é relativamente pouco utilizado, mas que se adapta à natureza das pesquisas em BCI, que é a DSR.
Abstract: This thesis addresses as a subject the reuse of Semantic Web resources for construction of instruments of knowledge representation, framed in the area of Library and Information Science (LIS). The aim of this research was to explore the literature that covers the areas of LIS (Library and Information Science) and Computer Science (CS) regarding the construction of controlled vocabularies (CV). The literature review has shown that reuse is recognized as an important step in CV construction. With the reuse of resources, time and effort are saved, instead of starting the construction from scratch and besides, it promotes the interoperability between agents (humans and machines). The methodologies of construction of CV that are mentioned in this thesis cite reuse as an important task and that must always be present in the process of building Knowledge Organization Systems (KOS). In the field of LIS there are few methods that explicitly recommend the reuse of resources provided by the semantic web. In addition to the exploration of issues related to knowledge representation, a guide was proposed to assist LIS professionals in the creation of knowledge representation tools, which was named OntoM4IS+ (method of reusing ontological and non-ontological resources for information science). It was based on several methodologies as well as good systems modeling practices, promoting data description in order to facilitate interoperability between agents, thus providing future reuse. By its nature, this research is applied, that is, that research that does not take into account only the fundamental understanding, which is proper to basic science, but which is concerned with considerations of use. Regarding to the objectives, the research is exploratory, and as approach to problem, could be considered qualitative. The research method adopted was Design Science Research (DSR), a method that has a qualitative approach and is part of the spectrum of Pragmatism. Regarding data collection procedures, firstly was defined the keywords that were used for document retrieval in the main national databases (CAPES’s Journals Portal) and international databases (Web of Science, RCAAP, Scopus, NDLTD) were first defined. Subsequently, other data processing techniques such as the reading grid were combined and in addition a matrix of concepts was created for all retrieved documents. The theoretical framework was based on the theories and practices of LIS regarding the organization of knowledge and also using the technologies and standards of the Semantic Web for data representation, from which stand out among others the Resource Description Framework (RDF) and the Web Ontology Language (OWL). Also was mentioned the various formats of serialization such as RDF/XML and Turtle, always following the principles of open data (Linked Data). The evaluation of OntoM4IS+ was performed in an iterative and incremental manner. In the first phase, it consisted of the submission of articles to events and peer review scientific journals. Contributions were also received from a meeting with one of the most renowned international experts in the field of knowledge organization, Dagobert Soergel, professor at the University at Buffalo/State University of New York. At a later stage, OntoM4IS+ was evaluated in the experimental situation with the evaluation of Embrapa's OntoAgroHidro domain ontology, in light of what is established by OntoM4IS+. As a result, it is believed that in addition to the research artifact, the work contributed to bring to BCI a research method that is still relatively little used but that fits the nature of research in BCI, which is the DSR.
Subject: Ciência da Informação
Web semântica
Representação do conhecimento (Teoria da informação)
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ECI - ESCOLA DE CIENCIA DA INFORMAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Gestão e Organização do Conhecimento
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nd/3.0/pt/
URI: http://hdl.handle.net/1843/32372
Issue Date: 17-Jun-2019
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese-versaoFinal-HelderNMFirmino_NrMatricula2015713900.pdfTese de doutorado em Gestão e Organização do Conhecimento, autor: Helder Noel Monteiro Firmino, orientadora: Gercina Ângela de Lima13.74 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons