Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-9ZKMUV
Type: Tese de Doutorado
Title: Estudo e aplicação de metodologia para reengenharia de tesauro: remodelagem do THESAGRO
Authors: Benildes Coura Moreira dos Santos Maculan
First Advisor: Gercina Angela Borem de Oliveira Lima
First Referee: Ivo Pierozzi Júnior
Second Referee: Lidia Alvarenga
Third Referee: Mauricio Barcellos Almeida
metadata.dc.contributor.referee4: Celia da Consolacao Dias
Abstract: Os sistemas de organização do conhecimento (SOCs) abarcam distintos tipos de linguagens de representação, tais como taxonomias, tesauros e ontologias. Esses instrumentos possuem diferentes níveis de controle terminológico e indicação de relacionamentos entre conceitos que podem ser utilizados para auxiliar a integração de dados em ambiente web. O foco desta pesquisa foi o tesauro, que se caracteriza como um vocabulário controlado e especializado, composto por um conjunto de descritores inter-relacionados por relações de equivalência, hierarquia e associação. Esta pesquisa investigou e aplicou um modelo de reengenharia para tesauros tradicionais, com o objetivo de transformar o seu sistema de relacionamentos entre conceitos em uma estrutura mais enriquecida semanticamente. Com isso, pretendeu-se principalmente demonstrar a viabilidade dessa conversão e contribuir para a organização e o gerenciamento de informações. Como fundamento teórico-contextual e com base na literatura estudada, apresentam-se abordagens com distintas acepções, a partir de discussões e reflexões realizadas em torno de temas que, articulados, constituem o arcabouço teórico no qual se pauta a construção de tesauros. Traçou-se um percurso no campo da Biblioteconomia e Ciência da Informação (BCI) e exploraram-se os aportes da Terminologia, Semântica, Pragmática e também os aportes dos papéis Qualia e da Teoria da Valência, proposta por Borba (1996), que determina um valor semântico para diferentes verbos em português. Durante essa trajetória, foram discutidos temas tais como o conceito, o termo, a definição, problemas de ambiguidade e polissemia. O ambiente de pesquisa foi a Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA), responsável pelo desenvolvimento de soluções tecnológicas com vistas à disponibilização compartilhada de informações dentro do domínio da agropecuária brasileira. A metodologia adotada se caracterizou como um estudo de caso e envolveu procedimentos de natureza exploratória, aplicada e empírica, com uma abordagem qualitativa em relação à análise da literatura especializada da área. O modelo selecionado como objeto de estudo foi desenvolvido por Soergel et al. (2004) e Lauser et al. (2006) e consiste em procedimentos que possibilitam tratar as diferentes entidades (conceito, termo, string, nota de escopo e relacionamentos) da estrutura conceitual de um tesauro tradicional, através da explicitação formal dos relacionamentos entre conceitos. Nesse percurso metodológico, os procedimentos do modelo de conversão foram descritos, analisados e detalhados. A reengenharia foi aplicada no tesauro brasileiro THESAGRO, do domínio da Agropecuária, no recorte temático da intensificação agropecuária, tendo por base uma taxonomia e utilizando como insumos terminológicos outros tesauros da área da agricultura. Na aplicação do modelo empregou-se o sistema e-Termos, que é um software que auxilia a gestão e o desenvolvimento de produtos terminológicos. Os resultados demonstraram a viabilidade da utilização do modelo analisado na reengenharia de tesauros tradicionais, pois permitiu imprimir mais semântica à estrutura do tesauro modelado, especificando o tipo de relação existente entre os conceitos e termos. Porém, os resultados também evidenciaram que a construção da estrutura dos tesauros deve ser realizada de maneira mais formalizada, a partir de normas internacionais e representada por linguagens tais como Simple Knowledge Organization System (SKOS) e Resource Description Framework Schema (RDFS), vislumbrando a possibilidade de interoperabilidade entre os distintos tesauros. Conclui-se que a possibilidade de refinamento das relações entre conceitos, através da sua explicitação na estrutura do tesauro, auxiliou a organização do conhecimento do domínio modelado, o que pode facilitar a sua exploração pelo usuário, uma vez que torna esses relacionamentos mais claros e específicos.
Abstract: Knowledge organization systems (KOSs) encompass different types of representation languages such as taxonomies, thesauri, and ontologies. These instruments have different levels of terminological control and indicators of relationships between concepts. These relationships may be used to help data integration in a web environment. Our work focuses on the thesaurus, which is defined by a controlled and specialized vocabulary, consisting of a set of descriptors that are interrelated by equivalence, hierarchy, and association relationships. We investigate and apply a model for reengineering a traditional thesaurus, with the goal of transforming the concept relationship system of the thesaurus into a semantically richer structure. Our main contribution is to demonstrate the viability of this conversion as an aid to information organization and management. To provide the theoretical context of our work, we review the thesaurus construction literature, and discuss several approaches and their different meanings. We provide an overview of the Library and Information Science (LIS) field, covering the foundations of Terminology, Semantics, and Pragmatics, as well as the foundations of Qualia roles and the Valence Theory, which was developed by Borba (1996), and assigns semantic values to Portuguese verbs. In this overview, we discuss several themes, including concept, term, definition, ambiguity, and polysemy. Our research environment is the Brazilian Agricultural Research Corporation (EMBRAPA), which is responsible for developing technological solutions for information sharing in the Brazilian agriculture domain. Our methodology consists of a case study and involves exploratory, applied, and empirical procedures combined with a qualitative analysis of the specialized literature of the agricultural and the thesaurus construction fields. The thesaurus reengineering model we apply was developed by Soergel et al. (2004) and Lauser et al. (2006), and consists of procedures that allow us to process the different entities (concepts, terms, strings, scope notes, and relationships) of the conceptual structure of a traditional thesaurus through a formal refinement of the relationships between concepts. We describe and analyze in detail these procedures of the reengineering model. We apply the reengineering model to THESAGRO, which is a Brazilian thesaurus in the agriculture domain, in the thematic frame of agriculture intensification, using taxonomy as a basis and other agriculture thesauri as inputs. In the process of applying the model, we use the e- Termos system, which is a software application that helps with the development and management of terminological products. The results demonstrate the viability of using the model to reengineer a traditional thesaurus into a semantically richer structure that specifies the types of relationships between concepts and terms. The results also show that the construction of the structure of thesauri should be done in a more formal way, based on international conventions and represented in conceptual modeling languages such as Simple Knowledge Organization System (SKOS) and Resource Description Framework Schema (RDFS), to promote interoperability among different thesauri. Finally, the ability of refining the relationships between concepts, by explicitly modeling them in the thesaurus structure, helps us organize the knowledge in the modeled domain, which in turn helps users explore the domain, because it makes these relationships clearer and more specific.
Subject: Recuperação da informação
Tesauros
Sistemas de organização
Ciência da Informaçao
Organização da informação
Reengenharia de sistemas
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUBD-9ZKMUV
Issue Date: 24-Jun-2015
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
maculan_tese_arq_final.pdf.pdf8.3 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.