Reúso de recursos da web semântica para a construção de vocabulários controlados no contexto da ciência da informação
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Reuse of resources from semantic web for the construction of controlled vocabularies in the context of information science
Primeiro orientador
Membros da banca
Benildes Coura Moreira dos Santos Maculan
Cristiane Mendes Netto
Marcello Peixoto Bax
Maria Luiza de Almeida Campos
Cristiane Mendes Netto
Marcello Peixoto Bax
Maria Luiza de Almeida Campos
Resumo
Esta tese aborda como assunto o reúso de recursos da Web Semântica para a construção
de instrumentos de representação do conhecimento, enquadrada na área da
Biblioteconomia e Ciência da Informação (BCI). Com esta pesquisa, pretendeu-se explorar a
literatura que abrange as áreas da BCI e da Ciência da Computação (CC) no que diz
respeito à construção de vocabulários controlados (VC). A revisão de literatura mostrou que
o reúso é reconhecido como sendo um importante passo na construção de VC. Com o reúso
de recursos poupa-se tempo e esforço, ao invés de se começar a construção do zero e para
além disso, promove a interoperabilidade entre agentes (humanos e máquinas). As
metodologias de construção de VC que são mencionadas nesta tese citam o reúso como
uma tarefa importante e que deve estar sempre presente no processo de construção de
Sistemas de Organização do Conhecimento (SOC). No campo da BCI existem poucos
métodos que recomendam de forma explícita o reúso dos recursos disponibilizados pela
Web semântica. Para além da exploração dos assuntos relacionados com a representação
do conhecimento, foi proposto um guia para auxiliar os profissionais da BCI na criação de
instrumentos de representação do conhecimento e que foi batizado de OntoM4IS+ (método
de reúso de recursos ontológicos e não-ontológicos para a ciência da informação). Foi
baseado em diversas metodologias e também em boas práticas de modelagem de sistemas,
promovendo a descrição dos dados a fim de facilitar a interoperabilidade entre agentes,
propiciando deste modo, futuras reutilizações. Quanto à natureza, a pesquisa é aplicada,
isto é, aquela pesquisa que não leva em conta apenas o entendimento fundamental, que é
próprio da ciência básica, mas que se preocupa com as considerações de uso.
Relativamente aos objetivos, a pesquisa é exploratória, e quanto à abordagem ao problema,
ela é qualitativa. O método de investigação adotado foi a Design Science Research (DSR),
método que tem uma abordagem qualitativa e que se insere no espectro do Pragmatismo.
Relativamente aos procedimentos de coleta de dados, primeiramente foram definidas as
palavras-chave que foram utilizadas para recuperação de documentos nas principais bases
de dados nacionais (Portal de Periódicos da CAPES) e internacionais (Web of Science,
RCAAP, Scopus, NDLTD). Posteriormente, foram combinadas outras técnicas de tratamento
de dados como a grelha de leitura e para além disso, criou-se uma matriz de conceitos
sobre todos os documentos recuperados. O Referencial teórico foi montado tendo como
base as teorias e práticas da BCI no que se refere à organização do conhecimento e
outrossim com o recurso às tecnologias e padrões da Web Semântica para representação
dos dados, de onde se destacam de entre outros o Resource Description Framework (RDF)
e a Web Ontology Language (OWL). Referem-se igualmente os diversos formatos de
serialização como por exemplo o RDF/XML e o Turtle, sempre à luz dos princípios de
publicação de dados abertos (Linked Data). A avaliação do OntoM4IS+ foi realizada de
forma iterativa e incremental. Numa primeira fase, consistiu na submissão de artigos à
eventos e revistas científicas na modalidade peer review. Recebeu-se ainda contribuições
resultantes de uma reunião com um dos mais renomados especialistas internacionais da
área de organização do conhecimento, Dagobert Soergel, professor da University at
Buffalo/State University of New York. Numa fase mais adiantada, o OntoM4IS+ foi avaliado
na situação experimental com a avaliação da ontologia de domínio OntoAgroHidro da
Embrapa, à luz do que estabelece o OntoM4IS+. Como resultados, acredita-se que para
além do artefato resultante da pesquisa, o trabalho contribuiu para trazer para a BCI um
método de investigação que ainda é relativamente pouco utilizado, mas que se adapta à
natureza das pesquisas em BCI, que é a DSR.
Abstract
This thesis addresses as a subject the reuse of Semantic Web resources for construction of
instruments of knowledge representation, framed in the area of Library and Information
Science (LIS). The aim of this research was to explore the literature that covers the areas of
LIS (Library and Information Science) and Computer Science (CS) regarding the construction
of controlled vocabularies (CV). The literature review has shown that reuse is recognized as
an important step in CV construction. With the reuse of resources, time and effort are saved,
instead of starting the construction from scratch and besides, it promotes the interoperability
between agents (humans and machines). The methodologies of construction of CV that are
mentioned in this thesis cite reuse as an important task and that must always be present in
the process of building Knowledge Organization Systems (KOS). In the field of LIS there are
few methods that explicitly recommend the reuse of resources provided by the semantic
web. In addition to the exploration of issues related to knowledge representation, a guide
was proposed to assist LIS professionals in the creation of knowledge representation tools,
which was named OntoM4IS+ (method of reusing ontological and non-ontological resources
for information science). It was based on several methodologies as well as good systems
modeling practices, promoting data description in order to facilitate interoperability between
agents, thus providing future reuse. By its nature, this research is applied, that is, that
research that does not take into account only the fundamental understanding, which is
proper to basic science, but which is concerned with considerations of use. Regarding to the
objectives, the research is exploratory, and as approach to problem, could be considered
qualitative. The research method adopted was Design Science Research (DSR), a method
that has a qualitative approach and is part of the spectrum of Pragmatism. Regarding data
collection procedures, firstly was defined the keywords that were used for document retrieval
in the main national databases (CAPES’s Journals Portal) and international databases (Web
of Science, RCAAP, Scopus, NDLTD) were first defined. Subsequently, other data
processing techniques such as the reading grid were combined and in addition a matrix of
concepts was created for all retrieved documents. The theoretical framework was based on
the theories and practices of LIS regarding the organization of knowledge and also using the
technologies and standards of the Semantic Web for data representation, from which stand
out among others the Resource Description Framework (RDF) and the Web Ontology
Language (OWL). Also was mentioned the various formats of serialization such as RDF/XML
and Turtle, always following the principles of open data (Linked Data). The evaluation of
OntoM4IS+ was performed in an iterative and incremental manner. In the first phase, it
consisted of the submission of articles to events and peer review scientific journals.
Contributions were also received from a meeting with one of the most renowned international
experts in the field of knowledge organization, Dagobert Soergel, professor at the University
at Buffalo/State University of New York. At a later stage, OntoM4IS+ was evaluated in the
experimental situation with the evaluation of Embrapa's OntoAgroHidro domain ontology, in
light of what is established by OntoM4IS+. As a result, it is believed that in addition to the
research artifact, the work contributed to bring to BCI a research method that is still relatively
little used but that fits the nature of research in BCI, which is the DSR.
Assunto
Ciência da Informação, Web semântica, Representação do conhecimento (Teoria da informação)
Palavras-chave
Reúso de recursos, Vocabulários controlados, Sistemas de organização do conhecimento, Web semântica, Design Science Research, OntoM4IS+
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
