Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/55003
Type: Dissertação
Title: Dados abertos governamentais: adaptação e aplicação de uma metodologia para publicar dados enriquecidos semanticamente no estado de Minas Gerais
Other Titles: Open government data: adaptation and application of a methodology to publish semantically enriched data in the state of Minas Gerais
Authors: Marcela Pires Estevanovic
First Advisor: Marcello Peixoto Bax
First Referee: Webert Junio Araujo
Second Referee: Lucinéia Souza Maia
Third Referee: Mauro Araújo Câmara
metadata.dc.contributor.referee4: Henrique Oliveira Santos
Abstract: Com o avanço de novas tecnologias na Web e com o aumento da quantidade de dados e informações produzidos, surge a necessidade de aplicar técnicas que auxiliem na preparação e organização de dados para publicação. No âmbito da Administração Pública, por exemplo, conjuntos de dados podem ser¬ publicados na Web com o propósito de analisar o perfil epidemiológico de uma população, ou para informar o número de homicídios por região, entre outros. É importante que os dados estejam acessíveis e devidamente anotados com metadados a fim de ampliar o seu reuso por diferentes tipos de pessoas e organizações. No entanto, é comum encontrar publicados na Web conjuntos de dados em formatos heterogêneos ou sem documentação que os descrevam. Situações deste tipo prejudicam o consumo de informações por diferentes aplicações, indo de encontro à necessidade da transparência na administração pública, melhoria dos processos administrativos, ou até mesmo, no auxílio a decisões do poder público baseado em evidências. Nesse contexto, torna-se importante aplicar técnicas que permitam anotar dados a fim de tornar explícito o conhecimento representado por eles. Não obstante, é necessário pensar em como enriquecê-los semanticamente tanto para consumo humano, quanto para processamento por meio de computadores. Assim, ao publicar um conjunto de dados torna-se necessário também associá-lo ao modelo conceitual que o defina. O uso de ontologias permite representar o conhecimento em artefatos de software que organizam classes, propriedades, objetos e restrições de um domínio de conhecimento específico. Essa discussão encontra-se no âmbito do tema Dados Abertos Governamentais, em que é necessário preparar os conjuntos em formatos que possibilitem o processamento automatizado. Consequentemente, abre-se caminho para processar e extrair conhecimento para analisar um grande volume de dados. Neste trabalho, é proposta uma abordagem metodológica para publicar dados abertos governamentais. Para isso, foi realizado um estudo de caso aplicado para anotar dados de emendas parlamentares impositivas em Minas Gerais, utilizando como prova de conceito. Para construir a ontologia foram realizados grupos focais com servidores mineiros para validar a representação do conhecimento e preencher templates de metadados para elaborar os artefatos. Então, são ingeridos os dados para gerar um grafo de conhecimento que é acessado via repositório pelo programa de Bussiness Intelligence. Finalmente, apresenta-se os dados anotados semanticamente e é explorada uma forma de "navegar" pelos conceitos por meio de questões de competência. Portanto, este trabalho contribui com uma forma de anotar e enriquecer, continuamente, dados e publicá-los na Web. Isso aumenta a confiança e escalabilidade de modelos que se beneficiam das Tecnologias da Web Semântica.
Abstract: With the advance of new technologies on the Web and the increase in the amount of data and information produced, there is a need to apply techniques that assist in the preparation and organization of data for publication. In the scope of Public Administration, for example, data sets can be published on the Web with the purpose of analyzing the epidemiological profile of a population, or to inform the number of homicides per region, among others. It is important that the data is accessible and properly annotated with metadata to broaden its reuse by different types of people and organizations. However, it is common to find data sets published on the Web in heterogeneous formats or without documentation describing them. Situations of this type hinder the consumption of information by different applications, meeting the need for transparency in public administration, improvement of administrative processes, or even, in helping the government to make decisions based on evidence. In this context, it is important to apply techniques that allow the annotation of data to make the knowledge represented by them explicit. Nevertheless, it is necessary to think about how to enrich them semantically both for human consumption and for processing by computers. Thus, when publishing a dataset, it is also necessary to associate it with the conceptual model that defines it. The use of ontologies allows knowledge to be represented in software artifacts that organize classes, properties, objects, and constraints of a specific knowledge domain. This discussion is within the scope of Open Government Data, where it is necessary to prepare the sets in formats that allow automated processing. Consequently, it opens the way to process and extract knowledge to analyze a large volume of data. In this paper, a methodological approach to publish open government data is proposed. For this, a case study was conducted to annotate data from impositive parliamentary amendments in Minas Gerais, using it as a proof of concept. To build the ontology, focus groups were conducted with Minas Gerais servers to validate the knowledge representation and fill in metadata templates to elaborate the artifacts. Then, data is ingested to generate a knowledge graph that is accessed via a repository by the Business Intelligence program. Finally, the semantically annotated data is presented and a way to "navigate" the concepts through competency questions is explored. Therefore, this work contributes a way to continuously annotate and enrich data and publish it on the Web. This increases the reliability and scalability of models that benefit from Semantic Web Technologies.
Subject: Ciência da informação
Ontologias (Recuperação da informação)
Web semântica
Representação do conhecimento (Sistemas especialistas)
Informações eletrônicas governamentais
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ECI - ESCOLA DE CIENCIA DA INFORMAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Gestão e Organização do Conhecimento
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-sa/3.0/pt/
URI: http://hdl.handle.net/1843/55003
Issue Date: 1-Nov-2022
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
Dissertação - Marcela Pires Estevanovic.pdf2.74 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons