O uso de técnicas de aprendizado de máquina em grafos para predição da popularidade de atos normativos brasileiros sobre segurança alimentar
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
The use of graph-based machine learning techniques for predicting the popularity of Brazilian food safety normative acts
Primeiro orientador
Membros da banca
Nivio Ziviani
Thierson Couto Rosa
Thierson Couto Rosa
Resumo
A crescente demanda e disponibilização de dados em larga escala de atos normativos brasileiros apresentam oportunidades desafiadoras para a sociedade, particularmente na construção de sistemas computacionais que possam aprender, raciocinar e realizar inferências com base em conhecimentos prévios. Nesse contexto, as bases de conhecimento são ativos de extrema importância para a representação e o raciocínio automatizado do conhecimento em diversos domínios de aplicação. Um exemplo relevante é a inferência de informações a partir de sua representação em redes (grafos de conhecimento), que tem ganhado notoriedade acadêmica e industrial nos últimos anos. Diante disso, esta dissertação visa desenvolver um modelo de Inteligência Artificial utilizando técnicas de Aprendizado de Máquina em grafos para a predição da popularidade de atos normativos brasileiros específicos da área de segurança alimentar. O desenvolvimento do projeto exigiu a implementação de um fluxo de processamento (pipeline) estruturado e abrangente, com o intuito de realizar análises detalhadas e produzir resultados relevantes. A base de dados utilizada foi composta por atos normativos brasileiros voltados para a segurança alimentar, obtidos no site oficial do Ministério da Agricultura e Pecuária (MAPA). A coleta dos dados normativos foi realizada por meio da técnica de web scraping, que permitiu a captura estruturada e sistemática de 320 atos normativos em formato PDF. As etapas do estudo incluíram: tratamento dos dados, modelagem de tópicos, criação de matriz de similaridade, construção de grafos e suas características, geração de embeddings do grafo, e experimentos com modelos de Aprendizado de Máquina utilizando embeddings e features do grafo, além da aplicação do método SHAP. Os resultados evidenciam que a análise dos atos normativos através do BERTopic permitiu a identificação de tópicos relevantes, enquanto a construção de grafos e a aplicação de técnicas de Aprendizado de Máquina possibilitaram a predição da popularidade desses atos normativos. Conclui-se que a metodologia aplicada não só fornece uma análise detalhada e robusta da popularidade dos atos normativos, mas também contribui significativamente para o campo de pesquisa ao demonstrar a eficácia das técnicas de Aprendizado de Máquina em grafos no contexto jurídico e normativo.
Abstract
The growing demand and availability of large-scale data on Brazilian normative acts present challenging opportunities for society, particularly in the construction of computational systems that can learn, reason, and make inferences based on prior knowledge. In this context, knowledge bases are extremely important assets for the representation and automated reasoning of knowledge in various application domains. A relevant example is the inference of information from its representation in networks (knowledge graphs), which has gained academic and industrial notoriety in recent years. Therefore, this dissertation aims to develop an Artificial Intelligence model using Machine Learning techniques in graphs to predict the popularity of Brazilian normative acts specific to the area of food security. The development of the project required the implementation of a structured and comprehensive processing pipeline to perform detailed analyses and produce relevant results. The database used was composed of Brazilian normative acts focused on food security, obtained from the official Ministério da Agricultura e Pecuária (MAPA) website. The collection of normative data was carried out using web scraping techniques, which enabled the structured and systematic capture of 320 normative acts in PDF format. The study stages included: data processing, topic modeling, creation of a similarity matrix, construction of graphs and their characteristics, generation of graph embeddings, and experiments with Machine Learning models using embeddings and graph features, in addition to the application of the SHAP method. The results show that the analysis of normative acts through BERTopic allowed the identification of relevant topics, while the construction of graphs and the application of Machine Learning techniques enabled the prediction of the popularity of these normative acts. It is concluded that the applied methodology not only provides a detailed and robust analysis of the popularity of normative acts but also significantly contributes to the research field by demonstrating the effectiveness of Machine Learning techniques in graphs in the legal and normative context.
Assunto
Computação – Teses, Inteligência Artificial – Teses, Aprendizado de Máquina – Teses, Teoria dos Grafos – Teses, Segurança alimentar – Brasil – Teses, Atos administrativos – Brasil – Teses
Palavras-chave
Inteligência artificial, Aprendizado de máquina, Grafos, Legislação brasileira, Segurança alimentar