Base de conhecimento para recuperação e acesso à informação acadêmica: provimento para um chatbot na ECI UFMG
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
José Eduardo Santarém Segundo
Gercina Ângela de Lima
Eduardo Valadares da Silva
Gercina Ângela de Lima
Eduardo Valadares da Silva
Resumo
A recuperação de informações acadêmicas (normas, resoluções e procedimentos) em universidades públicas constitui um desafio para os estudantes, diante da dispersão de documentos em múltiplos canais e por sua linguagem técnica. Nesse cenário, a curadoria informacional surge como estratégia para organizar, e a base de conhecimento, uma maneira estruturada para subsidiar a recuperação em sistemas, sendo esses os questionamentos que norteiam esta pesquisa. A partir dessa lacuna, esta dissertação teve como objetivo estruturar e implementar uma base de conhecimento para subsidiar a construção de um chatbot voltado à recuperação de informações acadêmicas (normas, resoluções e procedimentos), sobre as graduações, na Escola de Ciência da Informação da Universidade Federal de Minas Gerais. Especificamente, buscou-se: (i) mapear métodos e técnicas utilizados no desenvolvimento de chatbots com foco na informação; (ii) identificar o comportamento de busca dos estudantes em relação a documentos normativos; (iii) identificar e analisar chatbots educacionais implementados; e (iv) realizar a curadoria informacional para subsidiar a implementação de uma base de conhecimento. A pesquisa caracteriza-se como um estudo de caso, com natureza aplicada, descritiva e exploratória e abordagem quali quantitativa, delineada em quatro etapas. A primeira consistiu em uma revisão de literatura sobre o desenvolvimento de chatbots, identificando metodologias, arquiteturas, linguagens, plataformas e técnicas de Processamento de Linguagem Natural. Observou-se que os estudos privilegiam aspectos técnicos, negligenciando o tratamento da informação. A segunda etapa envolveu a análise de um questionário aplicado no âmbito do projeto Recuperação da Informação em modelos de Inteligência Artificial, em 2025, com respostas de estudantes da graduação da UFMG, que permitiu compreender como eles buscam normas, quais dificuldades enfrentam e quais são suas dúvidas e opiniões. Observou-se que a fragmentação das fontes e a linguagem normativa complexa configuram os principais desafios. Na terceira etapa, foram analisados estudos sobre chatbots educacionais, previamente identificados na revisão de literatura, selecionados por apresentarem modelos documentados e replicáveis. A análise forneceu exemplos de fluxos de interação, estruturas de intents, usos de entidades e bases de conhecimento, servindo como referência prática. Por fim, a quarta etapa concentrou-se na curadoria informacional da base, que foi desenvolvida em cinco fases: levantamento de necessidades informacionais; seleção de fontes e documentos; estruturação e criação da base; desenvolvimento (popular e validar); e modelagem de fluxos informacionais. Essa etapa resultou em uma base de conhecimento com 31 conceitos centrais, organizados em uma estrutura taxonômica com 225 intenções (perguntas e respostas) fundamentadas em documentos oficiais, acompanhadas da localização exata em artigos, parágrafos, além do link dos documentos. Apesar da validação envolver uma especialista, a ausência de validação com usuários finais foi uma limitação da pesquisa e segue como trabalho futuro. A pesquisa contribuiu de forma prática ao apresentar um estudo de caso, que gerou um produto: uma base de conhecimento estruturada e escalável que oferece uma fundamentação teórica e metodológica, no contexto informacional, para o desenvolvimento de soluções inovadoras, fomentando a transformação digital e promovendo impacto social. Este produto estratégico subsidiará a implementação de um chatbot institucional, fornecendo respostas contextualizadas, confiáveis e alinhadas às necessidades informacionais dos estudantes.
Abstract
The retrieval of academic information (regulations, resolutions and procedures) in public universities poses a challenge for students, given the dispersion of documents across multiple channels and their technical language. In this context, informational curation emerges as a strategy for organization, while the knowledge base provides a structured means to support retrieval in systems, these being the core questions guiding this research. In light of this gap, the present dissertation aimed to structure and implement a knowledge base to support the development of a chatbot designed for the retrieval of academic information (regulations, resolutions and procedures) about undergraduate at the School of Information Science of the Federal University of Minas Gerais. Specifically, it sought to: (i) map methods and techniques used in the development of information-oriented chatbots; (ii) identify the information-seeking behavior of the students regarding normative documents; (iii) identify and analyze implemented educational chatbots; and (iv) conduct informational curation to support the implementation of a knowledge base. This research is characterized as a case study, with an applied, descriptive and exploratory nature, adopting a mixed-methods approach, structured in four stages. The first stage consisted of a literature review on chatbot development, identifying methodologies, architectures, languages, platforms and Natural Language Processing techniques. It was observed that existing studies privilege technical aspects, often neglecting information treatment. The second stage involved the analysis of a questionnaire administered within the project Information Retrieval in Artificial Intelligence Models, in 2025, with responses from undergraduate students at UFMG, which allowed for an understanding of how students seek normative documents, the challenges that they face, as well as their doubts and opinions. The results indicated that the fragmentation of information sources and the complexity of normative language constitute the main difficulties. In the third stage, studies on educational chatbots, previously identified in the literature review, were analyzed and selected based on the presentation of documented and replicable models. The analysis provided examples of interaction flows, intent structures, uses of entities and knowledge bases, serving as practical references. Finally, the fourth stage focused on the informational curation of the knowledge base, developed in five phases: identification of informational needs; selection of sources and documents; structuring and creation of the base; development (population and validation); and modeling of informational flows. This stage resulted in a knowledge base comprising 31 core concepts, organized into a taxonomic structure with 225 intents (questions and answers) grounded in official documents, each accompanied by exact references to articles, paragraphs and document links. Although validation involved an expert, the absence of end-user validation was a limitation of the study and remains as future work. This research made a practical contribution by presenting a case study that generated a product: a structured and scalable knowledge base that offers theoretical and methodological grounding, within the informational context, for the development of innovative solutions, fostering digital transformation and promoting social impact. This strategic product will support the implementation of an institutional chatbot capable of providing contextualized, reliable and user-centered responses aligned with the informational needs of the students.
Assunto
Ciência da informação, Recuperação da informação, Curadoria digital, Chatbots, Informação acadêmica
Palavras-chave
Base de conhecimento, Recuperação da Informação, Curadoria informacional, Chatbots, Informação acadêmica
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso aberto
