Hierarchical Categorization of Research Expertise in the Presence of Scarce Information
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Marcos Andre Goncalves
Nivio Ziviani
Leonardo Chaves Dutra da Rocha
Nivio Ziviani
Leonardo Chaves Dutra da Rocha
Resumo
Ao longo da história da ciência, diferentes áreas do conhecimento têm colaborado para resolver os principais desafios em pesquisa. A tarefa de associar um pesquisador a tais áreas viabiliza uma série de tarefas, como a organização de repositórios digitais, recomendação de especialistas e a formação de grupos de pesquisa para problemas complexos. Nesta dissertação é proposto um modelo automático de classificação simples, mas ainda eficaz, capaz de categorizar especialistas de acordo com um esquema de classificação hierárquico para áreas do conhecimento. Esta abordagem baseia-se em evidências discriminatórias fornecidas pelo título de trabalhos acadêmicos, que é a informação mínima capaz de relacionar um pesquisador à sua área de conhecimento. Os experimentos realizados mostram que usando métodos de aprendizado de máquina supervisionados, treinados com informações rotuladas manualmente, é possível produzir modelos de classificação eficazes.
Abstract
Throughout the history of science, different knowledge areas have collaborated to overcome major research challenges. The task of associating a researcher with such areas makes a series of tasks feasible such as the organization of digital repositories, expertise recommendation and the formation of research groups for complex problems. In this dissertation, we propose a simple yet effective automatic classification model that is capable of categorizing research expertise according to a hierarchical knowledge area classification scheme. Our proposal relies on discriminatory evidence provided by the title of academic works, which is the minimum information capable of relating a researcher to its knowledge area. Our experiments show that using supervised machine learning methods, trained with manually labeled information, it is possible to produce effective classification models.
Assunto
Aprendizado de Máquina, Computação, Recuperação de informação
Palavras-chave
Supervised Learning, Computer Science Thesis, Machine Learning, Researchers Categorization