Hierarchical Categorization of Research Expertise in the Presence of Scarce Information

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Membros da banca

Marcos Andre Goncalves
Nivio Ziviani
Leonardo Chaves Dutra da Rocha

Resumo

Ao longo da história da ciência, diferentes áreas do conhecimento têm colaborado para resolver os principais desafios em pesquisa. A tarefa de associar um pesquisador a tais áreas viabiliza uma série de tarefas, como a organização de repositórios digitais, recomendação de especialistas e a formação de grupos de pesquisa para problemas complexos. Nesta dissertação é proposto um modelo automático de classificação simples, mas ainda eficaz, capaz de categorizar especialistas de acordo com um esquema de classificação hierárquico para áreas do conhecimento. Esta abordagem baseia-se em evidências discriminatórias fornecidas pelo título de trabalhos acadêmicos, que é a informação mínima capaz de relacionar um pesquisador à sua área de conhecimento. Os experimentos realizados mostram que usando métodos de aprendizado de máquina supervisionados, treinados com informações rotuladas manualmente, é possível produzir modelos de classificação eficazes.

Abstract

Throughout the history of science, different knowledge areas have collaborated to overcome major research challenges. The task of associating a researcher with such areas makes a series of tasks feasible such as the organization of digital repositories, expertise recommendation and the formation of research groups for complex problems. In this dissertation, we propose a simple yet effective automatic classification model that is capable of categorizing research expertise according to a hierarchical knowledge area classification scheme. Our proposal relies on discriminatory evidence provided by the title of academic works, which is the minimum information capable of relating a researcher to its knowledge area. Our experiments show that using supervised machine learning methods, trained with manually labeled information, it is possible to produce effective classification models.

Assunto

Aprendizado de Máquina, Computação, Recuperação de informação

Palavras-chave

Supervised Learning, Computer Science Thesis, Machine Learning, Researchers Categorization

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por