Tie strength metrics to rank pairs of developers from Github
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de periódico
Título alternativo
Primeiro orientador
Membros da banca
Resumo
The Web provides huge volumes of data, which makes efficient data collecting and processing not easy tasks. An example of such volumes is in software repositories, a type of Web storage platform for software and projects, their developers and companies. In this work, we first present a systematic literature review over topics related to such repositories. Then, we extract their data and enrich it by building a development network. Based on such a network, we investigate tie strength metrics on their capability of defining new information through a correlation analysis. We also use the metrics to rank pairs of developers by considering three different aggregate methods. Our experimental analysis shows different results for each ranking method when considering all pairs of developers, which reveals the difficulty of choosing the best way to rank pairs of developers. However, when considering the top 10 best ranked pairs, two methods present similar results. Also, the combination of tie strength metrics with ranking aggregated methods allows to identify important developers in the network and their collaboration strength.
Abstract
A Web fornece enormes volumes de dados, o que faz com que a coleta e o processamento eficiente de dados não sejam tarefas fáceis. Um exemplo desses volumes estão nos repositórios de software, uma espécie de plataforma de armazenamento Web para softwares e projetos, seus desenvolvedores e empresas. Neste trabalho, apresentamos primeiramente uma revisão sistemática da literatura sobre tópicos relacionados a tais repositórios. Depois, extraímos os seus dados e enriquecemo-los através da construção de uma rede de desenvolvimento. Com base nessa rede, investigamos métricas de força de vínculo quanto à sua capacidade de definir novas informações por meio de uma análise de correlação. Também usamos as métricas para classificar pares de desenvolvedores considerando três métodos agregados diferentes. Nossa análise experimental mostra resultados diferentes para cada método de classificação ao considerar todos os pares de desenvolvedores, o que revela a dificuldade de escolher a melhor forma de classificar pares de desenvolvedores. Porém, ao considerar os 10 pares mais bem classificados, dois métodos apresentam resultados semelhantes. Além disso, a combinação de métricas de força de vínculo com métodos agregados de classificação permite identificar desenvolvedores importantes na rede e sua força de colaboração.
Assunto
Métricas de software, Redes sociais on-line, Dados conectados, Browsers (Programas de computador)
Palavras-chave
Metrics, Social networks, Web data, Web software repositores
Citação
Departamento
Curso
Endereço externo
https://periodicos.ufmg.br/index.php/jidm/article/view/417