Identificação de funções utilitárias em Java e Javascript

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Membros da banca

Andre Cavalcante Hora
Eduardo Magno Lages Figueiredo
Marcelo de Almeida Maia

Resumo

Funções utilitárias são funções de propósito geral, que podem ser reusadas em diferentes tipos de sistemas. Teoricamente, devem ser implementadas em módulos específicos. No entanto, desenvolvedores frequentemente implementam essas funções junto a funções de domínio, diminuindo as chances de reuso. Nesta dissertação, inicialmente foi investigado o uso de um algoritmo de aprendizado de máquina para identificar funções utilitárias, usando métricas estáticas de código como preditores. Em seguida, é proposto um conjunto de heurísticas para identificação de tais funções. Essas heurísticas podem ser facilmente implementadas nos atuais ambientes integrados de desenvolvimento de software, fornecendo recomendações para movimentação de funções utilitárias para módulos adequados. Em um survey com 33 desenvolvedores, as heurísticas propostas apresentaram uma precisão de 65% (quando aplicadas em sistemas implementados em Java) e de 67% (quando aplicadas em sistemas JavaScript).

Abstract

Utility functions are functions that offer generic services such as data conversions, manipulation of dates and structures, among others and which are useful in many parts of a system. Ideally, they should be implemented in appropriate modules, to facilitate reuse. However, developers often implement utility functions in modules designed to contain specific purpose functions. Thus, this practice decreases opportunities of reuse, causing rework and duplicating code. Moving the utility function to a suitable module is a solution for this problem. However, this type of refactoring is not trivial for large system developers, due to the lack of supporting tools to identify such functions. To address this shortcoming, we proposed a set of heuristics to identifyutility functions. Initially, we investigate the use of machine learning to solve the proposed research problem. We conducted evaluations by project (intra-project) and using many projects (cross-project) in training and testing phases. This last approach is closer to a practical application scenario. Despite the classifier has showed excellentresults in intra-project evaluation, they were much lower in the cross-project scenario. Therefore, we proposed heuristics to identify utility functions, which can be computed by static analysis of Java and JavaScript source code, with no training phase. We obtained an average precision of 68% evaluating the proposed heuristics in four proprietarysystems of a Brazilian software development company. Furthermore, in a survey performed with 33 developers, we obtained a precision of 66% and 67%, respectively, for Java and JavaScript, considering a sample of open source systems functions from GitHub and Qualitas Corpus.

Assunto

Computação, Software Arquitetura, Programação modular

Palavras-chave

Arquitetura de Software, Aprendizado de Máquina, Refatoração, Funções utilitárias, Modularização

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por