Optimizing machine learning models: a droplet search approach to efficient kernel scheduling
| dc.creator | Michael Canesche | |
| dc.date.accessioned | 2024-12-27T17:06:29Z | |
| dc.date.accessioned | 2025-09-09T00:54:01Z | |
| dc.date.available | 2024-12-27T17:06:29Z | |
| dc.date.issued | 2024-11-15 | |
| dc.description.abstract | O escalonamento do kernel, um estágio crítico da otimização computacional, envolve a tarefa de determinar a implementação mais eficiente para um kernel computacional. Essa jornada de otimização envolve experimentar parâmetros do compilador, como tamanhos de janelas lado a lado e fatores de desenrolamento, para discernir a configuração ideal. A abordagem introduzida neste trabalho conceitua esses parâmetros como pontos dentro de um espaço de coordenadas cuidadosamente definido. Embora a função que mapeia esses pontos para os tempos de execução do kernel normalmente resulte em uma superfície não convexa, a evidência empírica apoia uma nova hipótese denominada "droplet expectation". Esta hipótese postula que a origem desta superfície, representando um kernel não otimizado, e seu ótimo global, significando o kernel mais rápido, residem coletivamente dentro dos limites de uma região convexa. Aproveitando esse insight, o trabalho propõe a metodologia Droplet Search, baseada no algoritmo de descida por coordenadas. Assumindo a validade da expectativa do droplet, o Droplet Search demonstra a capacidade de convergir rapidamente para a configuração ideal do kernel. Implementado no Apache TVM desde abril de 2023, o Droplet Search passa por uma avaliação rigorosa por meio de extensa experimentação envolvendo seis grandes modelos de aprendizagem profunda implantados em uma variedade de dispositivos de computação, incluindo ARM, Intel, AMD e NVIDIA. Os resultados obtidos desses experimentos mostram que o Droplet Search não apenas corresponde à eficácia de outras técnicas de pesquisa do AutoTVM, mas também as supera em eficiência, apresentando uma melhoria de velocidade que varia entre duas a dez vezes. Além de seus recursos de otimização acelerada, os modelos gerados pelo Droplet Search exibem uma vantagem competitiva quando justapostos aos produzidos pelo AutoScheduler (Ansor) do TVM. Esta é uma revelação digna de nota, considerando que o Ansor emprega quatro a cinco vezes mais transformações de código do que o AutoTVM. As descobertas empíricas aqui apresentadas ressaltam a trajetória promissora do Droplet Search como uma ferramenta potente no domínio do agendamento do kernel, redefinindo benchmarks ao oferecer processos de otimização acelerados e resultados competitivos, tudo realizado com uma sobrecarga computacional visivelmente reduzida. | |
| dc.description.sponsorship | CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico | |
| dc.description.sponsorship | FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais | |
| dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | |
| dc.identifier.uri | https://hdl.handle.net/1843/78816 | |
| dc.language | eng | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/pt/ | |
| dc.subject | Computação – Teses | |
| dc.subject | Compiladores (Programas de computador) – Teses | |
| dc.subject | Otimização combinatoria – Teses | |
| dc.subject | Recuperação da informação – Teses | |
| dc.subject.other | Tensor compiler | |
| dc.subject.other | Optimization | |
| dc.subject.other | Kernel scheduling | |
| dc.subject.other | Search | |
| dc.title | Optimizing machine learning models: a droplet search approach to efficient kernel scheduling | |
| dc.title.alternative | Otimizando modelos de aprendizado de máquina: uma abordagem de busca de gota para agendamento de kernel eficiente | |
| dc.type | Tese de doutorado | |
| local.contributor.advisor1 | Fernando Magno Quintão Pereira | |
| local.contributor.advisor1Lattes | http://lattes.cnpq.br/4608001746330875 | |
| local.contributor.referee1 | Marcio Costa Santos | |
| local.contributor.referee1 | Corinne Ancourt | |
| local.contributor.referee1 | Sanjay Rajopadhye | |
| local.contributor.referee1 | Ponnuswamy Sadayappan | |
| local.creator.Lattes | http://lattes.cnpq.br/2682801945729306 | |
| local.description.resumo | Kernel scheduling, a critical stage of computational optimization, involves the intricate task of determining the most efficient implementation for a computational kernel. This optimization journey encompasses experimenting with compiler parameters, such as tiling window sizes and unrolling factors, to discern the optimal configuration. The approach introduced in this work conceptualizes these parameters as points within a carefully defined coordinate space. While the function mapping these points to kernel running times typically results in a non-convex surface, empirical evidence supports a novel hypothesis termed the "droplet expectation." This hypothesis posits that the origin of this surface, representing an unoptimized kernel, and its global optimum, signifying the fastest kernel, collectively reside within the confines of a convex region. Leveraging this insight, the work proposes the Droplet Search methodology, grounded in the coordinate descent algorithm. Assuming the validity of the droplet expectation, Droplet Search demonstrates an ability to swiftly converge upon the optimal kernel configuration. Implemented in Apache TVM since April 2023, Droplet Search undergoes rigorous evaluation through extensive experimentation involving six large deep learning models deployed across a spectrum of computing devices, including ARM, Intel, AMD, and NVIDIA. Results gleaned from these experiments depict Droplet Search as not only matching the effectiveness of other AutoTVM search techniques but outperforming them with unparalleled efficiency, showcasing a speed improvement ranging between two to ten times. Beyond its accelerated optimization capabilities, models generated by Droplet Search exhibit a competitive edge when juxtaposed against those produced by TVM's AutoScheduler (Ansor). This is a noteworthy revelation considering that Ansor employs four to five times more code transformations than AutoTVM. The empirical findings presented herein underscore the promising trajectory of Droplet Search as a potent tool in the domain of kernel scheduling, redefining benchmarks by offering accelerated optimization processes and competitive outcomes, all accomplished with a discernibly reduced computational overhead. | |
| local.publisher.country | Brasil | |
| local.publisher.department | ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO | |
| local.publisher.initials | UFMG | |
| local.publisher.program | Programa de Pós-Graduação em Ciência da Computação |