Efficient exploration and exploitation for eequential music recommendation
| dc.creator | Pedro Dalla Vecchia Chaves | |
| dc.date.accessioned | 2021-12-28T13:59:27Z | |
| dc.date.accessioned | 2025-09-09T00:20:24Z | |
| dc.date.available | 2021-12-28T13:59:27Z | |
| dc.date.issued | 2021-10-08 | |
| dc.description.abstract | Os serviços de streaming de música dependem fortemente de sistemas de recomendação para adquirir, envolver e reter usuários. Um componente notável desses serviços são as listas de reprodução, que podem ser geradas dinamicamente de maneira sequencial com base no feedback do usuário durante uma sessão de escuta. Recentemente, métodos baseados em aprendizagem online para ranqueamento se mostraram eficazes ao aproveitar esse feedback para aprender as preferências dos usuários no espaço de representação vetorial de músicas. No entanto, essas abordagens podem sofrer de convergência lenta como resultado de seu componente de exploração aleatório e ficar presas em mínimos locais devido ao seu componente de explotação agnóstico à sessão. Para superar essas limitações, propomos um novo método de aprendizagem online para ranqueamento que explora com eficiência o espaço de modelos de recomendação candidatos, restringindo-se ao complemento ortogonal do subespaço de direções de exploração anteriores de baixo desempenho. Além disso, para ajudar a superar os mínimos locais, propomos um componente de explotação ciente de sessão que aproveita de forma adaptativa o melhor modelo atual durante as atualizações do modelo. Nossa criteriosa avaliação usando sessões de escuta simuladas na plataforma Last.fm demonstra melhorias substanciais em relação às abordagens estado da arte no desempenho em estágio inicial e convergência geral de longo prazo. | |
| dc.identifier.uri | https://hdl.handle.net/1843/38955 | |
| dc.language | eng | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/pt/ | |
| dc.subject | Computação – Teses | |
| dc.subject | Sistemas de recomendação – Teses | |
| dc.subject | Recomendação online de músicas – Tese | |
| dc.subject | Apredizado do computador – Teses | |
| dc.subject | Aprendizado de ranqueamento – Teses | |
| dc.subject.other | Sequential music recommendation | |
| dc.subject.other | Efficient exploration | |
| dc.subject.other | Adaptive exploitation | |
| dc.subject.other | Online learning to rank | |
| dc.subject.other | Implicit feedback | |
| dc.title | Efficient exploration and exploitation for eequential music recommendation | |
| dc.title.alternative | Exploração e explotação eficiente para recomendação sequencial de músicas | |
| dc.type | Dissertação de mestrado | |
| local.contributor.advisor1 | Rodrygo Luis Teodoro Santos | |
| local.contributor.advisor1Lattes | http://lattes.cnpq.br/1162362624079364 | |
| local.contributor.referee1 | Fabrício Murai Ferreira | |
| local.contributor.referee1 | Flávio Vinícius Diniz Figueiredo | |
| local.contributor.referee1 | Marcelo Garcia Manzato | |
| local.creator.Lattes | http://lattes.cnpq.br/4673452877859676 | |
| local.description.resumo | Music streaming services heavily rely upon recommender systems to acquire, engage, and retain users. One notable component of these services are playlists, which can be dynamically generated in a sequential manner based on the user's feedback during a listening session. Online learning to rank approaches have recently been shown effective at leveraging such feedback to learn users' preferences in the space of song features. Nevertheless, these approaches can suffer from slow convergence as a result of their random exploration component and get stuck in local minima as a result of their session-agnostic exploitation component. To overcome these limitations, we propose a novel online learning to rank approach which efficiently explores the space of candidate recommendation models by restricting itself to the orthogonal complement of the subspace of previous underperforming exploration directions. Moreover, to help overcome local minima, we propose a session-aware exploitation component which adaptively leverages the current best model during model updates. Our thorough evaluation using simulated listening sessions from Last.fm demonstrates substantial improvements over state-of-the-art approaches regarding early-stage performance and overall long-term convergence. | |
| local.publisher.country | Brasil | |
| local.publisher.department | ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO | |
| local.publisher.initials | UFMG | |
| local.publisher.program | Programa de Pós-Graduação em Ciência da Computação |