Recomendação de tags por demanda
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Altigran Soares da Silva
Alberto Henrique Frade Laender
Alberto Henrique Frade Laender
Resumo
Rotulagem colaborativa (collaborative tagging) permite que usuários assinalem palavras-chave (ou tags) que descrevam o conteúdo de objetos, o que facilita a navegação e me\-lho\-ra algoritmos de busca sem o uso de categorias pré-definidas. Em sistemas de tagging de larga escala, sistemas de recomendação de tags podem ajudar usuários a assinalar rótulos a objetos e ajudar a consolidar o vocabulário entre diferentes usuários. Uma abordagem promissora para recomendação de tags é explorar a co-ocorrência entre elas. Nesse caso, o enorme tamanho do vocabulário de tags é um desafio, porque (1) a complexidade computacional pode crescer exponencialmente com o número de tags e (2) o peso atribuído a cada tag pode ficar distorcido já que diferentes tags operam em diferentes escalas e os seus respectivos pesos podem não ser diretamente comparáveis. Neste trabalho nós propomos um método novo de recomendação de tagsque é baseado em demanda e que faz recomendações a partir de um conjunto inicial de tags previamente associado a um objeto. Ele reduz o espaço de possíveis soluções, e, portanto, sua complexidade aumenta polinomialmente com o tamanho do vocabulário de tags. Além disso, o peso de cada tag é calibrado usando uma abordagem de minimização de entropia que corrige possíveis distorções e provê recomendações mais precisas. Nós conduzimos uma avaliação sistemática de métodos propostos usando três tipos de mídia: áudio, páginas Web e vídeo. Os resultados experimentais mostram que o método proposto é rápido e melhora a qualidade da recomendação em diferentes cenários experimentais. Por exemplo, no caso de um popular site de músicas ele provê melhoras em precisão (p@5)de 6,4% a 46,7% (dependendo do número de tags dadas como entrada), melhorando métodos de recomendação de tags baseados em co-ocorrência recentemente propostos.
Abstract
Collaborative tagging allows users to assign arbitrary keywords (or tags) describing the content of objects, which facilitates navigation and improves searching without dependence on pre-configured categories. In large-scale tag-based systems, tag recommendation services can assist a user in the assignment of tags to objects and help consolidate the vocabulary of tags across users. A promising approach for tag recommendation is to exploit the co-occurrence of tags. However, these methods are challenged by the huge size of the tag vocabulary, either because (1) the computational complexity may increase exponentially with the number of tags or (2) the score associated with each tag may become distorted since different tags may operate in different scales and the scores are not directly comparable. In this work we propose a novel method that recommends tags on a demand-driven basis according toan initial set of tags applied to an object. It reduces the space of possible solutions, so that its complexity increases polynomially with the size of the tag vocabulary. Further, the score of each tag is calibrated using an entropy minimization approach which corrects possible distortions and provides more precise recommendations. We conducted a systematic evaluation of the proposed method using three types of media: audio, Web pages and video. The experimental results show that the proposed method is fast and boosts recommendation quality on different experimental scenarios. For instance, in the case of a popular music radio Web site it provides improvements in precision (p@5) ranging from 6.4% to 46.7% (depending on the number of tags given as input), outperforming a recently proposed co-occurrence based tag recommendation method.
Assunto
Ferramentas de busca na Web, Computação, Recuperação de informação
Palavras-chave
recuperação de informação