Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-97HFUV
metadata.dc.type: Dissertação de Mestrado
Title: Recomendação associativa de tags na ausência de informação prévia
metadata.dc.creator: Eder Ferreira Martins
metadata.dc.contributor.advisor1: Jussara Marques de Almeida
metadata.dc.contributor.advisor-co1: Marcos Andre Goncalves
metadata.dc.contributor.referee1: Nivio Ziviani
metadata.dc.contributor.referee2: Pavel Pereira Calado
metadata.dc.contributor.referee3: Ricardo da Silva Torres
metadata.dc.description.resumo: A literatura contém uma grande variedade de estratégias de recomendação de tags, sendo que as que exploram padrões de coocorrência com tags previamente associadas aos objetos do sistema (incluindo tags disponíveis no próprio objeto alvo da recomendação), chamados de métodos associativos, têm produzido consistentemente resultados estado da arte. Entretanto, tags estão ausentes em uma parcela signicativa dos objetos de várias aplicações populares da Web 2.0, o que levanta uma preocupação a respeito da ecácia de métodos associativos frente a sua ausência. Esse é um problema bem conhecido em sistemas de recomendação, chamado cold start, e é o foco desta dissertação. Mais especicamente, aborda-se o problema de recomendar tags para objetos sem tags previamente associadas. Tal estudo é iniciado pela avaliação do impacto do cold start sobre uma família de métodos associativos, usando para isso bases de dados coletadas de várias aplicações populares da Web 2.0. Os resultados indicam que a ecácia de tais métodos é muito prejudicada quando eles não podem utilizar tags previamente associadas ao objeto alvo da recomendação. É mostrado também que o uso de estratégias automáticas de ltragem de termos para gerar um conjunto inicial de tags, a partir do qual padrões de coocorrência podem ser obtidos, produz ganhos limitados. É proposto um novo método de recomendação, mais robusto em presença do cold start, que explora tanto o feedback positivo quanto o negativo, provido pelo usuário, para iterativamente selecionar tags para os métodos associativos. Os resultados, comparando-se algumas variações da estratégia proposta, baseada em relevance feedback, com os métodos originais baseados em coocorrência, mostram que estender os métodos associativos para incluir o relevance feedback gera ganhos signicativos sobre o melhor método de referência considerado. É mostrado também que a estratégia proposta é ecaz mesmo na ausência de cooperação e de conabilidade por parte do usuário, permanecendo tão boa, se não superior, ao melhor método de referência, mesmo que o feedback provido pelo usuário contenha ruído ou que ele selecione apenas uma parte das tags relevantes que são mostradas no processo de relevance feedback.
Abstract: Among the existing tag recommendation strategies, those that have consistently produced state-of-the-art performance often exploit term co-occurrence patterns with tags previously assigned to the target object, possibly jointly with other textual features. However, these techniques have been evaluated only for objects with previously assigned tags. Instead, we here focus on the recommendation of tags for objects with empty tags, a variation of a well known problem called cold start. We start by evaluating state-of-the-art co-occurrence based methods in face of cold start, using datasets collected from for popular Web 2.0 applications. Our results indicate that the effectiveness of these methods suffer greatly when they cannot rely on previously assigned tags in the target object. Moreover, we show that employing various automatic filtering strategies to generate a initial set of tags that enables the use of co-ocurrence patterns produces limited gains. We then propose a new approach that exploits both positive and negative relevance feedback (RF) from the users to iteratively select input tags to these methods. Our experimental results, comparing several variations of the proposed RF strategy against the original co-occurrence based methods and other state-of-the-art baselines in various scenarios, indicate that extending the methods to include relevance feedback from users leads to significant gains in precision over the best considered baseline in cold start scenarios, and also on objects that contain some initial tags (i.e., no cold start). We also show that our best RF-driven strategy is robust to the lack of user reliability and cooperation, remaining at least as good if not superior to the best baseline even if the feedback provided by user contains noise or if users select only a portion of the relevant tags that are shown to them in the feedback process.
metadata.dc.subject.other: Recuperação da Informação
Ferramentas de busca na Web
Sistemas de recomendação
Computação
metadata.dc.language: Português
Publisher: Universidade Federal de Minas Gerais
metadata.dc.publisher.initials: UFMG
metadata.dc.rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-97HFUV
Issue Date: 19-Apr-2013
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
ederferreiramartins.pdf2.41 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.