Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/SLSS-8KEEQ3
Tipo: Dissertação de Mestrado
Título: Recomendação associativa de tags considerando múltiplos atributos textuais
Autor(es): Fabiano Muniz Belem
primer Tutor: Jussara Marques de Almeida
primer Co-tutor: Marcos Andre Goncalves
primer miembro del tribunal : Pavel Pereira Calado
Segundo miembro del tribunal: Altigran Soares da Silva
Tercer miembro del tribunal: Nivio Ziviani
Resumen: Diversas aplicações da Web 2.0 permitem aos usuários a livre atribuição de palavras-chave (tags) ao conteúdo, para prover uma melhor organização e descrição do mesmo. Nessas aplicações, serviços de recomendação de tags podem auxiliar o usuário nesta tarefa, melhorando a qualidade da informação disponível e, consequentemente, a eficácia de serviços de Recuperação de Informação (RI) que exploram tags, tais como busca e classificação.Esta dissertação aborda duas tarefas relacionadas à recomendação de tags. A primeira tem foco no objeto, objetivando sugerir tags que sejam relevantes a um determinado conteúdo. A segunda tarefa é personalizada, visando recomendar tags que sejam relevantes ao mesmo tempo a um objeto alvo e a um usuário alvo. Nossas estratégias de recomendação focadas no objeto exploram conjuntamente três dimensões do problema: (i) co-ocorrência de termos com tags previamente associadas ao objeto alvo; (ii) termos extraídos de múltiplos atributos textuais; e (iii) várias métricas de relevância de tags.Nossas estratégias de recomendação de tags personalizada exploram todas as dimensões mencionadas acima e o histórico de atribuições de tags do usuário alvo.Em particular, nós propusemos várias novas heurísticas, que estendem estratégias estado-da-arte, incluindo novas métricas que tentam capturar a capacidade de um termo descrever o conteúdo de um objeto. Nós também exploramos duas técnicas baseadas em learning-to-rank (L2R), a saber, RankSVM e Programação Genética (PG). Elas geram funções que combinam múltiplas métricas para estimar a relevância de uma tag a um dado objeto ou a um par objeto-usuário. Nós avaliamos os métodos propostos em vários cenários, em três aplicações populares da Web 2.0: LastFM, YouTube e YahooVideo.Os resultados de nossas heurísticas apresentam ganhos significativos em precisão e revocação quando comparados às melhores estratégias utilizadas como linhas de base.Alguns ganhos adicionais modestos podem também ser obtidos através de nossas estratégias baseadas em L2R. Apesar dos ganhos serem modestos, vale ressaltar que essas técnicas têm a vantagem de serem bem flexíveis, podendo ser facilmente estendidas para explorar outros aspectos do problema de recomendação de tags.
Abstract: Several Web 2.0 applications allow users to assign keywords (tags) to the content, in order to provide a better organization and description of the shared content. Tag recommendation tasks may assist users in this task, improving the quality of the available information and, thus, the effectiveness of Information Retrieval (IR) services which exploit tags, such as searching and classification. This work addresses two tag recommendation tasks. The first one aims at suggesting relevant tags to a target object. The second task is personalized, aiming at recommending tags which are simultaneously relevant to a target object and a target user.Our tag recommendation strategies focused on the object jointly exploit three dimensions of the problem: (i) term co-occurrence with tags pre-assigned to the target object, (ii) terms extracted from multiple textual features, and (iii) several metrics of tag relevance.Our personalized tag recommendation strategies exploit all dimensions mentioned above and a metric related to the history of tag assignments of the target user. In particular, we propose several new heuristic methods, which extend previous, highly effective and efficient, state-of-the-art strategies by including new metrics that try to capture how accurately a candidate term describes the objects content. We also exploit two learning to rank techniques, namely RankSVM and Genetic Programming, for the task of generating ranking functions that combine multiple metrics to accurately estimate the relevance of a tag toa given object or pair user-object. We evaluate all proposed methods in various scenarios for three popular Web 2.0 applications, namely, LastFM, YouTube and YahooVideo. We found that our heuristics greatly outperform the best baseline in each scenario and task. Some further, modest improvements can also be achieved, in some scenarios of both personalized and object-focused, with our new learning-to-rank based strategies. However, they have the additional advantage of being quite flexible and easily extensible to exploit other aspects of the tag recommendation problem.
Asunto: Recuperação da informação
Ferramentas de busca na Web
Sistemas de recomendação
Programação genética (Computação)
Computação
Pesquisa por palavras-chave
Web 20
Idioma: Português
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Tipo de acceso: Acesso Aberto
URI: http://hdl.handle.net/1843/SLSS-8KEEQ3
Fecha del documento: 6-jul-2011
Aparece en las colecciones:Dissertações de Mestrado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
fabianobelem.pdf1.44 MBAdobe PDFVisualizar/Abrir


Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.