Intent-aware semantic query annotation
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Anotações semânticas em consultas baseada na intenção do usuário
Primeiro orientador
Membros da banca
Altigran Soares da Silva
Marcos André Gonçalves
Marcos André Gonçalves
Resumo
Query understanding is a challenging task primarily due to the inherent ambiguity of
natural language. A common strategy for improving the understanding of natural language
queries is to annotate them with semantic information mined from a knowledge
base. Nevertheless, queries with different intents may arguably benefit from specialized
annotation strategies. For instance, some queries could be effectively annotated
with a single entity or an entity attribute, others could be better represented by a
list of entities of a single type or by entities of multiple distinct types, and others
may be simply ambiguous. In this dissertation, we propose a framework for learning
semantic query annotations suitable to the target intent of each individual query. Thorough
experiments on a publicly available benchmark show that our proposed approach
can significantly improve state-of-the-art intent-agnostic approaches based on Markov
random fields and learning to rank. Our results further demonstrate the consistent effectiveness
of our approach for queries of various target intents, lengths, and difficulty
levels, as well as its robustness to noise in intent detection.
Abstract
O entendimento de uma consulta é uma tarefa desafiadora, principalmente devido à
ambigüidade inerente da linguagem natural. Uma estratégia comum para melhorar a
compreensão das consultas em linguagem natural é anotá-las com informações semânticas
extraídas de uma base de conhecimento. No entanto, consultas com diferentes
intenções podem se beneficiar de diferentes estratégias de anotação. Por exemplo, algumas
consultas podem ser efetivamente anotadas com uma única entidade ou um
atributo de entidade, outras podem ser melhor representadas por uma lista de entidades
de um único tipo ou por entidades de vários tipos distintos, e outras podem ser
simplesmente ambíguas. Nesta dissertação, propomos um framework para aprendizagem
de anotações semânticas em consultas de acordo com a intenção existente em cada
uma. Experimentos minuciosos em um benchmark publicamente disponível mostram
que a abordagem proposta pode melhorar significativamente quando comparadas às
abordagens agnósticas baseadas em campos aleatórios de Markov e de aprendizado de
ranqueamento. Nossos resultados demonstram ainda, de forma consistente, a eficácia
de nossa abordagem para consultas de várias intenções, comprimentos e níveis de
dificuldade, bem como sua robustez ao ruído na detecção de intenção.
Assunto
Aprendizado de ranqueamento, Recuperação de informação
Palavras-chave
Aprendizado de ranqueamento, Recuperação da informação, Aprendizado de representações, Busca semântica, Anotação semântica em consultas