Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/JCES-AVPH4J
Tipo: Dissertação de Mestrado
Título: Uso de adaptação de domínio e informação contextual em sistemas de pergunta-resposta
Autor(es): Gianlucca Lodron Zuin
Primeiro Orientador: Adriano Alonso Veloso
Primeiro Coorientador: Luiz Chaimowicz
Primeiro membro da banca : Luiz Chaimowicz
Segundo membro da banca: Agma Juci Machado Traina
Terceiro membro da banca: Nivio Ziviani
Resumo: Geralmente coletamos dados de diversas fontes para montarmos um Corpus adequado para o aprendizado de modelos multi-domínio de pergunta-resposta (QA). Este tipo de sistema requer que o modelo seja capaz de realizar compreensão de linguagem natural, o que implica na necessidade de grandes bases de dados. Uma maneira simples de aliviar a demanda de dados é restringir o domínio abordado pelo QA, levando assim à modelos específicos. Embora o aprendizado de modelos de QA em um único domínio ainda seja uma tarefa desafiadora devido à escassez de dados de treinamento suficientes no tema de interesse, podemos obter instâncias adicionais por meio de domínios relacionados. Este trabalho investiga abordagens de adaptação a fim de obter vários modelos especializados em cada domínio alternativamente a aprender um modelo único de amplo domínio. Demonstra-se ainda que isso pode ser alcançado estratificando-se uma base original, sem a necessidade de buscar dados adicionais ao contrário de outras abordagens da literatura. Este trabalho propõe uma rede neural que explora o uso conjunto de redes convolucionais e recorrentes. Características gerais dos temas são compartilhadas enquanto características específicas dos domínios são aprendidas. Isso permite realizar a adaptação dos modelos utilizando diversos tipos de domínio fonte. São consideradas diferentes abordagens de transferência e de divisão de domínios desenvolvidas para aprender modelos de QA tanto em nível de spans, quanto em nível de sentenças. Observou-se que a adaptação ao domínio resulta em ganhos de desempenho, em especial à nível de sentenças. Observou-se também que podemos ter um aumento considerável no desempenho do modelo baseado em spans ao utilizar a informação de contexto presente no QA de sentenças.
Assunto: Redes neurais (Computação)
Computação
Aprendizado do computador
Idioma: Português
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Tipo de Acesso: Acesso Aberto
URI: http://hdl.handle.net/1843/JCES-AVPH4J
Data do documento: 14-Nov-2017
Aparece nas coleções:Dissertações de Mestrado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
gianluccazuin.pdf3.14 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.