Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/JCES-AVPH4J
Type: Dissertação de Mestrado
Title: Uso de adaptação de domínio e informação contextual em sistemas de pergunta-resposta
Authors: Gianlucca Lodron Zuin
First Advisor: Adriano Alonso Veloso
First Co-advisor: Luiz Chaimowicz
First Referee: Luiz Chaimowicz
Second Referee: Agma Juci Machado Traina
Third Referee: Nivio Ziviani
Abstract: Geralmente coletamos dados de diversas fontes para montarmos um Corpus adequado para o aprendizado de modelos multi-domínio de pergunta-resposta (QA). Este tipo de sistema requer que o modelo seja capaz de realizar compreensão de linguagem natural, o que implica na necessidade de grandes bases de dados. Uma maneira simples de aliviar a demanda de dados é restringir o domínio abordado pelo QA, levando assim à modelos específicos. Embora o aprendizado de modelos de QA em um único domínio ainda seja uma tarefa desafiadora devido à escassez de dados de treinamento suficientes no tema de interesse, podemos obter instâncias adicionais por meio de domínios relacionados. Este trabalho investiga abordagens de adaptação a fim de obter vários modelos especializados em cada domínio alternativamente a aprender um modelo único de amplo domínio. Demonstra-se ainda que isso pode ser alcançado estratificando-se uma base original, sem a necessidade de buscar dados adicionais ao contrário de outras abordagens da literatura. Este trabalho propõe uma rede neural que explora o uso conjunto de redes convolucionais e recorrentes. Características gerais dos temas são compartilhadas enquanto características específicas dos domínios são aprendidas. Isso permite realizar a adaptação dos modelos utilizando diversos tipos de domínio fonte. São consideradas diferentes abordagens de transferência e de divisão de domínios desenvolvidas para aprender modelos de QA tanto em nível de spans, quanto em nível de sentenças. Observou-se que a adaptação ao domínio resulta em ganhos de desempenho, em especial à nível de sentenças. Observou-se também que podemos ter um aumento considerável no desempenho do modelo baseado em spans ao utilizar a informação de contexto presente no QA de sentenças.
Subject: Redes neurais (Computação)
Computação
Aprendizado do computador
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/JCES-AVPH4J
Issue Date: 14-Nov-2017
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
gianluccazuin.pdf3.14 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.