Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/JCES-AVPH4J
Type: | Dissertação de Mestrado |
Title: | Uso de adaptação de domínio e informação contextual em sistemas de pergunta-resposta |
Authors: | Gianlucca Lodron Zuin |
First Advisor: | Adriano Alonso Veloso |
First Co-advisor: | Luiz Chaimowicz |
First Referee: | Luiz Chaimowicz |
Second Referee: | Agma Juci Machado Traina |
Third Referee: | Nivio Ziviani |
Abstract: | Geralmente coletamos dados de diversas fontes para montarmos um Corpus adequado para o aprendizado de modelos multi-domínio de pergunta-resposta (QA). Este tipo de sistema requer que o modelo seja capaz de realizar compreensão de linguagem natural, o que implica na necessidade de grandes bases de dados. Uma maneira simples de aliviar a demanda de dados é restringir o domínio abordado pelo QA, levando assim à modelos específicos. Embora o aprendizado de modelos de QA em um único domínio ainda seja uma tarefa desafiadora devido à escassez de dados de treinamento suficientes no tema de interesse, podemos obter instâncias adicionais por meio de domínios relacionados. Este trabalho investiga abordagens de adaptação a fim de obter vários modelos especializados em cada domínio alternativamente a aprender um modelo único de amplo domínio. Demonstra-se ainda que isso pode ser alcançado estratificando-se uma base original, sem a necessidade de buscar dados adicionais ao contrário de outras abordagens da literatura. Este trabalho propõe uma rede neural que explora o uso conjunto de redes convolucionais e recorrentes. Características gerais dos temas são compartilhadas enquanto características específicas dos domínios são aprendidas. Isso permite realizar a adaptação dos modelos utilizando diversos tipos de domínio fonte. São consideradas diferentes abordagens de transferência e de divisão de domínios desenvolvidas para aprender modelos de QA tanto em nível de spans, quanto em nível de sentenças. Observou-se que a adaptação ao domínio resulta em ganhos de desempenho, em especial à nível de sentenças. Observou-se também que podemos ter um aumento considerável no desempenho do modelo baseado em spans ao utilizar a informação de contexto presente no QA de sentenças. |
Subject: | Redes neurais (Computação) Computação Aprendizado do computador |
language: | Português |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
Rights: | Acesso Aberto |
URI: | http://hdl.handle.net/1843/JCES-AVPH4J |
Issue Date: | 14-Nov-2017 |
Appears in Collections: | Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
gianluccazuin.pdf | 3.14 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.