Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/1843/JCES-AVPH4J
Tipo: | Dissertação de Mestrado |
Título: | Uso de adaptação de domínio e informação contextual em sistemas de pergunta-resposta |
Autor(es): | Gianlucca Lodron Zuin |
Primeiro Orientador: | Adriano Alonso Veloso |
Primeiro Coorientador: | Luiz Chaimowicz |
Primeiro membro da banca : | Luiz Chaimowicz |
Segundo membro da banca: | Agma Juci Machado Traina |
Terceiro membro da banca: | Nivio Ziviani |
Resumo: | Geralmente coletamos dados de diversas fontes para montarmos um Corpus adequado para o aprendizado de modelos multi-domínio de pergunta-resposta (QA). Este tipo de sistema requer que o modelo seja capaz de realizar compreensão de linguagem natural, o que implica na necessidade de grandes bases de dados. Uma maneira simples de aliviar a demanda de dados é restringir o domínio abordado pelo QA, levando assim à modelos específicos. Embora o aprendizado de modelos de QA em um único domínio ainda seja uma tarefa desafiadora devido à escassez de dados de treinamento suficientes no tema de interesse, podemos obter instâncias adicionais por meio de domínios relacionados. Este trabalho investiga abordagens de adaptação a fim de obter vários modelos especializados em cada domínio alternativamente a aprender um modelo único de amplo domínio. Demonstra-se ainda que isso pode ser alcançado estratificando-se uma base original, sem a necessidade de buscar dados adicionais ao contrário de outras abordagens da literatura. Este trabalho propõe uma rede neural que explora o uso conjunto de redes convolucionais e recorrentes. Características gerais dos temas são compartilhadas enquanto características específicas dos domínios são aprendidas. Isso permite realizar a adaptação dos modelos utilizando diversos tipos de domínio fonte. São consideradas diferentes abordagens de transferência e de divisão de domínios desenvolvidas para aprender modelos de QA tanto em nível de spans, quanto em nível de sentenças. Observou-se que a adaptação ao domínio resulta em ganhos de desempenho, em especial à nível de sentenças. Observou-se também que podemos ter um aumento considerável no desempenho do modelo baseado em spans ao utilizar a informação de contexto presente no QA de sentenças. |
Assunto: | Redes neurais (Computação) Computação Aprendizado do computador |
Idioma: | Português |
Editor: | Universidade Federal de Minas Gerais |
Sigla da Instituição: | UFMG |
Tipo de Acesso: | Acesso Aberto |
URI: | http://hdl.handle.net/1843/JCES-AVPH4J |
Data do documento: | 14-Nov-2017 |
Aparece nas coleções: | Dissertações de Mestrado |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
gianluccazuin.pdf | 3.14 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.