Aplicação estendida de analisador computacional na extração de sintagmas nominais em textos antigos: um estudo de caso
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de periódico
Título alternativo
Extended application of a computational parser in the extraction of noun phrases in old texts: a case study
Primeiro orientador
Membros da banca
Resumo
Este estudo teve como objetivo analisar a aplicação estendida do analisador sintático LX-Parser em um corpus composto do trecho inicial da obra Peregrinação (publicada em 1614), de Fernão Mendes Pinto (ca. 1510-1583). Fez-se extração manual e automática de sintagmas nominais dos dez primeiros capítulos da obra. Testou-se a hipótese de que as especificidades de textos antigos limitam a precisão dos resultados gerados pelo analisador sintático considerado. A hipótese foi confirmada, uma vez que os resultados dessa aplicação estendida não se mostraram produtivos em função da alta frequência de problemas na análise produzida. Identificou-se que os principais problemas relativos a textos antigos estão relacionados à questão da extensão das sentenças, da grafia, da variação e mudança linguística. Além disso, constataram-se também problemas que não são específicos de textos antigos, mas que, ainda assim, limitaram o desempenho, como é o caso da ambiguidade estrutural e das categorias linguísticas.
Abstract
This study aimed to analyze the extended application of the LX-Parser, a syntatic parser, in a corpus composed of the initial passage from Peregrinação (published in 1614) written by Fernão Mendes Pinto (ca. 1510-1583). Manual and automatic extraction of noun phrases from the first ten chapters of the work were carried out. The hypothesis that the specificities of old texts limit the accuracy of the results generated by the considered parser was tested. The hypothesis was confirmed, since the results of this extended application did not prove to be productive due to the high frequency of problems in the produced analysis. It was identified that the main problems related to old texts are related to the issue of sentece extension, spelling and linguistic variation and change. In addition, there were also problems that are not specific to old texts, but still limited performance: the issues of structural ambiguity and linguistic categories.
Assunto
Linguistica historica, Linguística - Processamento de dados, Gramática comparada e geral - Sintaxe
Palavras-chave
Tecnologia, Linguística Computacional, Linguística Histórica, Sintaxe