Individuação de autoria e identificação de estilo: análise de obras literárias com auxílio do r
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de periódico
Título alternativo
Individuación de autoría e identificación de estilo: análisis de obras literárias con r
Individuation of authorship and style identification: analysis of literary works carried with r
Individuation of authorship and style identification: analysis of literary works carried with r
Primeiro orientador
Membros da banca
Resumo
Este artigo soma-se aos trabalhos disponíveis sobre Processamento de Língua Natural ao fornecer uma demonstração
de como linguagens de programação como o R (R CORE TEAM, 2020) podem ser úteis na detecção de autoria e na identificação
do estilo do autor em obras literárias. Foram selecionados dois autores e duas obras de cada, a saber: The Adventures of Tom Sawyer(1876) e Adventures of Huckleberry Finn (1884), do autor Mark Twain (1835-1910), e Typee: A Peep at Polynesian Life (1846) e Omoo: A Narrative of Adventures in the South Seas (1847), do autor Herman Melville (1819-1891). Posteriormente, os dados foram
analisados seguindo a mesma metodologia de Eder et al. (2016), a fim de testar a eficácia do pacote stylo e aplicar os métodos de
Análise de Componentes Principais, Análise de Cluster e Árvore de Consenso. Os resultados apontaram que cada um dos métodos
testados conseguiu distinguir as obras dos autores, evidenciando-se, assim, a eficácia do pacote utilizado. Além disso, realiza-se uma análise estilométrica baseada nos métodos de Zeta de Craig e Rolling Delta. Para este último, utilizaram-se obras de dois autores de
língua alemã, Frank Kafka e Heinrich von Kleist. Os resultados apontaram uma semelhança estilística de von Kleist, sobretudo, na
primeira obra de Kafka. Adicionalmente, o método Rolling Delta foi usado para explorar uma análise feita por Juola (2013ª, 2013b)
a respeito de uma obra de J. K. Rowling escrita sob o pseudônimo de Robert Galbraith
Abstract
This paper adds to the works available on Natural Language Processing by providing a demonstration of how
programming languages such as R (R CORE TEAM, 2020) can be useful in detecting authorship and identifying the style of the
author in literary works. Two authors and two works each were selected, namely: The Adventures of Tom Sawyer (1876) and
Adventures of Huckleberry Finn (1884) by author Mark Twain (1835-1910), and Typee: A Peep at Polynesian Life (1846) and
Omoo: A Narrative of Adventures in the South Seas (1847) by author Herman Melville (1819-1891). Subsequently, the data were
analyzed following the same methodology as Eder et al. (2016), in order to test the effectiveness of the stylo package and apply the
Principal Component Analysis, Cluster Analysis and Consensus Tree methods. The results showed that each of the tested methods
was able to distinguish the works of the authors, thus evidencing the effectiveness of the package used. In addition, a stylometric
analysis is performed based on Craig's Zeta and Rolling Delta methods. For the latter, works by two German-speaking authors,
Frank Kafka and Heinrich von Kleist, were used. The results pointed to a stylistic similarity of von Kleist, especially in Kafka’s first
work. Additionally, Rolling Delta was used to explore an analysis carried by Juola (2013a, 2013b) regarding a work by J. K. Rowling
written under the pseudonym of Robert Galbraith.
Assunto
Análise linguística
Palavras-chave
Detecção de autoria, Análise estilométrica, R
Citação
Departamento
Curso
Endereço externo
https://periodicos.ufsc.br/index.php/forum/article/view/79086