Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/MGSS-AB5JNH
Tipo: Dissertação de Mestrado
Título: Desenvolvimento, implementação e teste de ferramentas integradas para análise textual e tratamento estatístico de dados em pesquisas linguisticas
Autor(es): Rodrigo Araujo e Castro
primer Tutor: Adriana Silvina Pagano
primer Co-tutor: Ilka Afonso Reis
primer miembro del tribunal : Igor Antônio Lourenço da Silva
Segundo miembro del tribunal: Kelen Cristina Sant Anna de Lima
Resumen: Esta dissertação apresenta um estudo de desenvolvimento, implementação e teste de um conjunto de ferramentas de preparação e análise de dados estruturados (em planilhas) e não estruturados textuais, utilizando-se scripts elaborados no software estatístico e ambiente computacional R. Contribuindo para os Estudos da Tradução, no escopo da Linguística com potencial de aplicação (HALLIDAY, 1985), desenhada no marco teórico da Linguística Sistêmico-Funcional (HALLIDAY; MATTHIESSEN, 2014), e utilizando subsídios da Linguística de Corpus, da Mineração de dados e de textos, da Estatística Descritiva e de técnicas multivariadas de análise, foram desenvolvidos e testados scripts em dados provenientes de um estudo experimental realizado no Laboratório Experimental de Tradução, da Faculdade de Letras da Universidade Federal de Minas Gerais, com quatro pesquisadores do Centro de Desenvolvimento de Tecnologia Nuclear e quatro tradutores profissionais. Os dados selecionados consistiram em (i) dados sociodemográficos e informações fornecidas pelos sujeitos do experimento, como hábitos de leitura e conhecimentos linguísticos na L1 e L2 constituindo dados do tipo estruturado; e (ii) dados do tipo não estruturado extraídos de protocolos verbais (livres e guiados) da tarefa realizada pelos sujeitos. A preparação dos dados estruturados foi feita no R, bem como sua análise, que enfocou a sumarização de dados desses sujeitos, triangulados com o agrupamento feito por técnica de análise multivariada. A preparação dos dados não estruturados foi feita com o editor de texto Notepad++ e scripts do ambiente R, também utilizados para a análise dos dados, enfocando-se os pronomes eu e a gente e sua co-ocorrência com verbos, enquanto realizações das categorias do sistema de TRANSITIVIDADE PARTICIPANTE e PROCESSO, passíveis de serem analisadas sob a perspectiva da metarreflexão dos sujeitos do experimento sobre a tarefa executada. A análise dos dados estruturados permitiu agrupar os sujeitos dos experimentos e obter dendrogramas com base nas planilhas de dados. A análise dos dados não estruturados permitiu a obtenção de: lista de frequência, nuvem de palavras, linhas de concordância e lista de colocados. Os resultados do estudo de implementação evidenciaram os sujeitos mais similares dentro de cada grupo e na amostra como um todo, assim como o fato de os verbos em co-ocorrência com os pronomes examinados nos protocolos serem aqueles que realizavam PROCESSOS materiais e relacionais (relacionados à representação de atividades de fazer e atribuir), seguidos dos mentais (incluindo instâncias de metáforas interpessoais), os quais, segundo Magalhães e Alves (2006), sugerem de forma mais deliberada a metarreflexão dos sujeitos.
Abstract: This thesis reports on a study aimed at developing, applying and testing a set of tools designed for the pre-processing and analysis of structured (spreadsheet) and unstructured data by means of scripts written in the R software and environment. Contributing to Translation Studies, within the scope of appliable linguistics (Halliday, 1985), as conceived of by Systemic Functional Linguistics (Halliday and Matthiessen, 2014), and drawing on Corpus Linguistics, data and text mining and descriptive and multivariate statistics, scripts were written and tested on data retrieved from a study carried out at the Laboratory for Experimentation in Translation, Arts Faculty, Federal University of Minas Gerais, in which four nuclear scientists of the Center for the Development of Nuclear Energy, and four professional translators were asked to produce a translation in an experimental setting. The data set selected were (i) subjects' sociodemographic data and their answers to a questionnaire on their reading and writing habits and proficiency in L1 and L2 (structured data in spreadsheets) ; and (ii) unstructured data (text) retrieved from recall protocols carried out by subjects upon task completion. Structured data were pre-processed in the R environment through designed scripts. The focus of the analysis was summarizing the subjects data, which were triangulated with the clustering results generated through the multivariate analysis technique. Unstructured data were pre-processed in the Notepad++ text editor and through designed scripts in order to analyze the pronouns eu and a gente and verbs co-occurring with them as realizations of PARTICIPANT and PROCESS categories within the TRANSITIVITY system ascribable to instances of subjects' metareflection on their task. Structured data analysis allowed for clustering subjects and obtaining dendrograms. Unstructured data analysis generated frequency lists, word clouds, Keywords in Context and lists of collocates. The results of the implementation study showed which subjects were more similar in each group and in the sample as a whole. They also showed that the most frequent verbs co-occuring with the selected pronouns were those realizing material and relational PROCESSES (associated to subjects representation of their task as doing and attributing activities), followed by mental PROCESSES (including instances of interpersonal metaphors), which, according to Magalhães and Alves (2006), tend to relate, more deliberately, to subjects' metareflection.
Asunto: Lingüística aplicada
Tradução e interpretação
Linguística Processamento de dados
Linguística de corpus
Pagano, Adriana Silvina
Idioma: Português
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Tipo de acceso: Acesso Aberto
URI: http://hdl.handle.net/1843/MGSS-AB5JNH
Fecha del documento: 15-feb-2016
Aparece en las colecciones:Dissertações de Mestrado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
disserta__o___castro__2016_.pdf2.99 MBAdobe PDFVisualizar/Abrir


Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.