Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/MGSS-9W3NNB
Type: Dissertação de Mestrado
Title: Eliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição: uma proposta metodológica para os estudos da linguística de corpus
Authors: Carolina Bohorquez Grondona
First Advisor: Deise Prina Dutra
First Referee: Crysttian Arantes Paixão
Second Referee: Tommaso Raso
Third Referee: Júlia Vidigal Zara
Abstract: O objetivo geral deste trabalho foi de investigar a correlação entre o uso de pacotes lexicais e o nível de proficiência linguística na escrita acadêmica de inglês, utilizando dois subcorpora do International Corpus of Learner of English Version 2 (ICLEv2), a saber, parte do subcorpus de aprendizes de inglês de língua materna chinesa Ch-ICLE e o subcorpus de aprendizes de inglês de língua materna holandesa Dt-ICLE. O ICLE é composto, em sua maior parte, por redações argumentativas de inglês de estudantes universitários. Os subcorpora escolhidos são representantes dos níveis de proficiência menor e maior, respectivamente, neste trabalho, com base nos índices do Common European Framework of Reference for Languages (CEFR). Uma vez que há resultados divergentes na literatura quanto à correlação investigada, o presente estudo busca checar se a eliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição pode ser um fator que influencie a percepção da correlação entre nível de proficiência e uso pacotes lexicais na escrita acadêmica de inglês. Para alcançar os objetivos descritos, esta pesquisa propõe uma metodologia automatizada para a eliminação dos tipos de pacotes lexicais supracitados, desenvolvida na linguagem R, e compara o número de pacotes lexicais produzidos por cada subcorpora antes e depois das eliminações. O teste estatístico qui-quadrado foi utilizado para atestar as diferenças encontradas. Os resultados evidenciam que houve, na maioria das vezes, uma porcentagem de diminuição maior de pacotes lexicais dos tipos que deveriam ser eliminados no corpus dos aprendizes de inglês menos proficientes, o Ch-ICLE, indicando que uma correlação entre menor produção de pacotes lexicais e menor nível de proficiência pode ser produtiva. Não foi possível, porém, comprovar que a eliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição é um fator definitivo para a correlação investigada, uma vez que a metodologia automatizada não foi capaz de eliminar esses pacotes em sua totalidade.
Abstract: The main goal of this research was to investigate the correlation between the use of lexical bundles and the level of proficiency of learners of English when writing academic texts. Two subcorpora that compose the International Corpus of Learner of English Version 2 (ICLEv2), which is mainly built of argumentative essays, were examined. Part of the Chinese subcorpus Ch-ICLE and the Dutch subcorpus Dt-ICLE were chosen for examination. These subcorpora respectively represent the lowest and the highest levels of proficiency in this study based on the Common European Framework of Reference for Languages (CEFR). Researchers have found opposing results concerning lexical bundles depending on whether they were eliminated on the lines of being related to a topic, or as part of a longer unit, or maintained. Therefore, this study investigates if the elimination of topic-related lexical bundles and overlapping lexical bundles has a significant influence on the correlation between the level of proficiency of learners of English and their reliance on lexical bundles when writing academic texts. In order to achieve the objectives of the research, this study proposes an automated methodology developed in the R language to eliminate the types of lexical bundles mentioned. Afterwards, the number of lexical bundles produced by each of the subcorpora prior to and after the application of the methodology was contrasted. The chi-square test was used to attest the differences found. Results show that there was, most of the times, a higher percentage of elimination of topic-related lexical bundles and overlapping lexical bundles within the least proficient group, Ch-ICLE, indicating that a correlation between lower proficiency level and a lesser level of lexical bundles use may be productive. It was not possible however to attest that the elimination of topic-related lexical bundles and overlapping lexical bundles is a definite factor for the investigated correlation, since the automated methodology did not eliminated those types of bundles in its totality.
Subject: Lingüística aplicada
Lingua inglesa Escrita
Redação acadêmica
Aquisição da segunda linguagem
Língua inglesa Estudo e ensino (Superior) Falantes estrangeiros
Linguística de corpus
language: Inglês
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/MGSS-9W3NNB
Issue Date: 2-Mar-2015
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
disserta__o_carolina_boh_rquez_grondona.pdf1.17 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.