Eliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição: uma proposta metodológica para os estudos da linguística de corpus

dc.creatorCarolina Bohorquez Grondona
dc.date.accessioned2019-08-13T20:31:01Z
dc.date.accessioned2025-09-09T00:06:55Z
dc.date.available2019-08-13T20:31:01Z
dc.date.issued2015-03-02
dc.description.abstractThe main goal of this research was to investigate the correlation between the use of lexical bundles and the level of proficiency of learners of English when writing academic texts. Two subcorpora that compose the International Corpus of Learner of English Version 2 (ICLEv2), which is mainly built of argumentative essays, were examined. Part of the Chinese subcorpus Ch-ICLE and the Dutch subcorpus Dt-ICLE were chosen for examination. These subcorpora respectively represent the lowest and the highest levels of proficiency in this study based on the Common European Framework of Reference for Languages (CEFR). Researchers have found opposing results concerning lexical bundles depending on whether they were eliminated on the lines of being related to a topic, or as part of a longer unit, or maintained. Therefore, this study investigates if the elimination of topic-related lexical bundles and overlapping lexical bundles has a significant influence on the correlation between the level of proficiency of learners of English and their reliance on lexical bundles when writing academic texts. In order to achieve the objectives of the research, this study proposes an automated methodology developed in the R language to eliminate the types of lexical bundles mentioned. Afterwards, the number of lexical bundles produced by each of the subcorpora prior to and after the application of the methodology was contrasted. The chi-square test was used to attest the differences found. Results show that there was, most of the times, a higher percentage of elimination of topic-related lexical bundles and overlapping lexical bundles within the least proficient group, Ch-ICLE, indicating that a correlation between lower proficiency level and a lesser level of lexical bundles use may be productive. It was not possible however to attest that the elimination of topic-related lexical bundles and overlapping lexical bundles is a definite factor for the investigated correlation, since the automated methodology did not eliminated those types of bundles in its totality.
dc.identifier.urihttps://hdl.handle.net/1843/MGSS-9W3NNB
dc.languageInglês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectLingüística aplicada
dc.subjectLingua inglesa Escrita
dc.subjectRedação acadêmica
dc.subjectAquisição da segunda linguagem
dc.subjectLíngua inglesa Estudo e ensino (Superior) Falantes estrangeiros
dc.subjectLinguística de corpus
dc.subject.otherLinguística de Corpus
dc.subject.otherPacotes lexicais relacionados ao tópico
dc.subject.otherEscrita acadêmica
dc.titleEliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição: uma proposta metodológica para os estudos da linguística de corpus
dc.typeDissertação de mestrado
local.contributor.advisor1Deise Prina Dutra
local.contributor.referee1Crysttian Arantes Paixão
local.contributor.referee1Tommaso Raso
local.contributor.referee1Júlia Vidigal Zara
local.description.resumoO objetivo geral deste trabalho foi de investigar a correlação entre o uso de pacotes lexicais e o nível de proficiência linguística na escrita acadêmica de inglês, utilizando dois subcorpora do International Corpus of Learner of English Version 2 (ICLEv2), a saber, parte do subcorpus de aprendizes de inglês de língua materna chinesa Ch-ICLE e o subcorpus de aprendizes de inglês de língua materna holandesa Dt-ICLE. O ICLE é composto, em sua maior parte, por redações argumentativas de inglês de estudantes universitários. Os subcorpora escolhidos são representantes dos níveis de proficiência menor e maior, respectivamente, neste trabalho, com base nos índices do Common European Framework of Reference for Languages (CEFR). Uma vez que há resultados divergentes na literatura quanto à correlação investigada, o presente estudo busca checar se a eliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição pode ser um fator que influencie a percepção da correlação entre nível de proficiência e uso pacotes lexicais na escrita acadêmica de inglês. Para alcançar os objetivos descritos, esta pesquisa propõe uma metodologia automatizada para a eliminação dos tipos de pacotes lexicais supracitados, desenvolvida na linguagem R, e compara o número de pacotes lexicais produzidos por cada subcorpora antes e depois das eliminações. O teste estatístico qui-quadrado foi utilizado para atestar as diferenças encontradas. Os resultados evidenciam que houve, na maioria das vezes, uma porcentagem de diminuição maior de pacotes lexicais dos tipos que deveriam ser eliminados no corpus dos aprendizes de inglês menos proficientes, o Ch-ICLE, indicando que uma correlação entre menor produção de pacotes lexicais e menor nível de proficiência pode ser produtiva. Não foi possível, porém, comprovar que a eliminação de pacotes lexicais relacionados ao tópico e de pacotes lexicais em contexto de sobreposição é um fator definitivo para a correlação investigada, uma vez que a metodologia automatizada não foi capaz de eliminar esses pacotes em sua totalidade.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
disserta__o_carolina_boh_rquez_grondona.pdf
Tamanho:
1.14 MB
Formato:
Adobe Portable Document Format