SEMPLICe: um modelo sequencial de proficiência em comunidades online para aprendizado de idioma

dc.creatorRafael Sales Medina
dc.creatorAna Paula Couto da Silva
dc.creatorFabrício Murai Ferreira
dc.date.accessioned2024-08-14T20:33:17Z
dc.date.accessioned2025-09-09T01:29:07Z
dc.date.available2024-08-14T20:33:17Z
dc.date.issued2019
dc.description.abstractReddit is an online social network where users interested in a common subject may interact with each other through subreddits. Subreddits for language learning have been attracting users of various proficiency levels each year, interested in boosting their learning. In particular, on subreddit German, users are advised to inform their proficiency level when writing a post. Yet only 20% of the posts have such tags. In this paper we address the problem of classifying users’ proficiency from their publications. We conduct experiments which show that classifiers that treat publications as independent observations perform poorly. We then propose a new model dubbed SEMPLICe, which uses both textual features and the publication history of an user to classify her proficiency level over time. By assuming that proficiency is monotonically non-decreasing as long as the user remains active, SEMPLICe yields a weighted F1 score up to 29.6% higher than previous methods. SEMPLICe uses dynamic programming to achieve linear complexity on each user’s history size.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.format.mimetypepdf
dc.identifier.doihttps://doi.org/10.5753/brasnam.2019.6548
dc.identifier.issn2595-6094
dc.identifier.urihttps://hdl.handle.net/1843/74091
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofBrazilian Workshop on Social Network Analysis and Mining (BraSNAM)
dc.rightsAcesso Aberto
dc.subjectRedes sociais on-line
dc.subjectEnsaios de proficiência
dc.subjectGrupos de discussão pela Internet
dc.subject.otherModelo sequencial
dc.subject.otherComunidades online
dc.subject.otherClassificação automática de proficiência
dc.subject.otherReddit
dc.titleSEMPLICe: um modelo sequencial de proficiência em comunidades online para aprendizado de idioma
dc.typeArtigo de evento
local.citation.issue8
local.description.resumoO Reddit é uma rede social online em que usuários interessados em um mesmo tópico interagem uns com os outros em subreddits. Subreddits para aprendizado de idioma vem atraindo usuários de diferentes nı́veis de pro- ficiência a cada ano, buscando melhorar o aprendizado. Em particular, no subreddit German, os usuários são aconselhados a informar seu nı́vel de pro- ficiência ao escrever um post. Contudo, apenas 20% dos posts possuem tais tags. Abordamos aqui o problema de classificar a proficiência dos usuários a partir de suas publicações. Conduzimos uma série de experimentos que demonstram que classificadores que tratam as publicações como observações independentes tem baixo desempenho. À vista disso, propomos um novo modelo, SEMPLICe, que considera as caracterı́sticas textuais e também o histórico de um usuário no subreddit para classificar sua proficiência ao longo do tempo. Baseado na suposição de que a proficiência é não decresce desde que um usuário permaneça ativo, SEMPLICe alcança um F 1 ponderado até 29,6% maior que os métodos anteriores. SEMPLICe utiliza programação dinâmica para obter complexidade linear no tamanho do histórico de cada usuário.
local.identifier.orcidhttps://orcid.org/0000-0001-5951-3562
local.identifier.orcidhttps://orcid.org/0000-0003-4487-6381
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.url.externahttps://sol.sbc.org.br/index.php/brasnam/article/view/6548

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
SEMPLICe_ um modelo sequencial de proficiência em comunidades online para aprendizado de idioma.pdf
Tamanho:
129.25 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: