Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/74091
Type: Artigo de Evento
Title: SEMPLICe: um modelo sequencial de proficiência em comunidades online para aprendizado de idioma
Authors: Rafael Sales Medina
Ana Paula Couto da Silva
Fabrício Murai Ferreira
Abstract: O Reddit é uma rede social online em que usuários interessados em um mesmo tópico interagem uns com os outros em subreddits. Subreddits para aprendizado de idioma vem atraindo usuários de diferentes nı́veis de pro- ficiência a cada ano, buscando melhorar o aprendizado. Em particular, no subreddit German, os usuários são aconselhados a informar seu nı́vel de pro- ficiência ao escrever um post. Contudo, apenas 20% dos posts possuem tais tags. Abordamos aqui o problema de classificar a proficiência dos usuários a partir de suas publicações. Conduzimos uma série de experimentos que demonstram que classificadores que tratam as publicações como observações independentes tem baixo desempenho. À vista disso, propomos um novo modelo, SEMPLICe, que considera as caracterı́sticas textuais e também o histórico de um usuário no subreddit para classificar sua proficiência ao longo do tempo. Baseado na suposição de que a proficiência é não decresce desde que um usuário permaneça ativo, SEMPLICe alcança um F 1 ponderado até 29,6% maior que os métodos anteriores. SEMPLICe utiliza programação dinâmica para obter complexidade linear no tamanho do histórico de cada usuário.
Abstract: Reddit is an online social network where users interested in a common subject may interact with each other through subreddits. Subreddits for language learning have been attracting users of various proficiency levels each year, interested in boosting their learning. In particular, on subreddit German, users are advised to inform their proficiency level when writing a post. Yet only 20% of the posts have such tags. In this paper we address the problem of classifying users’ proficiency from their publications. We conduct experiments which show that classifiers that treat publications as independent observations perform poorly. We then propose a new model dubbed SEMPLICe, which uses both textual features and the publication history of an user to classify her proficiency level over time. By assuming that proficiency is monotonically non-decreasing as long as the user remains active, SEMPLICe yields a weighted F1 score up to 29.6% higher than previous methods. SEMPLICe uses dynamic programming to achieve linear complexity on each user’s history size.
Subject: Redes sociais on-line
Ensaios de proficiência
Grupos de discussão pela Internet
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
Rights: Acesso Aberto
metadata.dc.identifier.doi: https://doi.org/10.5753/brasnam.2019.6548
URI: http://hdl.handle.net/1843/74091
Issue Date: 2019
metadata.dc.url.externa: https://sol.sbc.org.br/index.php/brasnam/article/view/6548
metadata.dc.relation.ispartof: Brazilian Workshop on Social Network Analysis and Mining (BraSNAM)
Appears in Collections:Artigo de Evento



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.