User generated micro-reviews: characterization and popularity prediction

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Primeiro orientador

Membros da banca

Fabricio Benevenuto de Souza
Luis da Cunha Lamb
Marcos Andre Goncalves
Marco Antonio Pinheiro de Cristo
Virgilio Augusto Fernandes Almeida

Resumo

Desde a popularização da Web 2.0, as pessoas se tornaram cada vez mais engajadas ao expressar suas opiniões através de revisões sobre produtos e serviços. Como outros tipos de conteúdo gerado pelo usuário, revisões on-line vêm em várias formas, tamanhos e qualidades. Tal variabilidade na qualidade é particularmente notória em revisões textuais produzidas em aplicativos móveis, geralmente chamadas de micro-revisões ou tips, devido à sua concisão inerente. Em um ambiente abundante de conteúdo, ser capaz de estimar a utilidade de uma (micro-) revisão on-line, e finalmente, prever a suapopularidade futura entre os usuários, com precisão e o mais cedo possível, pode ser muito benéfico para os métodos de filtragem e recomendação de conteúdo, auxiliando os usuários a encontrar revisões valiosas e fornecendo um feedback rápido a empresáriose futuros clientes. Nesse contexto, investigamos como os usuários exploram micro-revisões, focando, particularmente, nas tips do Foursquare, um tipo cada vez mais popular de revisão cujo elevado grau de informalidade e concisão oferece dificuldades extras na concepçãode métodos de predição efetivos. Usando dados coletados do Foursquare, investigamos também como a popularidade da tip, estimada pelo número de vezes que a tip recebeu um like de um usuário, evolui ao longo do tempo e quais os fatores que podem sercombinados para desenvolver um modelo para prever a popularidade da tip em um dado instante no futuro. Finalmente, desenvolvemos soluções para duas diferentes tarefas de predição: predição do ranking de popularidade de um conjunto de tips e a predição do nível de popularidade que uma tip em particular irá alcançar. Resultadosexperimentais mostram que um conjunto multidimensional de variáveis previsoras, que considera atributos do usuário que postou a tip e do venue onde ela foi postada, leva a resultados mais precisos do que a utilização de cada um desses conjuntos isoladamente. Além disso, os modelos, quando aplicados às tips do Foursquare, são também maisrobustos que os modelos do estado da arte para predição de popularidade, já que nossos modelos podem ser aplicados em qualquer tip, no momento da postagem ou após dela.

Abstract

Since the popularization of the Web 2.0, people are becoming increasingly engaged expressing their opinions with reviews about products and services. As any other type of user-generated content, online reviews come in various forms, sizes and qualities. Such quality variability is particularly prominent in textual reviews produced on mobile apps, often called micro-reviews or tips, due to their inherent conciseness. In such content abundant environment, being able to estimate the helpfulness of an online (micro-)review, and ultimately predict its future popularity among users as accurately and early as possible, can greatly benefit content filtering and recommendationmethods, helping users find valuable reviews and providing quick feedback to business owners and future customers. In this context, we investigate how users exploit micro-reviews, focusing particularlyon Foursquare tips, an increasingly popular type of review whose high degree of informality and briefness offers extra difficulties to the design of effective prediction methods. Using collected data from Foursquare, we also investigate how tip popularity, given by the number of times the tip received a like from a user, evolves over time and which factors impact this popularity evolution. Then, we explore how these factors can be combined to develop models to predict tip popularity at a given point in time in the future. We develop solutions to two different prediction tasks: predicting the popularity ranking of a set of tips and predicting the popularity level a particular tip will achieve. Our experimental results show that a multidimensional set of predictor variables, which considers features of both the user who posted the tip and the venue where it was posted, leads to more accurate results than using each set of features inisolation. Our models, when applied to Foursquare tips, are also more robust than state-of-the-art popularity prediction methods, as they can be applied to any tip, at or after posting time.

Assunto

Predição (Logica), Computação, Redes sociais on-line, Predição (Lógica), Comportamento do consumidor

Palavras-chave

Popularidade, Redes sociais, do usuário, Predição, Micro-revisões, Comportamento

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por