Improving tourism prediction models using climate and social media data: a fine-grained approach

Descrição

Tipo

Artigo de evento

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Accurate predictions about future events is essential in many areas, one of them being the Tourism Industry. Usually, countries and cities invest a huge amount of money in planning and preparation in order to welcome (and profit from) tourists. An accurate prediction of the number of visits in the following days or months could help both the economy and tourists. Prior studies in this domain explore forecasting for a whole country rather than for fine-grained areas within a country (e.g., specific touristic attractions). In this work, we suggest that accessible data from online social networks and travel websites, in addition to climate data, can be used to support the inference of visitation count for many touristic attractions. To test our hypothesis we analyze visitation, climate and social media data in more than 70 National Parks in U.S during the last 3 years. The experimental results reveal a high correlation between social media data and tourism demands; in fact, in over 80\% of the parks, social media reviews and visitation counts are correlated by more than 50\%. Moreover, we assess the effectiveness of employing various prediction techniques, finding that even a simple linear regression model, when fed with social media and climate data as input features, can attain a prediction accuracy of over 80\% while a more robust algorithm, such as Support Vector Regression, reaches up to 94% accuracy.

Abstract

Previsões precisas sobre eventos futuros são essenciais em muitas áreas, sendo uma delas a Indústria do Turismo. Normalmente, os países e cidades investem uma enorme quantidade de dinheiro no planeamento e preparação para receber (e lucrar com) os turistas. Uma previsão precisa do número de visitas nos dias ou meses seguintes poderia ajudar tanto a economia como os turistas. Estudos anteriores neste domínio exploram previsões para um país inteiro, em vez de áreas refinadas dentro de um país (por exemplo, atrações turísticas específicas). Neste trabalho, sugerimos que dados acessíveis de redes sociais online e sites de viagens, além de dados climáticos, podem ser utilizados para apoiar a inferência da contagem de visitação de diversos atrativos turísticos. Para testar nossa hipótese, analisamos dados de visitação, clima e mídia social em mais de 70 Parques Nacionais nos EUA durante os últimos 3 anos. Os resultados experimentais revelam uma elevada correlação entre os dados das redes sociais e as procuras turísticas; na verdade, em mais de 80% dos parques, as avaliações nas redes sociais e as contagens de visitação estão correlacionadas em mais de 50%. Além disso, avaliamos a eficácia do emprego de várias técnicas de previsão, descobrindo que mesmo um modelo de regressão linear simples, quando alimentado com mídias sociais e dados climáticos como recursos de entrada, pode atingir uma precisão de previsão superior a 80%, enquanto um algoritmo mais robusto, como como regressão vetorial de suporte, atinge até 94% de precisão.

Assunto

Turismo, Analise de series temporais - Processamento de dados, Mídias sociais, Aprendizado de máquina

Palavras-chave

Tourism demand prediction, Time-series analysis, Social media and climate data, Machine learning

Citação

Curso

Endereço externo

https://ojs.aaai.org/index.php/ICWSM/article/view/15075

Avaliação

Revisão

Suplementado Por

Referenciado Por