Behavioral analysis and bot detection in e-commerce navigation data
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Análise de comportamento e detecção de bots em dados de navegação no comércio eletrônico
Primeiro orientador
Membros da banca
Ana Paula Couto da Silva
Gisele Lobo Pappa
Gisele Lobo Pappa
Resumo
Understanding user behavior on e-commerce platforms is crucial for enhancing customer experience and identifying anomalous activities, including bot interactions. This research conducts a comprehensive exploratory data analysis (EDA) to examine navigation data, revealing significant differences in session attributes, transition patterns, and behavioral dynamics. These insights create a foundation for systematically studying legitimate and anomalous user behaviors in online shopping contexts.
As a complementary step to the exploratory analysis, we utilized a One-Class Support Vector Machine (OC-SVM) to detect anomalies in session data. A subset of labeled examples guided the fine-tuning process, enabling the selection of optimal model configurations and reinforcing the validity of the behavioral patterns identified in the EDA.
Using the Fβ-Score with β = 0.5, as a performance metric, the experiments highlighted that linear and low-degree polynomial kernels performed well in balancing precision and recall. The results indicated that anomalous sessions tend to exhibit navigation patterns dominated by ``highly likely'' transitions, reflecting the engineered features' discriminative power.
Subsequently, the optimized model was used to predict the classes of previously unlabeled sessions, extending the dataset with new classifications. These predictions enabled a deeper examination of the distinctions between anomalous and legitimate behaviors by revisiting key analyses and exploring additional insights within the newly labeled dataset. This complementary step underscores the practical value of the EDA findings in supporting anomaly detection in e-commerce contexts.
This research underscores the importance of robust data exploration in anomaly detection, demonstrating how well-structured EDA can inform model design and interpretation. The findings provide valuable insights into user behavior and offer a systematic approach to bot detection in e-commerce environments.
Abstract
Compreender o comportamento dos usuários em plataformas de e-commerce é fundamental para aprimorar a experiência do cliente e identificar atividades anômalas, como interações realizadas por bots. Este estudo realizou uma análise exploratória de dados (EDA) abrangente, examinando informações de navegação e revelando diferenças significativas em atributos de sessão, padrões de transição e dinâmicas comportamentais. Esses insights oferecem uma base sólida para o estudo sistemático de comportamentos legítimos e anômalos em contextos de compras online.
Como etapa complementar à análise exploratória, utilizamos um modelo de One-Class Support Vector Machine (OC-SVM) para detectar anomalias nos dados de sessão. Um subconjunto de exemplos rotulados foi usado para ajustar os hiperparâmetros e selecionar as configurações ideais do modelo, reforçando a validade dos padrões comportamentais identificados na EDA.
Com o uso do Fβ-Score, onde β = 0.5, como métrica de desempenho, os experimentos mostraram que os kernels lineares e polinomiais de baixa ordem apresentaram bons resultados no equilíbrio entre precisão e recall. Os resultados indicaram que sessões anômalas tendem a exibir padrões de navegação dominados por transições “altamente prováveis”, refletindo o poder discriminativo das features projetadas.
Posteriormente, o modelo otimizado foi aplicado para prever as classes de sessões anteriormente não rotuladas, ampliando o conjunto de dados com novas classificações. Essas previsões permitiram uma análise mais profunda das diferenças entre comportamentos anômalos e legítimos, revisitando análises-chave e explorando novos insights no conjunto de dados expandido. Essa etapa complementar destaca o valor prático dos achados da EDA no suporte à detecção de anomalias em e-commerce.
Este estudo reforça a importância de uma exploração robusta de dados na detecção de anomalias, demonstrando como uma EDA bem estruturada pode informar o design e a interpretação de modelos. Os resultados fornecem insights valiosos sobre o comportamento dos usuários e oferecem uma abordagem sistemática para a detecção de bots em ambientes de e-commerce.
Assunto
Computação – Teses, Classificação (Computadores) – Teses, Comercio eletrônico – Medidas de Segurança – Teses, Usuários da internet – Teses, Markov, Processos de - Teses
Palavras-chave
Markov chain, One class classifiers, One class SVM, Bot detection, E-commerce
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
