Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/83638
Type: | Dissertação |
Title: | Behavioral analysis and bot detection in e-commerce navigation data |
Other Titles: | Análise de comportamento e detecção de bots em dados de navegação no comércio eletrônico |
Authors: | Amanda Fagundes de Paula |
First Advisor: | Fabrício Murai Ferreira |
First Referee: | Ana Paula Couto da Silva |
Second Referee: | Gisele Lobo Pappa |
Abstract: | Understanding user behavior on e-commerce platforms is crucial for enhancing customer experience and identifying anomalous activities, including bot interactions. This research conducts a comprehensive exploratory data analysis (EDA) to examine navigation data, revealing significant differences in session attributes, transition patterns, and behavioral dynamics. These insights create a foundation for systematically studying legitimate and anomalous user behaviors in online shopping contexts. As a complementary step to the exploratory analysis, we utilized a One-Class Support Vector Machine (OC-SVM) to detect anomalies in session data. A subset of labeled examples guided the fine-tuning process, enabling the selection of optimal model configurations and reinforcing the validity of the behavioral patterns identified in the EDA. Using the Fβ-Score with β = 0.5, as a performance metric, the experiments highlighted that linear and low-degree polynomial kernels performed well in balancing precision and recall. The results indicated that anomalous sessions tend to exhibit navigation patterns dominated by ``highly likely'' transitions, reflecting the engineered features' discriminative power. Subsequently, the optimized model was used to predict the classes of previously unlabeled sessions, extending the dataset with new classifications. These predictions enabled a deeper examination of the distinctions between anomalous and legitimate behaviors by revisiting key analyses and exploring additional insights within the newly labeled dataset. This complementary step underscores the practical value of the EDA findings in supporting anomaly detection in e-commerce contexts. This research underscores the importance of robust data exploration in anomaly detection, demonstrating how well-structured EDA can inform model design and interpretation. The findings provide valuable insights into user behavior and offer a systematic approach to bot detection in e-commerce environments. |
Abstract: | Compreender o comportamento dos usuários em plataformas de e-commerce é fundamental para aprimorar a experiência do cliente e identificar atividades anômalas, como interações realizadas por bots. Este estudo realizou uma análise exploratória de dados (EDA) abrangente, examinando informações de navegação e revelando diferenças significativas em atributos de sessão, padrões de transição e dinâmicas comportamentais. Esses insights oferecem uma base sólida para o estudo sistemático de comportamentos legítimos e anômalos em contextos de compras online. Como etapa complementar à análise exploratória, utilizamos um modelo de One-Class Support Vector Machine (OC-SVM) para detectar anomalias nos dados de sessão. Um subconjunto de exemplos rotulados foi usado para ajustar os hiperparâmetros e selecionar as configurações ideais do modelo, reforçando a validade dos padrões comportamentais identificados na EDA. Com o uso do Fβ-Score, onde β = 0.5, como métrica de desempenho, os experimentos mostraram que os kernels lineares e polinomiais de baixa ordem apresentaram bons resultados no equilíbrio entre precisão e recall. Os resultados indicaram que sessões anômalas tendem a exibir padrões de navegação dominados por transições “altamente prováveis”, refletindo o poder discriminativo das features projetadas. Posteriormente, o modelo otimizado foi aplicado para prever as classes de sessões anteriormente não rotuladas, ampliando o conjunto de dados com novas classificações. Essas previsões permitiram uma análise mais profunda das diferenças entre comportamentos anômalos e legítimos, revisitando análises-chave e explorando novos insights no conjunto de dados expandido. Essa etapa complementar destaca o valor prático dos achados da EDA no suporte à detecção de anomalias em e-commerce. Este estudo reforça a importância de uma exploração robusta de dados na detecção de anomalias, demonstrando como uma EDA bem estruturada pode informar o design e a interpretação de modelos. Os resultados fornecem insights valiosos sobre o comportamento dos usuários e oferecem uma abordagem sistemática para a detecção de bots em ambientes de e-commerce. |
Subject: | Computação – Teses Classificação (Computadores) – Teses Comercio eletrônico – Medidas de Segurança – Teses Usuários da internet – Teses Markov, Processos de - Teses |
language: | eng |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.department: | ICEX - INSTITUTO DE CIÊNCIAS EXATAS |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Ciência da Computação |
Rights: | Acesso Aberto |
metadata.dc.rights.uri: | http://creativecommons.org/licenses/by-nd/3.0/pt/ |
URI: | http://hdl.handle.net/1843/83638 |
Issue Date: | 25-Feb-2025 |
Appears in Collections: | Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
dissertacao_mestrado_amanda_fagundes_2025.pdf | 2.04 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License