Behavioral analysis and bot detection in e-commerce navigation data

dc.creatorAmanda Fagundes de Paula
dc.date.accessioned2025-07-18T12:58:16Z
dc.date.accessioned2025-09-09T01:32:43Z
dc.date.available2025-07-18T12:58:16Z
dc.date.issued2025-02-25
dc.description.abstractCompreender o comportamento dos usuários em plataformas de e-commerce é fundamental para aprimorar a experiência do cliente e identificar atividades anômalas, como interações realizadas por bots. Este estudo realizou uma análise exploratória de dados (EDA) abrangente, examinando informações de navegação e revelando diferenças significativas em atributos de sessão, padrões de transição e dinâmicas comportamentais. Esses insights oferecem uma base sólida para o estudo sistemático de comportamentos legítimos e anômalos em contextos de compras online. Como etapa complementar à análise exploratória, utilizamos um modelo de One-Class Support Vector Machine (OC-SVM) para detectar anomalias nos dados de sessão. Um subconjunto de exemplos rotulados foi usado para ajustar os hiperparâmetros e selecionar as configurações ideais do modelo, reforçando a validade dos padrões comportamentais identificados na EDA. Com o uso do Fβ-Score, onde β = 0.5, como métrica de desempenho, os experimentos mostraram que os kernels lineares e polinomiais de baixa ordem apresentaram bons resultados no equilíbrio entre precisão e recall. Os resultados indicaram que sessões anômalas tendem a exibir padrões de navegação dominados por transições “altamente prováveis”, refletindo o poder discriminativo das features projetadas. Posteriormente, o modelo otimizado foi aplicado para prever as classes de sessões anteriormente não rotuladas, ampliando o conjunto de dados com novas classificações. Essas previsões permitiram uma análise mais profunda das diferenças entre comportamentos anômalos e legítimos, revisitando análises-chave e explorando novos insights no conjunto de dados expandido. Essa etapa complementar destaca o valor prático dos achados da EDA no suporte à detecção de anomalias em e-commerce. Este estudo reforça a importância de uma exploração robusta de dados na detecção de anomalias, demonstrando como uma EDA bem estruturada pode informar o design e a interpretação de modelos. Os resultados fornecem insights valiosos sobre o comportamento dos usuários e oferecem uma abordagem sistemática para a detecção de bots em ambientes de e-commerce.
dc.identifier.urihttps://hdl.handle.net/1843/83638
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/pt/
dc.subjectComputação – Teses
dc.subjectClassificação (Computadores) – Teses
dc.subjectComercio eletrônico – Medidas de Segurança – Teses
dc.subjectUsuários da internet – Teses
dc.subjectMarkov, Processos de - Teses
dc.subject.otherMarkov chain
dc.subject.otherOne class classifiers
dc.subject.otherOne class SVM
dc.subject.otherBot detection
dc.subject.otherE-commerce
dc.titleBehavioral analysis and bot detection in e-commerce navigation data
dc.title.alternativeAnálise de comportamento e detecção de bots em dados de navegação no comércio eletrônico
dc.typeDissertação de mestrado
local.contributor.advisor1Fabrício Murai Ferreira
local.contributor.advisor1Latteshttp://lattes.cnpq.br/4002187845840872
local.contributor.referee1Ana Paula Couto da Silva
local.contributor.referee1Gisele Lobo Pappa
local.creator.Latteshttps://lattes.cnpq.br/7798714450092979
local.description.resumoUnderstanding user behavior on e-commerce platforms is crucial for enhancing customer experience and identifying anomalous activities, including bot interactions. This research conducts a comprehensive exploratory data analysis (EDA) to examine navigation data, revealing significant differences in session attributes, transition patterns, and behavioral dynamics. These insights create a foundation for systematically studying legitimate and anomalous user behaviors in online shopping contexts. As a complementary step to the exploratory analysis, we utilized a One-Class Support Vector Machine (OC-SVM) to detect anomalies in session data. A subset of labeled examples guided the fine-tuning process, enabling the selection of optimal model configurations and reinforcing the validity of the behavioral patterns identified in the EDA. Using the Fβ-Score with β = 0.5, as a performance metric, the experiments highlighted that linear and low-degree polynomial kernels performed well in balancing precision and recall. The results indicated that anomalous sessions tend to exhibit navigation patterns dominated by ``highly likely'' transitions, reflecting the engineered features' discriminative power. Subsequently, the optimized model was used to predict the classes of previously unlabeled sessions, extending the dataset with new classifications. These predictions enabled a deeper examination of the distinctions between anomalous and legitimate behaviors by revisiting key analyses and exploring additional insights within the newly labeled dataset. This complementary step underscores the practical value of the EDA findings in supporting anomaly detection in e-commerce contexts. This research underscores the importance of robust data exploration in anomaly detection, demonstrating how well-structured EDA can inform model design and interpretation. The findings provide valuable insights into user behavior and offer a systematic approach to bot detection in e-commerce environments.
local.publisher.countryBrasil
local.publisher.departmentICEX - INSTITUTO DE CIÊNCIAS EXATAS
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
dissertacao_mestrado_amanda_fagundes_2025.pdf
Tamanho:
2 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: