It's not pornography, it's abuse! Exploring visual cues for the classification of child sexual abuse imagery

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Não é pornografia, é abuso! Explorando pistas visuais para a classificação de imagens de abuso sexual infantil

Primeiro orientador

Membros da banca

Fabrício Benevenuto de Souza
Raquel Oliveira Prates
Anderson de Rezende Rocha
Marjory Cristiany da Costa Abreu

Resumo

Exposing children through images for sexual purposes is a long-lasting form of abuse, leading to an endless cycle of revictimization as long as the images continue to be distributed. The production and sharing of novel child sexual abuse imagery (CSAI) is growing exponentially, such that human experts can no longer handle manual inspection. However, the automatic classification of novel CSAI is a challenging field of research, largely due to data inaccessibility, that is – and should forever be – private and in sole possession of law enforcement agencies. The mere concept of sexual abuse in images of children is challenging to define objectively, ranging from sexually explicit activities to hints of sexuality conveyed by the individual's behavior or contextual cues such as the scene, attire, or other objects. In surveying the sparse CSAI classification literature, our contribution is two-fold. First, we gather all relevant features that have already been explored in this context, and based on the literature on dataset inspection, we present a thorough analysis of a real database built by Brazil's Federal Police. This analysis seeks to consolidate the proxy tasks explored in the literature for which legal data are widely available, such as pornography classification and age estimation. Upon inspecting the literature, we propose a human-centric perception pipeline as an auxiliary task to support CSAI classification. Our proposal is a method for simultaneous estimation of skeletal coordinates (i.e., pose) and hierarchical detection of people and their respective body parts (e.g., head, chest, hip, and hands) tailored to the CSAI domain. To evaluate the pipeline's robustness to domain shifts, we introduce a novel dataset, the Body-Keypoint-Part Dataset (BKPD), gathering diverse samples with respect to age groups and sexual explicitness. Our method addresses previously unexplored targets within CSAI classification literature, paving the way for novel research opportunities. Through analyzing real-world data and investigating novel targets, we aim to go beyond supporting law enforcement with automated tools for data triage, leaving a trail of contributions to encourage other researchers to join the field of CSAI classification.

Abstract

A exposição de crianças para fins sexuais por meio de imagens é uma forma perene de abuso, levando a um ciclo de revitimização enquanto as imagens continuam a ser distribuídas. A produção e o compartilhamento de imagens de abuso sexual infantil — child sexual abuse imagery (CSAI) — crescem exponencialmente em volume, de modo que especialistas forenses enfrentam dificuldades para realizar inspeções manuais. No entanto, a classificação automática de CSAI inéditas ´e um campo de pesquisa desafiador, em grande parte devido `a inacessibilidade dos dados que são — e devem para sempre ser — privados e de posse exclusiva das agências de aplicação da lei. O mero conceito de abuso sexual em imagens de crianças encontra desafios para ser definido de maneira objetiva, incluindo desde atividades sexuais explícitas, até sugestões de sexualidade comunicadas pelo comportamento do indivíduo ou indicações contextuais como locais, vestimentas ou outros objetos. Ao inspecionar a escassa literatura de classificação de CSAI, nossa contribuição vem em duas etapas. Primeiro, reunimos as características j´a propostas para a tarefa de classificação e, com base na literatura de inspeção de datasets, apresentamos uma análise minuciosa de um dataset real construído pela Polícia Federal do Brasil. Essa análise busca consolidar as tarefas substitutivas exploradas na literatura, para as quais existem dados legais amplamente disponíveis, como classificação de pornografia, estimativa de idade, entre outros. Após a revisão da literatura, propomos um pipeline de percepção centrada no humano como uma tarefa auxiliar para apoiar a classificação de CSAI. Nossa proposta ´e um m´método para a estimativa simultânea de coordenadas do esqueleto (ou seja, pose) e a detecção hierárquica de pessoas e suas respectivas partes do corpo (por exemplo, cabeça, peito, quadril e mãos), adaptado ao domínio de CSAI. Para avaliar a robustez do pipeline a mudanças de domínio, introduzimos um novo conjunto de dados, o Body-Keypoint-Part Dataset (BKPD), reunindo amostras diversas em relação a grupos etários e `a explicitude sexual. Nosso m´método aborda alvos anteriormente inexplorados na literatura de classificação de CSAI, abrindo caminho para novas oportunidades de pesquisa. Por meio da análise de dados do mundo real e da investigação de novos alvos, buscamos ir além do apoio `as autoridades policiais com ferramentas automatizadas para triagem de dados, deixando um legado de contribuições para encorajar outros pesquisadores a ingressarem no campo da classificação de CSAI.

Assunto

Computação – Teses, Processamento de imagens - Teses, Classificação (Computadores) – Teses, Crime sexual contra as crianças - Teses, Pornografia - Análise de dados – Teses

Palavras-chave

child sexual abuse imagery, pornography, dataset inspection, human parsing

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por