It's not pornography, it's abuse! Exploring visual cues for the classification of child sexual abuse imagery
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Não é pornografia, é abuso! Explorando pistas visuais para a classificação de imagens de abuso sexual infantil
Primeiro orientador
Membros da banca
Fabrício Benevenuto de Souza
Raquel Oliveira Prates
Anderson de Rezende Rocha
Marjory Cristiany da Costa Abreu
Raquel Oliveira Prates
Anderson de Rezende Rocha
Marjory Cristiany da Costa Abreu
Resumo
Exposing children through images for sexual purposes is a long-lasting form of abuse, leading to an endless cycle of revictimization as long as the images continue to be distributed. The production and sharing of novel child sexual abuse imagery (CSAI) is growing exponentially, such that human experts can no longer handle manual inspection. However, the automatic classification of novel CSAI is a challenging field of research, largely due to data inaccessibility, that is – and should forever be – private and in sole possession of law enforcement agencies. The mere concept of sexual abuse in images of children is challenging to define objectively, ranging from sexually explicit activities to hints of sexuality conveyed by the individual's behavior or contextual cues such as the scene, attire, or other objects. In surveying the sparse CSAI classification literature, our contribution is two-fold. First, we gather all relevant features that have already been explored in this context, and based on the literature on dataset inspection, we present a thorough analysis of a real database built by Brazil's Federal Police. This analysis seeks to consolidate the proxy tasks explored in the literature for which legal data are widely available, such as pornography classification and age estimation. Upon inspecting the literature, we propose a human-centric perception pipeline as an auxiliary task to support CSAI classification. Our proposal is a method for simultaneous estimation of skeletal coordinates (i.e., pose) and hierarchical detection of people and their respective body parts (e.g., head, chest, hip, and hands) tailored to the CSAI domain. To evaluate the pipeline's robustness to domain shifts, we introduce a novel dataset, the Body-Keypoint-Part Dataset (BKPD), gathering diverse samples with respect to age groups and sexual explicitness. Our method addresses previously unexplored targets within CSAI classification literature, paving the way for novel research opportunities. Through analyzing real-world data and investigating novel targets, we aim to go beyond supporting law enforcement with automated tools for data triage, leaving a trail of contributions to encourage other researchers to join the field of CSAI classification.
Abstract
A exposição de crianças para fins sexuais por meio de imagens é uma forma perene de
abuso, levando a um ciclo de revitimização enquanto as imagens continuam a ser distribuídas. A produção e o compartilhamento de imagens de abuso sexual infantil — child
sexual abuse imagery (CSAI) — crescem exponencialmente em volume, de modo que especialistas forenses enfrentam dificuldades para realizar inspeções manuais. No entanto, a
classificação automática de CSAI inéditas ´e um campo de pesquisa desafiador, em grande
parte devido `a inacessibilidade dos dados que são — e devem para sempre ser — privados
e de posse exclusiva das agências de aplicação da lei. O mero conceito de abuso sexual
em imagens de crianças encontra desafios para ser definido de maneira objetiva, incluindo
desde atividades sexuais explícitas, até sugestões de sexualidade comunicadas pelo comportamento do indivíduo ou indicações contextuais como locais, vestimentas ou outros
objetos. Ao inspecionar a escassa literatura de classificação de CSAI, nossa contribuição
vem em duas etapas. Primeiro, reunimos as características j´a propostas para a tarefa de
classificação e, com base na literatura de inspeção de datasets, apresentamos uma análise
minuciosa de um dataset real construído pela Polícia Federal do Brasil. Essa análise busca
consolidar as tarefas substitutivas exploradas na literatura, para as quais existem dados
legais amplamente disponíveis, como classificação de pornografia, estimativa de idade, entre outros. Após a revisão da literatura, propomos um pipeline de percepção centrada no
humano como uma tarefa auxiliar para apoiar a classificação de CSAI. Nossa proposta ´e
um m´método para a estimativa simultânea de coordenadas do esqueleto (ou seja, pose) e a
detecção hierárquica de pessoas e suas respectivas partes do corpo (por exemplo, cabeça,
peito, quadril e mãos), adaptado ao domínio de CSAI. Para avaliar a robustez do pipeline
a mudanças de domínio, introduzimos um novo conjunto de dados, o Body-Keypoint-Part
Dataset (BKPD), reunindo amostras diversas em relação a grupos etários e `a explicitude
sexual. Nosso m´método aborda alvos anteriormente inexplorados na literatura de classificação de CSAI, abrindo caminho para novas oportunidades de pesquisa. Por meio da
análise de dados do mundo real e da investigação de novos alvos, buscamos ir além do
apoio `as autoridades policiais com ferramentas automatizadas para triagem de dados,
deixando um legado de contribuições para encorajar outros pesquisadores a ingressarem
no campo da classificação de CSAI.
Assunto
Computação – Teses, Processamento de imagens - Teses, Classificação (Computadores) – Teses, Crime sexual contra as crianças - Teses, Pornografia - Análise de dados – Teses
Palavras-chave
child sexual abuse imagery, pornography, dataset inspection, human parsing