Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/76784
Type: Dissertação
Title: CSAM detection based on age estimation from faces
Other Titles: Detecção de material de abuso sexual infantil baseado em estimativa de idade de faces
Authors: João José de Macedo Neto
First Advisor: Jefersson Alex dos Santos
First Co-advisor: Filipe de Oliveira Costa
First Referee: Fabrício Benevenuto de Souza
Second Referee: Sandra Eliza Fontes de Ávila
Abstract: The fight against the acquisition and distribution of child sexual abuse material (CSAM) is a major concern for the legal systems of most countries. It involves law enforcement agencies, non-governmental organizations, and companies around the world. Detecting such content is very labor-intensive and there is a great demand for automatic methods to support this task because of the large amount of data that can be stored in current media and mobile devices. Another determining factor for the use of automated tools is the psychological impact and stress caused by continued exposure to this type of material. Most of the proposed methods to detect child pornography automatically in literature are designed to perform binary classification of images or videos, indicating whether they are related to child pornography. These methods employ techniques of image processing, machine learning, and visual pattern recognition. In forensics, a desirable feature for such methods is the estimation of the age of the victims, but few methods implement it. One way to accomplish this is by combining a method of pornography classification with an approach for age estimation through face images, which is one of the most challenging tasks in the field of facial analysis. As there are no available CSAM datasets, since their possession is illegal in many countries, many methods are developed using datasets of pornography (without children) and auxiliary methods. Still, the lack of datasets makes it difficult to compare existing methods. In this work, we propose a CSAM detection technique incorporating deep learning-based methods for (a) age estimation, which was developed in this work, (b) face detection, and (c) pornography classification. We also set up an annotated CSAM dataset containing images of restricted access to the Brazilian Federal Police, aiming at evaluating and comparing child sexual abuse detection methods. The proposed approach was evaluated using this benchmark dataset and achieved 79.84% of accuracy for the child sexual abuse detection task, which overcomes two tools currently used by the Brazilian Federal Police.
Abstract: O combate à distribuição e aquisição de material de abuso sexual infantil é uma questão central para a maioria dos países e envolve agências policiais, organizações não-governamentais e empresas de todo o mundo. A detecção desse conteúdo é trabalhosa e há uma grande demanda para automatização devido à grande quantidade de dados que podem ser armazenados nos celulares e mídias atuais. Um outro fator determinante para a automatização é o impacto psicológico e o estresse causado pela exposição continuada a esse material. A maioria dos métodos para detecção automática de pornografia infantil propostos na literatura realiza uma classificação binária das imagens ou vídeos, indicando se são relacionados a pornografia infantil. Esses métodos empregam técnicas de processamento de imagens, aprendizado de máquina e reconhecimento de padrões visuais. Na área forense, uma funcionalidade desejável para tais métodos é a estimativa da idade das vítimas, mas poucos métodos a implementam. Uma das formas de atender esse requisito é combinando um detector de pornografia com um método de estimativa de idade das faces, que é uma das tarefas mais desafiadoras no campo de análise facial. Como não existem bases de dados de material de abuso sexual infantil, cuja posse é ilegal em vários países, muitos métodos são desenvolvidos usando bases de pornografia (não infantil) e métodos auxiliares. Ainda assim, a inexistência de datasets dificulta a comparação de métodos existentes. Neste trabalho, propomos uma técnica de detecção de material de abuso sexual infantil incorporando métodos baseados em técnicas de aprendizado profundo para a) estimativa de idade, que foi desenvolvido nesse trabalho; b) detecção facial, e c) classificação de pornografia. Nós também montamos um dataset anotado de material de abuso sexual infantil contendo imagens de acesso restrito à Polícia Federal do Brasil, visando avaliar e comparar métodos de detecção deste tipo de conteúdo. A abordagem proposta foi avaliada neste dataset e obteve 79.84% de acurácia na tarefa de detecção de pornografia infantil, superando duas ferramentas utilizadas na Polícia Federal do Brasil.
Subject: Computação – Teses
Visão por computador – Teses
Processamento de imagens – Teses
Reconhecimento de padrões - Teses
Aprendizado profundo – Teses
Crime sexual contra as crianças - Teses
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICEX - INSTITUTO DE CIÊNCIAS EXATAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/76784
Issue Date: 12-Mar-2019
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
dissertacao_mestrado_2019_corrigida_2024.pdfDissertação de Mestrado8.03 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.