Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/46307
Type: Dissertação
Title: Uma proposta de conceitos de justiça aplicadas a modelos de análise de sobrevivência
Other Titles: A proposal for fairness definitions applied to survival analysis models
Authors: Bruna Roberta Seewald da Silva
First Advisor: Flavio Vinicius Diniz de Figueiredo
First Referee: Sandra Eliza Fontes de Avila
Second Referee: Ana Paula Couto da SIlva
Third Referee: Jussara Marques de Almeida Gonçalves
Abstract: O crescente uso de Aprendizado de Máquina (AM) no nosso cotidiano traz preocupações sobre os possíveis impactos que tais ferramentas podem causar na sociedade. Atualmente, já vemos algoritmos sendo utilizados para auxiliar no processo de contratação de pessoas e na identificação de possíveis criminosos através de imagens. Do ponto de vista socioeconômico, as decisões tomadas em situações como essas são cruciais. Portanto, é essencial que não haja um comportamento discriminatório em relação a certos grupos e/ou populações. Essa dissertação irá propor uma ponte entre justiça em AM sob uma nova perspectiva, de análise de sobrevivência (i.e., modelos de Cox e variações com Aprendizado Profundo). Para realizar nosso objetivo, fizemos uma re- visão em ambas as literaturas. Depois, apresentamos quatro propostas de definição de justiça para análise de sobrevivência. A primeira e a segunda proposta, denominadas divergência em paridade demográfica, focaram na divergência entre as curvas empíricas e as curvas preditas. A terceira proposta, denominada discriminação causal, consistiu de verificar o erro a partir do cálculo do c-index, ao se alterar nos dados o grupo de interesse. E a última proposta é uma nova métrica, denominada justiça de filas, que compara indivíduos de grupos diferentes ao mesmo tempo. Em seguida aplicamos essas propostas nas três bases de dados: a hospitalar MIMIC, além de duas bases de dados reincidência criminal, a Rossi e COMPAS. Entre os resultados, na base MIMIC-III foram encontrados vieses nas proposta de divergência em paridade demográfica, di- vergência em paridade demográfica condicionada e justiça de filas. Um exemplo foi a divergência entre as curvas empíricas e preditas de pessoas negras com câncer, que também apareceu nos recortes para mulheres negras e homens negros com câncer. Nas bases Rossi e COMPAS os vieses apareceram junto a métrica de justiça de filas, que foi a única a identificar vieses em todas as bases analisadas. Além de trazer a discussão de justiça em três contextos diferentes, no momento, essa dissertação é o primeiro trabalho a trazer tal discussão para modelos de Cox.
Abstract: The high demand for machine learning (ML) in our lives brings concern about the possible impacts that such tools may cause on society. Nowadays, algorithms are being used to assist hiring processes and identify criminals through images. From a societal standpoint, decisions made in these situations are critical. Therefore, it is essential that there is no discriminatory behavior against certain groups. To assess this issue, this work proposes to build a bridge between fairness in ML under a new perspective, from survival analysis (e.g., Cox models and variations with deep learning). To accomplish our goal, we have reviewed literature from both areas. Next, we introduced four proposal definitions of fairness for survival analysis. The first and second proposal are nominated divergence in demographic parity. Both of them focus in the difference between empirical and predicted curves. The third proposal, called casual discrimination, verifies the error of calculationg the c-index when we change data for specifics group. The last proposal is a new metric, called "justiça de filas", which compares individuals from different groups at the same time. After that, we applied these proposals on three different databases: the first one was from the heath domain, MIMIC-III, and the other two were from the criminal domain, Rossi and COMPAS. In MIMIC-III database, bias appeared in the divergence in demographic parity proposal, divergence in conditional demographic parity proposal and "justiça de filas". For example, there was a difference between the empirical and predicted curves for blacks with cancer. The same happened with black women and black men with cancer. In Rossi and COMPAS databases, situations with bias appeared using the "justiça de filas"metric, which was responsible for identified bias in all databases analyzed. In addition to the discussion in these three different contexts, at this moment, this dissertation is the first one to bring this to Cox models.
Subject: Computação – Teses
Análise de sobrevivência – Teses
Justiça – Aprendizado de maquina – Teses
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/46307
Issue Date: 3-Dec-2021
Appears in Collections:Dissertações de Mestrado



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.