Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/51331
Type: Tese
Title: Semantic segmentation with multi-source domain adaptation for radiological images
Authors: Hugo Neves de Oliveira
First Advisor: Jefersson Alex dos Santos
First Co-advisor: Arnaldo de Albuquerque Araújo
First Referee: Mário Fernando Montenegro Campos
Second Referee: Anísio Mendes Lacerda
Third Referee: Moacir Antonelli Ponti
metadata.dc.contributor.referee4: Alexandre Xavier Falcão
Abstract: Técnicas de digitalização distintas para imagens médicas resultam em diferentes padrões visuais nas amostras de vários tipos de exames radiológicos. Essas diferenças podem dificultar o uso de técnicas de Aprendizado de Máquina baseadas em dados para inferência sobre essas imagens, como métodos de Aprendizado Profundo. Outra considerável dificuldade neste ramo de pesquisa é a falta de amostras rotuladas, embora haja em muitos casos uma abundância de dados não-rotulados. Portanto um importante passo para melhorar a capacidade de generalização desses métodos é a aprimoração de técnicas de Adaptação de Domínio Não-Supervisionada e Semi-Supervisionada entre diferentes bancos de dados de imagens médicas. Visando resolver esse problema, neste trabalho são propostos dois métodos de Adaptação de Domínio Não-Supervisionada e Semi-Supervisionada para tarefas de rotulação densa em imagens médicas que usa Redes Generativas Adversariais para Tradução Não-Supervisionada de Imagens. Os métodos mesclam esses modelos generativos com arquiteturas conhecidas para segmentação semântica visando criar métodos semi-supervisionados capazes de aprender tanto de dados não rotulados quanto de dados rotulados, sempre que rotulação estiver disponível. O primeiro método proposto, de forma similar à maioria dos outros trabalhos na literatura de Tradução de Imagens, é limitado a um par de domínios: um domínio fonte e um domínio alvo. O segundo método proposto nesse trabalho utiliza treinamento condicional de conjuntos de dados para encorajar Generalização de Domínio entre várias fontes de dados do mesmo tipo. A partir desse segundo método baseado em condicionamento de conjunto de dados, também se propõe uma nova metodologia para segmentação de costelas em imagens de raio-x que não necessita de nenhum tipo de rotulação. Os métodos propostos foram comparados usando vários domínios, bancos de dados, tarefas de segmentação e baselines tradicionais da área de Adaptação de Domínio, tal qual o uso de modelos pré-treinados com e sem fine-tuning. Foram feitas análises quantitativas e qualitativas do método proposto e dos baselines nos vários cenários considerados na avaliação experimental deste trabalho. São observadas as limitações dos métodos Adaptação de Domínio entre apenas um par de conjuntos de dados na construção de métodos generalizáveis de segmentação de radiografias, o que evidencia a melhor eficácia de métodos que se utilizam de várias fontes de dados nessa tarefa. O método baseado em treinamento condicional demonstrou superioridade consistente e significante nos cenários de rotulação escassa – ou seja, quando a rotulação é limitada ou não-existente no conjunto de dados alvo – conseguindo valores de Jaccard maiores que 0.9 na maioria das tarefas. Resultados de Adaptação de Domínio Não-Supervisionada foram observados como próximos dos casos supervisionados usados no procedimento padrão de usar modelos pré-treinados de Redes Neurais Profundas com fine-tuning.
Abstract: Distinct digitization techniques for biomedical images yield different visual patterns in samples from many radiological exams. These differences may hamper the use of data-driven Machine Learning approaches for inference over these images, such as Deep Learning. Another difficulty in this field is the lack of labeled data, even though in many cases there is an abundance of unlabeled data available. Therefore an important step in improving the generalization capabilities of these methods is to perform Unsupervised and Semi-Supervised Domain Adaptation between different datasets of biomedical images. In order to tackle this problem, in this work, we propose an Unsupervised and Semi-Supervised Domain Adaptation method for dense labeling tasks in biomedical images using Generative Adversarial Networks for Unsupervised Image-to-Image Translation. We merge these generative models with well-known supervised deep semantic segmentation architectures in order to create two semi-supervised methods capable of learning from both unlabeled and labeled data, whenever labeling is available. The first Domain-to-Domain method, similarly to most other Image Translation methods in the literature, is limited to a pair of domains: one source and one target. The second proposed methodology takes advantage of conditional dataset training to encourage Domain Generalization from several data sources from the same domain. From this conditional dataset encoding, we also devise a fully novel pipeline for rib segmentation in X-Ray images that does not require any label to be computed. We compare our method using a myriad of domains, datasets, segmentation tasks and traditional baselines in the Domain Adaptation literature, such as using pretrained models both with and without fine-tuning. We perform both quantitative and qualitative analysis of the proposed method and baselines in the multitude of distinct scenarios considered in our experimental evaluation. We empirically observe the limitations of pairwise Domain Adaptation approaches to truly generalizable radiograph segmentation, evidencing the better performance of multi-source training methods in this task. The proposed Conditional Domain Adaptation method shows consistently and significantly better results than the baselines in scarce labeled data scenarios – that is, when labeled data is limited or non-existent in the target dataset – achieving Jaccard indices greater than 0.9 in most tasks. Completely Unsupervised Domain Adaptation results were observed to be close to the Fully Supervised Domain Adaptation used in the traditional procedure of fine-tuning pretrained Deep Neural Networks.
Subject: Computação – Teses.
Aprendizado profundo
Adaptação de domínio
Imagens médicas
Segmentação de imagens.
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by/3.0/pt/
URI: http://hdl.handle.net/1843/51331
Issue Date: 21-Jul-2020
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese_Final_Hugo_Oliveira.pdf14.87 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons