Unsupervised domain adaptation in sensor data context
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Adaptação de domínio não supervisionado no contexto de dados de sensores
Primeiro orientador
Membros da banca
Pedro Olmo Stancioli Vaz de Melo
Carlos Antônio Caetano Júnior
Carlos Antônio Caetano Júnior
Resumo
Sensor-based Human Activity Recognition (sensor-based HAR) provides valuable knowledge
in many areas, such as medical, military, and security. Recently, wearable devices
have gained space as a relevant data source due to the data capture facility. A massive
number of people use these devices for the comfort and convenience. In addition, the
large number of sensors presented in these devices provide a vast heterogeneity in the
acquired data. Although there is a massive amount of data, it cannot be used together
in a complementary way due to the differences in data. This difference degradates the
performance of the model's application.By mitigating these issues, we proposed an Unsupervised Domain Adaptation
based on a Convolutional Deep Learning model with the Optimal transport technique
to achieve domain invariant representations of the data and use the learned information
from one dataset in another with satisfactory performance. Our approach targets the
HAR task and only holds the source domain labels.We propose a Transfer Learning methodology based on three steps defined as
Teacher-Student structure. In the first step, the Teacher Deep model extract domainshared
features with the help of a probability discrepancy measurement and the available
labels from the Source Domain. For second step, we use the Teacher model, already
trained, and generate labels candidates for the Target domain; after that, we select the
most trustworthy predictions based on our Gaussian Mixture model technique. The third
step, the Student model uses these labels to learn the domain-specific features and generalizes
the classification for all the target Domain. We compare our methodology with
some of the Literature and outperform the current state-of-the-art experiments, achieving
a result of 72.29% accuracy in contrast to 53.54% previous experiments achieved. In
another batch of experiments, we achieved a performance of 95.70% on a dataset without
a single label.We adopt three common public datasets in our experiments: Daily and Sports
Activities (DSADS), Human Activity Recognition Using Smartphones (UCI-HAR) and
USC human activity dataset (USC-HAD).
Abstract
O reconhecimento de atividade humana baseado em sensor (HAR baseado em sensor) fornece informações valiosas para muitas áreas, como, médica, militar e segurança. Recentemente, os dispositivos ganharam espaço como fonte relevante de dados devido `a
facilidade de armazenamento de dados, captura, e o grande número de pessoas que usam esses dispositivos. Além disso, o grande número de sensores presentes nesses dispositivos fornece uma enorme heterogeneidade nos dados adquiridos. Embora existam dados massivos, eles não podem ser usados juntos, de forma complementar, devido `as diferenças dos dados. Essa diferença se torna crítica porque causa degradação de desempenho quando um modelo aprende uma tarefa em um conjunto de dados e a executa em outro conjunto. Acreditamos que, amenizando esses problemas, podemos usar as informações aprendidas de um conjunto de dados e usá-las em outro conjunto de dados com desempenho satisfatório. Definimos o conjunto de dados onde a tarefa é aprendida como domínio de Source e o conjunto de dados onde realizamos a tarefa, sem aprendizado prévio como domínio Target. Nossa abordagem é baseada na tarefa HAR e possuímos os rótulos apenas do domínio Source. Este problema é definido como adaptação de domínio não supervisionado. Para enfrentar esse problema, propomos uma metodologia de Transferência de Aprendizagem baseada em duas etapas. Na primeira, usamos um modelo de Deep Learning para extrair Features compartilhados entre domínios e o segundo para extrair Features específicas de domínio. O método é baseado em uma estrutura Teacher-student, em que o Teacher aprende características comuns aos domínios com a ajuda de uma medida de discrepância de probabilidade. Este modelo aprende características discriminativos para os dados Source, usando as informações disponíveis. E, para o Target, esse modelo aprende
características similares usando a medida de discrepância. O Teacher produz pseudorótulos para o conjunto de dados Target e usamos uma nova metodologia para selecionar os rótulos mais confiáveis. Esses rótulos são usados pelo modelo Student para aprender as características específicos do domínio. Depois que o modelo Student é treinado, ele produz os rótulos finais e medimos o desempenho. Comparamos nossa metodologia com algumas da Literatura e alcançamos o estado da arte em muitos cenários.
Assunto
Computação – Teses, Visão por computador – Teses, Aprendizado profundo – Teses, Análise de domínio temporal - Teses
Palavras-chave
Domain adaptation, Deep learning, Probability