Reconhecimento automático de sinais da Libras : desenvolvimento da base de dados MINDS-Libras e modelos de redes convolucionais

dc.creatorTamires Martins Rezende
dc.date.accessioned2022-03-03T19:47:41Z
dc.date.accessioned2025-09-08T22:55:37Z
dc.date.available2022-03-03T19:47:41Z
dc.date.issued2021-07-23
dc.description.abstractThe automatic recognition of Sign Language has been a challenge for the Computational Intelligence area, given the visual-gestural nature that configures this complex communication system. This thesis falls within this context and focuses efforts on the Brazilian Sign Language, Libras. For this purpose, a new database called MINDS-Libras has been proposed. It contains (i) RGB videos, (ii) videos with depth information, (iii) information from 25 points/joints of the body and from (iv) 1347 points of the face of the signaller. Each of the 20 signs that build this base were recorded 5 times by 12 signallers, totaling 1200 samples. Using this data, two different Deep Learning architectures were proposed for recognizing the MINDS-Libras signs. The first one was a 3D Convolutional Neural Network by using videos, and the second a Temporal Convolutional Neural Network for the manual trajectory. The best leave-one-signaller-out was that based in the hand movement, and this can be considered the most important parameter for sign formation. The results also indicate that this approach is feasible for the Libras signs recognition. New perspectives may be opened with the expansion of the database and add more signallers in the process of recording (new) signs.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.identifier.urihttps://hdl.handle.net/1843/39785
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/
dc.subjectEngenharia elétrica
dc.subjectAprendizado profundo
dc.subjectLíngua brasileira de sinais
dc.subjectLíngua de sinais
dc.subjectRedes neurais convolucionais
dc.subject.otherAprendizado profundo
dc.subject.otherRedes neurais convolucionais
dc.subject.otherReconhecimento automático da Libras
dc.subject.otherLíngua de sinais
dc.subject.otherLibras
dc.titleReconhecimento automático de sinais da Libras : desenvolvimento da base de dados MINDS-Libras e modelos de redes convolucionais
dc.typeTese de doutorado
local.contributor.advisor-co1Sílvia Grasiella Moreira Almeida
local.contributor.advisor1Frederico Gadelha Guimarães
local.contributor.advisor1Latteshttp://lattes.cnpq.br/2472681535872194
local.contributor.referee1Cleber Zanchettin
local.contributor.referee1David Menotti Gomes
local.contributor.referee1Silvia Silva da Costa Botelho
local.contributor.referee1Hani Camille Yehia
local.creator.Latteshttp://lattes.cnpq.br/7705199625744561
local.description.resumoO reconhecimento automático da Língua de Sinais tem sido um desafio para a área de Inteligência Computacional, dada a natureza visual-gestual que configura esse complexo sistema de comunicação. Esta tese se insere nesse contexto e foca os esforços na língua brasileira de sinais, Libras. Para isso, uma nova base de dados chamada MINDS-Libras foi proposta. Ela contém (i) vídeos em RGB, (ii) vídeos com informação de profundidade, (iii) informações de 25 pontos/juntas do corpo e de (iv) 1347 pontos da face do sinalizador. Cada um dos 20 sinais que compõem essa base foi gravado 5 vezes por 12 sinalizadores, totalizando 1200 amostras. Utilizando esses dados, duas diferentes arquiteturas de Aprendizado Profundo foram propostas para reconhecimento dos sinais da MINDS-Libras. A primeira delas foi uma Rede Neural Convolucional 3D utilizando vídeos e, a segunda, uma Rede Neural Convolucional Temporal para a trajetória manual. A abordagem que apresentou menor sensibilidade à mudança do sinalizador foi aquela cujo dado de entrada era o movimento das mãos, podendo esse ser considerado o parâmetro mais importante para a formação do sinal. Os resultados também indicam que esse tipo de abordagem é viável para o reconhecimento dos sinais da Libras. Novas perspectivas podem ser abertas com a expansão da base de dados e inclusão de mais sinalizadores no processo de gravação de (novos) sinais.
local.identifier.orcidhttps://orcid.org/0000-0002-5152-2488
local.publisher.countryBrasil
local.publisher.departmentENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tamires_Tese_MINDS.pdf
Tamanho:
38.51 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: