Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/75942
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Antônio de Pádua Bragapt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1130012055294645pt_BR
dc.contributor.referee1Frederico Gualberto Ferreira Coelhopt_BR
dc.contributor.referee2Gustavo Matheus de Almeidapt_BR
dc.contributor.referee3Carlos Eduardo Ribeiro de Mellopt_BR
dc.contributor.referee4Raul Fonseca Netopt_BR
dc.contributor.referee5Saulo Moraes Villelapt_BR
dc.creatorLourenço Ribeiro Grossi Araujopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5431964263222139pt_BR
dc.date.accessioned2024-09-04T16:40:37Z-
dc.date.available2024-09-04T16:40:37Z-
dc.date.issued2024-03-21-
dc.identifier.urihttp://hdl.handle.net/1843/75942-
dc.description.abstractInicialmente, o Aumento de Dados era visto mais como uma ferramenta do que uma linha de pesquisa, propriamente, e era empregado de forma essencialmente empírica. Transformações geométricas e fotométricas gerais eram aplicadas a conjuntos de dados, sem grande consideração pelo processo de aumento. Posteriormente, um interesse por rotinas de Aumento de Dados mais eficientes levou à proposta de novas técnicas. Tais técnicas resultaram em ganhos de desempenho e foram focadas em novas formas de geração de novos dados. Modelos generativos e estratégias automatizadas de seleção de transformações foram empregadas com sucesso. A estrutura dos dados, no entanto, permanece por ser explorada. Um conceito conhecido na literatura de Aprendizado de Máquinas, diz respeito ao diferente impacto de diferentes amostras em modelos discriminativos, princípio explorado em técnicas como Boosting e Máquinas de Vetor de Suporte. Amostras de difícil classificação e aquelas próximas da superfície de decisão são cruciais para a construção de um bom modelo. Este trabalho propõe estratégias para a seleção de amostras para Aumento de Dados, que podem ser aplicadas de forma confiável e razoável a grandes conjuntos de dados, pois são velozes, escaláveis e envolvem poucos hiperparâmetros. A confiabilidade é apresentada com um estudo formal de efeitos na margem de separação, com o auxílio de uma estrutura baseada no Grafo de Gabriel. O estudo de probabilidades na margem em um Grafo de Gabriel levou ao desenvolvimento de uma formulação estocástica para o Grafo que tem, em si mesma, grande valor.pt_BR
dc.description.resumoAt first, Data Augmentation was viewed more as a tool than a research line, and it was employed in a very empirical way. General geometric and photometric transformations were applied to datasets with little regard to the augmentation process. Later, an interest for more effective Data Augmentation routines started to develop and new techniques were proposed. These new techniques led to an improvement in performance and focused mainly in finding new ways to generate data. Generative models and automated strategies that optimized the choices of transformations were employed with success. Data structure, however, remains to be explored. It is well known in Machine Learning literature that different samples have a different impact in discriminative models, a concept that is explored by state of the art techniques such as Boosted Trees and Support Vector Machines. Samples that are harder to classify or those that are closer to the decision boundary are crucial to the construction of a good model. This work proposes a strategy for selecting samples for Data Augmentation that can be reliably and reasonably applied to large datasets, as it is scalable, fast and involves few user defined parameters. Reliability is shown with a formal study of margin effects by means of a Gabriel Graph framework that is also presented. The study of margin probabilities in Gabriel Graph has also led to a stochastic formulation of the Gabriel Graph that has, in itself, great value.pt_BR
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológicopt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICApt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétricapt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Restritopt_BR
dc.subjectNeural networkspt_BR
dc.subjectGabriel Graphpt_BR
dc.subjectBoolean spacept_BR
dc.subjectData augmentationpt_BR
dc.subject.otherEngenharia elétricapt_BR
dc.subject.otherRedes neurais (Computação)pt_BR
dc.subject.otherÁlgebra booleanapt_BR
dc.subject.otherAprendizado do computadorpt_BR
dc.subject.otherModelos matemáticospt_BR
dc.titleSample selection strategies for data augmentation with Gabriel Graph margin interpretationpt_BR
dc.typeTesept_BR
dc.description.embargo2026-03-21-
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
textopronto.pdf
???org.dspace.app.webui.jsptag.ItemTag.restrictionUntil??? 2026-03-21
5.96 MBAdobe PDFView/Open    Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.