Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/43270
Type: Dissertação
Title: Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
Other Titles: Statistical performance evaluation of Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM) classification algorithms for satellite images with different data cubes: a case study in the cerrado biome
Authors: Carlos Eduardo Fernandes de Holanda
First Advisor: Diego Rodrigues Macedo
First Co-advisor: Rodrigo Affonso de Albuquerque Nóbrega
First Referee: Glauco José de Matos Umbelino
Second Referee: Úrsula Ruchkys de Azevedo
Abstract: O principal objetivo deste trabalho é analisar e comparar o desempenho de três algoritmos baseados em aprendizado de máquina: Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) na classificação de imagens de satélite de uso e cobertura da terra utilizando informações altimétricas em diferentes cubos de dados. Nesse sentido, foram interpretados os resultados encontrados nos índices estatísticos de validação e na concordância entre as classes na matriz de confusão, o que pode auxiliar estudantes e pesquisadores da área de sensoriamento remoto a escolherem o algoritmo de classificação que melhor se adeque às suas pesquisas. Para este estudo foram utilizadas imagens do satélite Sentinel 2 e outra imagem que empilha as do Sentinel 2 com imagens derivadas da missão Shuttle Radar Topography Mission (SRTM) no intuito de identificar e interpretar as diferenças nas classificações dessas imagens. O classificador que obteve os melhores desempenhos foi o SVM, tanto para as imagens com os dados altimétricos quanto para as imagens sem estas informações complementares. Apesar do DT ter apresentado resultados satisfatórios, mas inferiores ao SVM, o classificador de DT obteve tempo de processamento para a classificação de imagens muito menor que o do SVM. Diante desse dado, observa-se que, caso a área de pesquisa seja muito extensa ou tenha várias pequenas áreas aliadas a um computador com processador não adequado, o classificador SVM não seria a melhor opção. O algoritmo RF obteve praticamente o mesmo tempo de processamento que o DT, mas atingiu os menores índices estatísticos entre os três classificadores. Ainda, verificou-se que a utilização do cubo de dados com a imagem do SRTM e suas derivações como declividade e rugosidade na classificação do uso e cobertura da terra para os três algoritmos mostraram resultados superiores em comparação com as imagens sem estes dados altimétricos.
Abstract: The main objective of this work is to analyze and compare the performance of three algorithms based on machine learning: Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM) in the classification of land use and land cover satellite images using altimetric information in different data cubes. In this sense, the results found in the statistical indices of validation and agreement between classes in the confusion matrix were interpreted, which can help students and researchers in the field of remote sensing to choose the classification algorithm that best suits their research. For this study, images from the Sentinel 2 satellite and another image that stacks those from Sentinel 2 with images derived from the Shuttle Radar Topography Mission (SRTM) were used in order to identify and interpret the differences in the classifications of these images. The classifier that obtained the best performance was the SVM, both for images with altimetric data and for images without this additional information. Although the DT presented satisfactory results, but inferior to the SVM, the DT classifier had much lower processing time for the classification of images than the SVM. Given this data, it is observed that, if the research area is very extensive or has several small areas combined with a computer with an unsuitable processor, the SVM classifier would not be the best option. The RF algorithm obtained practically the same processing time as the DT, but reached the lowest statistical indexes among the three classifiers. Furthermore, it was found that the use of the data cube with the SRTM image and its derivations such as slope and roughness in the classification of land use and land cover for the three algorithms showed superior results compared to the images without these altimetric data.
Subject: Aprendizado do computador
Solo – Uso
Mapeamento da cobertura do solo
Sensoriamento remoto
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: IGC - DEPARTAMENTO DE GEOGRAFIA
metadata.dc.publisher.program: Programa de Pós-Graduação em Geografia
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/43270
Issue Date: 30-Nov-2021
Appears in Collections:Dissertações de Mestrado



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.