Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/55159
Type: Tese
Title: Previsão de demanda de curto prazo em sistemas de abastecimento de água empregando modelos estatísticos, de aprendizagem de máquina e de varredura
Other Titles: Short-term demand forecasting in water supply systems using statistical, machine learning and scanning models
Authors: Gustavo de Souza Groppo
First Advisor: Marcelo Libânio
First Co-advisor: Marcelo Azevedo Costa
First Referee: Veber Afonso Fuigueiredo Costa
Second Referee: Frederico Keizo Odan
Third Referee: Gladston Juliano Prates Moreira
metadata.dc.contributor.referee4: Olavo Correa Pedrollo
Abstract: Na operação de Sistemas de Abastecimento de Água (SAA), um dos fatores críticos do abastecimento é a manutenção do equilíbrio entre a oferta e a demanda de água aos usuários. A manutenção deste equilíbrio é feita através de ações operacionais sendo a previsão de demanda de curto prazo um fator de grande importância para esse gerenciamento. Ao longo dos anos, inúmeros métodos foram desenvolvidos e testados. Os modelos lineares têm sido amplamente utilizados, porque eles são fáceis de desenvolver e implementar, além de simples de entender e interpretar. No entanto, os dados de demanda de água têm diferentes graus de não-linearidade, que não podem ser adequadamente tratados pelos modelos lineares. A revisão de literatura destaca que os modelos mais bem-sucedidos são baseados em abordagens de soft computing, como redes neurais, sistemas fuzzy, computação evolucionária, máquinas de vetores de suporte além dos modelos híbridos. Neste trabalho pesquisamos a viabilidade da utilização do método de varredura temporal Dynamic Time Scan Forecasting (DTSF) para prever a demanda de curto prazo (horário) em sistemas de abastecimento de água por meio da comparação, em termos de eficiência e do custo computacional (CC), de diversas alternativas univariadas conhecidas. Os métodos estatísticos e neuronais empregados foram: Box-Jenkins (SARIMA), alisamento exponencial (ETS), modelo híbrido usando o filtro Seasonal and Trend decomposition using Loess (STL) e o ETS (STL-ETS), modelo Trigonometric Box-Cox transformation, ARMA erros, Trend and Seasonal components (TBATS), além dos modelos neuronais híbridos rede neural autorregressiva não-linear com bootstrap (BNNAR), Extreme Learning Machine (ELM) e o Naive Bayes (NB). Os dados empregados no presente estudo referem-se a uma zona de abastecimento (ZA) localizada na região centro sul de uma capital do Sudeste brasileiro e atende uma população de aproximadamente 230 mil pessoas, podendo ser comparada com uma cidade de médio porte. Objetivando avaliar os métodos empregaram-se as seguintes métricas: raiz do erro quadrático médio (RMSE), erro absoluto médio (MAE), erro percentual absoluto médio (MAPE), Model Fitting (MF), além do CC. Os resultados obtidos demonstram que tanto no verão quanto no outono não houve um modelo que superasse os outros em termos de precisão de previsão. Todavia, para os meses de junho a novembro (inverno e primavera), o método ELM apresentou os melhores resultados. Os dois métodos neuronais apresentaram as melhores acurácias, contudo, foram os que apresentaram os maiores CC ao empregar a validação cruzada de origem deslizante com recalibração. Em relação à estatística CC, o algoritmo DTSF foi extremamente rápido quando comparado aos outros métodos estudados para todos os meses do ano, usando uma fração do tempo. Os resultados obtidos demostraram que o método proposto fornece valores de previsão similares ou melhorados em comparação com métodos de soft computing e estatísticos empregados, mas usando uma fração do tempo de computação. A grande vantagem deste método, dado que é um método orientado a dados, é que quanto maior a quantidade de dados empregada melhor será a sua capacidade de generalização e, em um ambiente conhecido como a era do big data, este obterá vantagem frente aos outros métodos.
Abstract: In the operation of Water Supply Systems (SAA), one of the critical factors of supply is maintaining the balance between water supply and demand to users. The maintenance of this balance is made through operational actions and the forecast of short term demand is a major factor for this management. Over the years, numerous methods have been developed and tested. Linear models have been widely used because they are easy to develop and implement, and simple to understand and interpret. However, water demand data have different degrees of nonlinearity, which cannot be adequately addressed by linear models. The literature review highlights that the most successful models are based on soft computing approaches such as neural networks, fuzzy systems, evolutionary computing, support vector machines, and hybrid models. In this paper we investigate the feasibility of using the Dynamic Time Scan Forecasting (DTSF) time scan method to predict short-term (hourly) demand in water supply systems by comparing efficiency and computational cost (CC), with several known univariate alternatives. The statistical and neuronal methods employed were: Box-Jenkins (SARIMA), Exponential Smoothing (ETS), Hybrid model using Seasonal and Trend decomposition using Loess filter (STL) and ETS (STL-ETS), Trigonometric Box-Cox transformation model, ARMA errors, Trend and Seasonal components (TBATS), in addition to hybrid neuronal models with bootstrap nonlinear autoregressive neural network (BNNAR), Extreme Learning Machine (ELM) and Naive Bayes (NB). The data used in this study refer to a supply zone (ZA) located in the south central region of a capital of south eastern Brazil and serves a population of approximately 230,000 people, and can be compared with a medium-sized city. In order to evaluate the methods, the following metrics were employed: root mean square error (RMSE), mean absolute error (MAE), mean absolute percentage error (MAPE), Model Fitting (MF), in addition to WC. The results show that in both summer and fall there was no model that outperformed the others in terms of forecast accuracy. However, for the months from June to November (winter and spring), the ELM method showed the best results. The two neuronal methods showed the best accuracy, however, the greatest CC when employing cross-validation of sliding origin with recalibration. Regarding the CC statistic, the DTSF algorithm was extremely fast compared to the other methods studied for all months of the year, using a fraction of the time. The results obtained showed that the proposed method provides similar or improved forecast values compared to the soft computing and statistical methods employed, but using a fraction of the computation time. The great advantage of this method, as it is a data-driven method, is that the more data you use, the better your generalizability will be, and in an environment known as the big data era, it will take advantage of others methods.
Subject: Engenharia sanitária
Saneamento
Abastecimento de água
Aprendizado do computador
Métodos estatísticos
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ENG - DEPARTAMENTO DE ENGENHARIA SANITÁRIA E AMBIENTAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Saneamento, Meio Ambiente e Recursos Hídricos
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/55159
Issue Date: 25-Nov-2019
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
TESE_GROPPO_VF.pdf7.3 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons