Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/77984
Type: | Tese |
Title: | Machine learning algorithms for assessment and prediction of the performance of wastewater treatment plants |
Authors: | Marina Salim Dantas |
First Advisor: | Sílvia Maria Alves Corrêa Oliveira |
First Co-advisor: | Cristiano Christofaro Matosinhos |
First Referee: | Marcelo Cardoso |
Second Referee: | Maria Cristina de Almeida Silva |
Third Referee: | Karla Patricia Santos Oliveira Rodríguez Esquerre |
metadata.dc.contributor.referee4: | Ariuska Karla Barbosa Amorim |
Abstract: | The discharge of untreated or inadequately treated domestic effluents represents the main source of pressure on water resources in Brazil. Wastewater treatment plants (WWTPs) are essential for ensuring public and environmental health. However, in Brazil, design and operation issues can lead to the generation of effluents that do not meet environmental standards. Therefore, monitoring treatment processes is critical, as analysis of data generated from monitoring programs allows for a deeper understanding of the treatment systems in operation and improvements in process performance. Techniques that use machine learning, defined as a set of tools that use computers to transform data into knowledge, are promising for monitoring wastewater treatment processes. Among the existing algorithms, artificial neural networks (ANNs) have been widely employed in the sector as they are robust and efficient in dealing with nonlinear and complex data, such as wastewater treatment monitoring data. Adequate model configuration and hyperparameter settings are essential as they significantly affect predictive model performance. However, there is no guidance on best practices for configuring ANN models, leaving this task to the researcher's experience. This study conducted a systematic literature review on the use of ANNs in predicting the performance of full-scale WWTPs. Publications that modeled different sewage treatment systems in various countries were selected, and the main characteristics of the developed ANN models were identified. Next, the study selected WWTPs in operation in Brazil and the United States as case studies for applying the technique. Brasília Sul WWTP was chosen because it is the largest facility in the Federal District in terms of design flow and employs advanced treatment technology for removing nitrogen and phosphorus. John E. Egan WWTP, operating in Illinois/USA, was selected as it has a similar size to the Brasília Sul facility but a dataset with different characteristics, which could lead to a better performance of the ANN model. Extensive analyses were conducted on the monitoring data to understand the WWTPs' performance and identify important definitions for the next step of model application. The final stage was the application of ANNs to predict effluent concentrations, especially nutrients, in Brasília Sul and John E. Egan facilities. In general, models had adequate predictive performance. However, Brasília Sul WWTP models had some overfitting to the training data, which led to a worse performance during model testing. The results can be explained by the different treatment technologies and the distinct characteristics of the datasets of the facilities, such as the number of observations and monitoring frequencies. This work is expected to contribute to better sanitation systems management in Brazil, mainly concerning the evaluation and prediction of process performance. |
Abstract: | O lançamento de efluentes domésticos brutos ou tratados de maneira insuficiente representa a maior pressão sobre os recursos hídricos no Brasil. Estações de tratamento de esgotos (ETEs) são essenciais para a garantia da saúde pública e ambiental. No entanto, problemas de projeto e operação podem levar à geração de efluentes em desconformidades com padrões ambientais. Desta forma, o monitoramento dos processos de tratamento é de fundamental importância, permitindo a análise dos dados gerados nos programas de monitoramento e ampliando o conhecimento sobre os sistemas em operação, com reflexos positivos no desempenho dos processos. Técnicas que utilizam o aprendizado de máquina, definido como um conjunto de ferramentas que utilizam computadores para transformar dados em conhecimento, são promissoras para o monitoramento de processos de tratamento de esgotos. Dentre os algoritmos existentes, as redes neurais artificiais (RNAs) têm sido amplamente empregadas no setor, uma vez que são robustas e eficientes para lidar com dados não lineares e complexos, como os dados de monitoramento de estações de tratamento de esgotos. A configuração dos modelos e seus hiperparâmetros é uma tarefa essencial para um desempenho satisfatório dos modelos preditivos. Apesar disso, não existe um direcionamento sobre as melhores práticas de configuração dos modelos de RNAs, e esta tarefa é deixada a cargo da experiência do pesquisador. Neste estudo, uma revisão sistemática da literatura sobre o uso de RNAs na previsão do desempenho de ETEs em escala real foi conduzida. Publicações que modelaram diferentes sistemas de tratamento de efluentes domésticos em diversos países foram levantadas e selecionadas e as principais características dos modelos utilizados foram identificadas. Em seguida, o estudo selecionou uma ETE em operação no Brasil e uma nos Estados Unidos como estudos de caso para aplicação da ferramenta. A ETE Brasília Sul foi escolhida por ser a maior ETE do Distrito Federal em termos de vazão de projeto e apresentar tecnologia de tratamento avançada para a remoção de nitrogênio e fósforo. A ETE John E. Egan, em operação em Illinois/EUA, foi selecionada por possuir porte similar à ETE Brasília Sul, mas banco de dados com diferentes características, o que poderia levar a melhor desempenho do modelo de RNA. Análises aprofundadas foram conduzidas nos dados de monitoramento para compreender o desempenho das ETEs e identificar importantes definições para a etapa de aplicação dos modelos. A última etapa da pesquisa foi a aplicação das RNAs para a previsão das concentrações efluentes, principalmente de nutrientes, nas ETEs Brasília Sul e John E. Egan. De maneira geral, os modelos tiveram adequado desempenho preditivo. No entanto, para os modelos da ETE Brasília Sul, houve maior sobreajuste aos dados de treinamento, o que levou a um declínio no desempenho durante o teste dos modelos. Os resultados podem ser explicados devido às diferentes tecnologias de tratamento e distintas características dos bancos de dados das estações, como número de observações e frequências de monitoramento. Espera-se que este trabalho contribua para a melhor gestão dos sistemas de esgotamento sanitário no Brasil, principalmente no que diz respeito à avaliação e previsão do desempenho de processos. |
Subject: | Engenharia sanitária Meio ambiente Inteligência artificial Ciência de dados Aprendizado do computador Estação de Tratamento de Esgoto (ETE) |
language: | eng |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.department: | ENG - DEPARTAMENTO DE ENGENHARIA SANITÁRIA E AMBIENTAL |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Saneamento, Meio Ambiente e Recursos Hídricos |
Rights: | Acesso Aberto |
URI: | http://hdl.handle.net/1843/77984 |
Issue Date: | 20-Aug-2024 |
Appears in Collections: | Teses de Doutorado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tese_Marina_pdfa.pdf | 9.79 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.