Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/80193
Type: Artigo de Periódico
Title: Chlorophyll-a Estimation in 149 Tropical Semi-Arid Reservoirs Using Remote Sensing Data and Six Machine Learning Methods
Authors: Souza Filho, Francisco de Assis de
Santos, Victor Oliveira
Guimarães, Bruna Monallize Duarte Moura
Lima Neto, Iran Eduardo
Rocha, Paulo Alexandre Costa
Thé, Jesse Van Griensven
Gharabaghi, Bahram
Keywords in Brazilian Portuguese : clorofila-a;Satélite Sentinel-2;eutrofização
Keywords in English : chlorophyll-a;Sentinel-2 satellite;eutrophication
Knowledge Areas - CNPq: CNPQ::ENGENHARIAS::ENGENHARIA SANITARIA
Issue Date: 2024
Publisher: remote sensing
Citation: SOUZA FILHO OLIVEIRA SANTOS, V.; GUIMARÃES, B. M. D. M.; NETO, I. E. L.; SOUZA FILHO, F. A.; COSTA ROCHA, P. A.; THÉ, J. V. G.; GHARABAGHI, B. Chlorophyll-a estimation in 149 tropical semi-arid reservoirs using remote sensing data and six machine learning methods. Remote Sensing, v. 16, n. 11, p. 1870, 2024. Disponível em: https://doi.org/10.3390/rs16111870. Acesso em: 27/03/2025 .
Abstract in Brazilian Portuguese: É crucial monitorar a proliferação de algas em reservatórios de água doce através de um exame de concentrações de clorofila-a (Chla), pois indicam a condição trófica desses corpos d'água. Os métodos tradicionais de monitoramento, entretanto, são caros e demorados. Resolvendo isso obstáculo, conduzimos uma investigação abrangente usando vários modelos de aprendizado de máquina para Modelagem Chla. Para este fim, utilizamos dados de amostras de água coletadas in situ e dados de sensoriamento remoto de o satélite Sentinel-2, incluindo bandas espectrais e índices, para cobertura em larga escala. Esta abordagem nos permitiu realizar uma análise abrangente e caracterização das concentrações de Chla em 149 reservatórios de água doce no Ceará, uma região semiárida do Brasil. A máquina implementada modelos de aprendizagem incluíam k-vizinhos mais próximos, floresta aleatória, aumento de gradiente extremo, o mínimo encolhimento absoluto e método de grupo de tratamento de dados (GMDH); em particular, o GMDH abordagem não foi explorada anteriormente neste contexto. A abordagem progressiva gradual foi usado para determinar o melhor subconjunto de parâmetros de entrada. Usando uma divisão 70/30 para o treinamento e testando conjuntos de dados, o modelo com melhor desempenho foi o modelo GMDH, alcançando um R 2 de 0,91, um MAPE de 102,34% e RMSE de 20,4 μg/L, valores consistentes com os encontrados no literatura. No entanto os valores previstos de concentração de Chla foram mais sensíveis ao vermelho bandas verdes e infravermelhas próximas.
Abstract: It is crucial to monitor algal blooms in freshwater reservoirs through an examination of chlorophyll-a (Chla) concentrations, as they indicate the trophic condition of these waterbodies. Traditional monitoring methods, however, are expensive and time-consuming. Addressing this hindrance, we conducted a comprehensive investigation using several machine learning models for Chla modeling. To this end, we used in situ collected water sample data and remote sensing data from the Sentinel-2 satellite, including spectral bands and indices, for large-scale coverage. This approach allowed us to conduct a comprehensive analysis and characterization of the Chla concentrations across 149 freshwater reservoirs in Ceará, a semi-arid region of Brazil. The implemented machine learning models included k-nearest neighbors, random forest, extreme gradient boosting, the least absolute shrinkage, and the group method of data handling (GMDH); in particular, the GMDH approach has not been previously explored in this context. The forward stepwise approach was used to determine the best subset of input parameters. Using a 70/30 split for the training and testing datasets, the best-performing model was the GMDH model, achieving an R 2 of 0.91, an MAPE of 102.34%, and an RMSE of 20.4 μg/L, which were values consistent with the ones found in the literature. Nevertheless, the predicted Chla concentration values were most sensitive to the red, green, and near-infrared bands.
Document URL: https://www.mdpi.com/2072-4292/16/11/1870/xml
URI: http://repositorio.ufc.br/handle/riufc/80193
DOI: https://doi.org/10.3390/rs16111870
ISSN: 2072-4292
Author's ORCID: 0000-0001-5989-1731
Author's Lattes: 4988966386848759
Access Rights: Acesso Aberto
Appears in Collections:DEHA - Artigos publicados em revista científica

Files in This Item:
File Description SizeFormat 
2024_art_fasouzafilho.pdf4,07 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.