برآورد میزان کلروفیل آ در مخزن سد با استفاده از تکنیک‌های سنجش از دور و مدل های داده‌کاوی

نوع مقاله : مقاله کامل علمی پژوهشی

نویسندگان

1 دانشیار، گروه علوم و مهندسی آب، دانشگاه علوم کشاورزی و منابع طبیعی خوزستان، ایران

2 استادیار گروه مهندسی طبیعت، دانشگاه علوم کشاورزی و منابع طبیعی خوزستان، ایران

3 دانشگاه علوم کشاورزی و منابع طبیعی گرگان-گروه مهندسی آب

چکیده

کلروفیل آ به‌عنوان معیاری جهت اندازه‌گیری میزان جلبک در حال رشد در آب مورد استفاده قرار می‌گیرد که می‌توان از آن برای طبقه‌بندی وضعیت تغذیه‌ای پهنه‌های آبی استفاده کرد. ا بر اساس بررسی‌های صورت گرفته غلظت سطوح بسیار بالای کلروفیل آ نشان‌دهنده کیفیت پایین آب است و وجود طولانی‌مدت غلظت‌های بالای کلروفیل آ مشکلات اساسی برای تولید اولیه زیست‌توده است. بر همین اساس غلظت کلروفیل آ یک شاخص کلیدی برای کیفیت آب به‌حساب می‌آید. در این تحقیق سعی شده است تا با استفاده از تکنیک‌های سنجش‌ازدور و مدل‌های داده‌کاوی اقدام به برآورد میزان کلروفیل آ در مخزن سد سردشت گردد. اطلاعات مورد استفاده در این تحقیق به دو قسمت تقسیم می‌شوند. قسمت اول مقادیر اندازه‌گیری شده کلروفیل آ در مخزن سد سردشت می‌باشد. این اطلاعات شامل 7 مرحله اندازه‌گیری در 10 نقطه با مختصات مختلف در مخزن سد بوده و مربوط به اسفندماه 1396 تا خردادماه 1398 می‌باشد. قسمت دوم اطلاعات مورد استفاده، تصاویر ماهواره سنتینل-2 بوده که از اطلاعات آن در مدل-های داده‌کاوی استفاده شده است. اطلاعات باندهای مختلف از تصاویر سنتینل-2 استخراج گردید و بر اساس مقادیر باندی، معیارهای سنجش میزان کلروفیل آ محاسبه شده و در اختیار مدل‌های داده‌کاوی جهت آموزش قرار گرفت. در این تحقیق از سه مدل داده‌کاوی XGBoost، M5 و MARS جهت برآورد میزان کلروفیل آ استفاده شد. در این مطالعه، 9 معادله برآورد کلروفیل آ به عنوان ورودی مدل‌های داده‌کاوی در نظر گرفته شد و مقدار لگاریتم کلروفیل آ اندازه‌گیری شده به عنوان خروجی لحاظ گردید. 80 درصد داده‌های موجود جهت آموزش مدل‌های داده‌کاوی و 20 درصد باقی‌مانده جهت صحت‌سنجی کارایی مدل‌های مورد استفاده به‌کار رفت. بر اساس اطلاعات ورودی، مدل درختی M5 فضای مسئله را به 5 قسمت تقسیم کرده و به ‌ازای هر بخش معادله خطی ارائه داده است. بر اساس ساختار ارائه شده توسط الگوریتم‌های M5 و MARS، ترکیب‌های باندی آبی، قرمز و سبز و نیز مادون‌قرمز و قرمز تاثیر بالایی بر روی مدل‌های ارائه شده توسط این دو الگوریتم داشته‌اند. نتایج به‌دست‌آمده از الگوریتم XGBoost نشان‌دهنده اهمیت ترکیب‌های باندی آبی، قرمز و سبز بر روی نتایج ارائه شده می‌باشد. بر این اساس ترکیب‌ باندی آبی، قرمز و سبز در هر سه الگوریتم به‌عنوان مهم‌ترین و یا یکی از مهم‌ترین متغیرهای ورودی جهت محاسبه کلروفیل آ مورد استفاده قرار گرفته است. ضریب تبیین برای سه مدل XGBoost، M5 و MARS به ترتیب برابر با 61/0، 49/0 و 31/0 محاسبه شد. مقدار ضریب ناش-ساتکلیف برای سه مدل XGBoost، M5 و MARS به ترتیب برابر با 54/0، 47/0 و 27/0 محاسبه شد که نشان می‌دهد نتایج دو مدل XGBoost و M5 دارای وضعیت مطلوبی می‌باشند. نتایج مدل‌های مورد استفاده نشان می‌دهد که دو مدل XGBoost و M5 نتایج دقیق‌تری را نسبت به مدل MARS ارائه نمودند. استفاده از دیاگرام تیلور نیز نشان‌دهنده نزدیک بودن کارایی دو مدل XGBoost و M5 در محاسبه میزان کلروفیل آ می‌باشد. توزیع کلروفیل آ در محدوده مخزن سد سردشت توسط مدل‌های مورد استفاده نشان می‌دهد که در نواحی محدودی از سد، مقادیر ارائه‌شده با مقادیر اندازه-گیری شده همخوانی ندارد که محدود بودن داده‌های اندازه‌گیری مورد استفاده و عدم انطباق کامل زمانی تصاویر سنتینل-2 با داده‌های اندازه‌گیری در مخزن سد می‌تواند تأثیر مهمی در این زمینه داشته باشد. استفاده از تعداد داده‌های متعدد در مخازن سدهای مختلف، به‌کارگیری مدل‌های داده‌کاوی متنوع و استفاده از تصاویر سایر سنجنده‌ها می‌تواند ابزار مناسبی را در اختیار مدیران مخازن قرار داده تا بتوانند با دقت بیشتری اقدام به ارزیابی کیفی آب مخازن نمایند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Simulating chlorophyll a in dam reservoirs using remote sensing and data-driven approaches

نویسندگان [English]

  • Javad Zahiri 1
  • mitra cheraghi 2
  • Meysam Salarijazi 3
1 Associate Professor, Department of Water Engineering, Agricultural Sciences and Natural Resources University of Khuzestan, Iran.
2 Assistant Professor, Department of Nature Engineering, Agricultural Sciences and Natural Resources University of Khuzestan
3 Gorgan University of Agricultural Sciences and Natural Resources
چکیده [English]

Chlorophyll A is used as a Indicator to measure the amount of algae growing in water, which can be applied to classify the nutritional status of water bodies. Accordingly, the concentration of chlorophyll a is considered a key indicator for water quality. In this research, an attempt has been made to estimate the amount of chlorophyll A in Sardasht dam reservoir using remote sensing techniques and data driven models. The data categories was used in this study: the first part is the measured values of chlorophyll A in Sardasht dam reservoir, and the second part includes 7 stages of measurement at 10 points with different coordinates in the reservoir of the dam and is related to March 2016 to June 2018. The second part of the data which used in data driven models, was extracted from the Sentinel-2 satellite images. The information of different bands was extracted from Sentinel-2 images and based on the band values, the criteria for measuring the amount of chlorophyll A were calculated and provided to the data driven models for training. In this research, three data driven models XGBoost, M5 and MARS were used to estimate the amount of chlorophyll A. In this study, 9 chlorophyll A estimation equations were considered as input of data driven models and the measured logarithm value of chlorophyll A was considered as output. 80% of the available data was used to train and the remaining 20% was used to verify the effectiveness of the used models. Based on the input data, the M5 model tree has divided the problem space into 5 parts and presented a linear equation for each part. Based on the structure provided by M5 and MARS algorithms, blue, red and green band combinations as well as infrared and red have a high impact on the models provided by these two algorithms. The results obtained from XGBoost algorithm show the importance of blue, red and green band combinations on the presented results. Based on this, the combination of blue, red and green bands has been used in all three algorithms as the most important or one of the most important input variables to calculate chlorophyll A. The coefficients of determination for three models XGBoost, M5 and MARS was calculated as 0.61, 0.49 and 0.31, respectively. The value of Nash-Sutcliffe coefficient for XGBoost, M5 and MARS models was calculated as 0.54, 0.47 and 0.27, respectively, which shows that the results of XGBoost and M5 models are favorable. The results show that the XGBoost and M5 models provided more accurate results than the MARS model. The use of Taylor's diagram also shows the close efficiency of the XGBoost and M5 models in calculating the amount of chlorophyll A. The spatial distribution of chlorophyll A in the Sardasht dam reservoir shows that the lack of information used has caused differences between the measured and calculated values in limited areas. The spatial distribution of chlorophyll A in the Sardasht dam reservoir shows that the limited data used and the lack of complete temporal compatibility of the Sentinel-2 images with the measurement data in the dam reservoir has caused differences between the measured and calculated values in limited areas. The use of a large number of data in the reservoirs of different dams, the use of various data driven models and applying images from other sensors can provide a suitable tool for the managers of the reservoirs so that they can evaluate the water quality more accurately.

کلیدواژه‌ها [English]

  • Algae
  • water quality
  • Sentinel-2 images
  • XGBoost
  • M5 and MARS algorithms