ارزیابی عملکرد توابع کرنل در تخمین جریان رودخانه‌ها با استفاده از ماشین بردار پشتیبان

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجو

2 دانشیار گروه مهندسی آب دانشگاه تبریز

چکیده

سابقه و هدف: پیش‌بینی دقیق رواناب رودخانه‌ها نقش مهمی در مدیریت بهینه منابع آب در دسترس دارد. در سال‌های اخیر، ماشین بردار پشتیبان (SVM) که یکی از مهمترین مدل‌های داده‌کاوی است برای این منظور مورد توجه قرار گرفته است. این مدل یک سیستم یادگیری کارآمد بر مبنای تئوری بهینه‌سازی مقید است که از اصل استقرای کمینه‌سازی خطای ساختاری استفاده کرده و منجر به یک جواب بهینه کلی می‌گردد. همانند مدل‌های داده‌کاوی دیگر مدل SVM نیز می‌تواند در مواقعی که فقط داده‌های رواناب در دسترس می‌باشد جهت شبیه‌سازی رواناب مورد استفاده قرار گیرد (مدل‌سازی خودهمبسته). به طور معمول سه تابع کرنل پایه شعاعی (RBF)، چند جمله‌ای درجه d و خطی در ماشین بردار پشتیبان مورد استفاده قرار می‌گیرند که کاربرد هر یک از این توابع با پارامترهای مختلف در تخمین رواناب رودخانه‌ها ممکن است منجر به نتایج متفاوتی شود. بنابراین ارزیابی کارایی و دقت هر یک از این توابع و انتخاب تابع کرنل مناسب در پیش‌بینی جریان رودخانه ضروری است. همچنین از آنجا که مدل‌های سری زمانی AR، ARMA و ARIMA از مد‌ل‌های اصلی در شبیه‌سازی خودهمبسته رواناب می‌باشند لذا می‌توان از طریق مقایسه عملکرد هر یک از توابع کرنل با این مدل‌ها، دقت نسبی این توابع در این زمینه را مورد بررسی قرار داد. بنابراین ارزیابی دقت هر یک از توابع کرنل در شبیه‌سازی رواناب ماهانه و مقایسه عملکرد آنها با مدل‌های سری زمانی هدف اصلی این تحقیق را رقم می‌زند.
مواد و روش‌ها: در این تحقیق حوضه خرخره‌چای به عنوان منطقه مورد مطالعه انتخاب شده و جریان ماهانه مشاهداتی این حوضه در ایستگاه آب‌سنجی سنته جهت واسنجی و اعتبارسنجی مدل‌ها بکار گرفته شد. برای این منظور، در ابتدا 75 درصد از داده‌های جریان ماهانه (1384-1367) برای واسنجی مدل‌ها انتخاب شده و 25 درصد داده‌ها (1390-1385) جهت اعتبارسنجی مدل‌ها استفاده شد. سپس توزیع احتمالاتی داده‌های جریان ماهانه در ایستگاه آب‌سنجی سنته براساس آزمون-های کلموگروف- اسمیرنوف و شاپیرو- ویلک مورد بررسی قرار گرفته و نرمال‌سازی توزیع داده‌ها انجام گرفت. پس از بهینه‌سازی پارامترهای مربوط به هر یک از توابع کرنل، مقادیر جریان ماهانه در ایستگاه آب‌سنجی سنته پیش‌بینی شده و عملکرد این توابع با استفاده از جذر میانگین مربعات خطا (RMSE) و ضریب همبستگی (CC) مورد ارزیابی قرار گرفت.
یافته‌ها: بررسی‌های این تحقیق نشان داد که اگرچه تفاوت معنی‌دار بین نتایج سه تابع کرنل وجود ندارد، ولی تابع کرنل چند جمله‌ای درجه 4 با مقادیر ضریب همبستگی و جذر میانگین مربعات خطا به ترتیب برابر با 86/0 و 88/5 (مترمکعب در ثانیه) در دوره تست، در مقایسه با توابع کرنل دیگر از دقت بالا و عملکرد بهتری در پیش‌بینی جریان ماهانه برخوردار است. همچنین نتایج نشان داد که مدل (6،2)ARMA با مقادیر ضریب همبستگی و مجذور میانگین مربعات خطا به ترتیب برابر با 82/0 و 47/6 (مترمکعب در ثانیه) در دوره تست، نسبت به سایر مدل‌های سری زمانی عملکرد خوبی را در پیش‌بینی جریان ماهانه حوضه خرخره‌چای دارا می‌باشد.
نتیجه‌گیری: در نهایت مقادیر جریان ماهانه پیش‌بینی شده با استفاده از تابع کرنل چند جمله‌ای درجه 4 (به عنوان نماینده مدل SVM) با نتایج مدل (6،2)ARMA (به عنوان نماینده مدل‌های سری زمانی) مقایسه گردید و این نتیجه حاصل شد که مدل SVM از کارایی بهتری نسبت به مدل‌های سری زمانی در پیش‌بینی جریان ماهانه حوضه خرخره‌چای برخوردار است.

کلیدواژه‌ها

عنوان مقاله [English]

Assessment of Kernel Functions Performance in River Flow Estimation using Support Vector Machine

نویسندگان [English]

  • Mohammad Isazadeh 1
  • hojat ahmadzadeh 1
  • Mohammad Ali Ghorbani 2

چکیده [English]

Background and objectives: Accurate prediction of river flow has an important role in the optimum management of available water resources. In recent years, support vector machine (SVM) that is one of the most important data-driven models, has been considered in this regards. This model is a useful learning system based on constrained optimization theory that uses induction of structural error minimization principle and results a general optimized answer. Such as other data mining models, the SVM model can also be used for runoff simulation when the only available data is runoff (autoregressive simulation). Typically, three kernel functions, namely, radial basis, polynomial of degree d and linear are applied in SVM that use of each function with various parameters for river flow estimation may have different results. Therefore, it is necessary to evaluate the accuracy of each of these functions and select the appropriate kernel function for runoff simulation. Since time series models, namely, AR, ARMA and ARIMA are the main models for autoregressive simulation of runoff, relative accuracy of kernel functions can be investigated by comparing their performance with these models. Therefore, assessment of the accuracy of kernel functions for monthly river flow simulation and comparison of their performance with time series models is main aim of this study.
Materials and Methods: In this study Kherkherehchiy river basin was selected as the study area and observed monthly river flow of this basin in the Santeh gauging station were applied for calibration and validation of models. For this purpose, first 75 percent of monthly river flow data (1367-1384) were selected to calibrate models and 25 percent of data (1385-1390) were used to validate models. Next, probability distribution of monthly river flow data in Santeh station were studies based on Kolmogorov-Smirnov and Shapiro- Wilk test and then normalization of data distribution were done. After optimization of parameters for each kernel functions the monthly flow values were predicted in Santeh station and the performance of these functions were evaluated using root mean square errors (RMSE) and the correlation coefficient (CC).
Results: The investigations of this study indicated that although there is no significant difference in the results of three kernel functions, but the polynomial kernel function of degree 4 with CC and RMSE values of 0.86 and 5.88 (m3/sec) respectively in the testing period, has high accuracy and better performance in prediction of monthly flow in comparison to other kernel functions. Also the results showed that ARMA(6,2) with CC and RMSE values of 0.82 and 6.47 (m3/sec) respectively in the testing period, has good performance in prediction of Kherkherehchiy monthly flow compared to the other time series models.
Conclusion: Finally, the predicted monthly river flow using polynomial kernel function of degree 4 (as a representative of SVM model) was compared with the results of ARMA(6,2) (as a representative of time series model) and this conclusion was obtained that the SVM model has a better performance than time series models in the monthly river flow prediction of the Kherkherehchiy basin

کلیدواژه‌ها [English]

  • River Flow Prediction
  • Support vector machine
  • Kernel functions
  • Time Series Models
  • Kherkherehchiy River Basin