Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  30,349,171
  • Công bố khoa học và công nghệ Việt Nam

Thuỷ văn; Tài nguyên nước

Lê Phước Cường(1), Ngô Viết Thắng

Ứng dụng mô hình học máy dự báo chất lượng nước dưới đất: điển hình tại khu vực thành phố Hội An, tỉnh Quảng Nam

Application of machine learning models in underground water prediction: a case study in Hoi An city, Quang Nam province

Tạp chí Khoa học và Công nghệ (Đại học Đà Nẵng)

2022

5

106-110

1859-1531

Bài báo nghiên cứu dự báo chất lượng nước dưới đất khu vực lân cận bãi rác Cẩm Hà, Tp. Hội An, Quảng Nam bằng các mô hình học máy. Nghiên cứu đã tiến hành phân tích bộ dữ liệu về chất lượng nước dưới đất trong mùa mưa và mùa khô. Bộ dữ liệu với 268 dòng, gồm 8 biến đầu vào (Fe, As, Mo, Co, Ni, Al, Zn, Pb) và 1 biến đầu ra (GWQI). Các tác giả đã nghiên cứu xác định mô hình dự báo tối ưu dựa vào các giá trị sai số tuyệt đối trung bình (MAE), sai số toàn phương trung bình (RMSE) và R2. Ngôn ngữ R được dùng để tối ưu hoá các mô hình hồi quy tuyến tính (LR), rừng ngẫu nhiên (RF), máy hỗ trợ vec-tơ (SVM), K- điểm dữ liệu gần nhất (KNN), mạng lập thể (Cubist) với tỉ lệ “Huấn luyện”:“Kiểm tra” từ 70:30 đến 85:15. Kết quả thu được cho thấy, mô hình Cubist ở tỷ lệ 70:30 là tối ưu nhất cho bộ dữ liệu tại khu vực lân cận bãi rác Cẩm Hà với độ tin cậy R2 lần lượt là 98,8% và 96%.

This article studies to predict groundwater quality in the vicinity of Cam Ha landfill, Hoi An city, Quang Nam province by machine learning models. The study analyzed dataset on groundwater quality in rainy and dry seasons. Dataset with 268 lines, including 8 input variables (Fe, As, Mo, Co, Ni, Al, Zn, Pb) and 1 output oneis the groundwater quality index (GWQI). Authors determined the optimal forecasting model based on the mean absolute error (MAE), root mean square error (RMSE) and R2. R language was used in order to optimize machine learning models, such as: linear regression (LR), random forest (RF), support vector machine (SVM), K-nearest neighbors (KNN), Cubist with Train:Test ratio from 70:30 to 85:15. The obtained results show that the Cubist model at the ratio 70:30 is the most optimal one for the dataset in the vicinity of Cam Ha landfill with the R2 value of 98.8% and 96 %, respectively.

TTKHCNQG, CVv 465