Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  31,785,129
  • Công bố khoa học và công nghệ Việt Nam

50

Khoa học máy tính

Lương Hữu Dũng, Ngô Thị Thủy, Lương Tuấn Trung, Trịnh Thu Phương

Ứng dụng mô hình học máy XGBoost nhận dạng lũ lớn trên sông Đà

Application of machine learning for large flood identification in the Da River

Tạp chí Khoa học Biến đổi khí hậu

2025

34

24-30

2525-2496

Nhận dạng lũ lớn trên các lưu vực sông đóng vai trò quan trọng trong công tác phòng chống thiên tai và đảm bảo sự phát triển bền vững của lưu vực. Hiện nay, với sự phát triển vượt bậc của khoa học máy tính, các phương pháp số như mô hình toán và trí tuệ nhân tạo đang được ứng dụng rộng rãi trong các nghiên cứu dự báo và nhận dạng các đặc trưng lũ lớn trên lưu vực Sông Hồng. Tuy nhiên, để xây dựng được mô hình học máy có thể nhận dạng, dự báo được những trận lũ lớn với độ chính xác cao vẫn còn gặp nhiều thách thức về nguồn dữ liệu và các quan hệ phi tuyến phức tạp. Nghiên cứu này được thực hiện với mục đích xây dựng được thuật toán học máy đủ mạnh, có thể dự báo, nhận dạng được dòng chảy đỉnh lũ đến Hồ Sơn La thông qua Trạm thủy văn Tạ Bú nằm ở hạ lưu hồ trong những trận lũ lớn từ nguồn dữ liệu ngắn (49 số liệu) , không có sự liên tục về thời gian. Mô hình học máy tiên tiến XGBoost và các kỹ thuật xử lý dữ liệu đầu vào được sử dụng cho kết quả huấn luyện đạt trên 97% trong tất cả 1.000 lần chạy và kết quả kiểm tra đạt khoảng 70%. Dự báo thử nghiệm cho trận lũ năm 2024 cũng cho kết quả dự báo đỉnh lũ chính vụ khá tốt, với sai số dưới 5%. Kết quả nhận dạng đỉnh lũ sớm và lũ muộn chấp nhận được với sai số đỉnh lũ trung bình ngày khoảng 14%.

Severe flood identification plays a critical role in disaster prevention and the sustainable development of river basins. In recent years, with the rapid advancement of computer science, numerical methods such as mathematical modeling and artificial intelligence have been widely applied in studies related to flood forecasting and the identification of flood c-haracteristics in the Red River basin. However, developing a machine learning model capable of accurately identifying and forecasting major floods remains challenging due to limitations in data availability and complex nonlinear relationships among variables. This study aims to develop a robust machine learning algorithm capable of identifying and predicting flood peak disc-harges to the Son La reservoir using the Ta Bu station during severe flood events, using a limited dataset (49 records) with discontinuous time series. The advanced machine learning model XGBoost, along with input data preprocessing techniques, was employed. The training results achieved over 97% accuracy across all 1.000 runs, while the testing accuracy reached approximately 70%. Model-based forecasts for the 2024 flood season also showed promising performance in predicting the major flood peak, with an error margin of less than 5%. The model's performance in identifying early and late flood peaks was accaptable, with an average daily peak error of around 14%.

TTKHCNQG, CVv 505