Page 104 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 104
Số 12/2024 (748) KHOA HỌC CÔNG NGHỆ
Tập
Tập 64
4
6
Nghiên cứu xây dựng mô hình máy học LSTM
(Long short-Term Memory) dự báo lưu lượng nước
tại Trạm Thủy văn Hà Nội trên sông Hồng
(1)
(2)
n ThS. TRẦN THỊ TÚ ; ThS. NGUYỄN THỊ BÍCH NGỌC ; ThS. MAI QUANG TUẤN (3)
Trường Đại học Tài nguyên và Môi trường Hà Nội
(2)
Email: tttu.@hunre.edu.vn; ntbngoc@hunre.edu.vn; mqtuan@hunre.edu.vn
(1)
(3)
TÓM TẮT: Bài báo trình bày kết quả của nghiên ahead (t+1), R2, RMSE, NASH reached 0.9335,
cứu xây dựng mô hình mạng bộ nhớ dài-ngắn 0.026, and 0.927, respectively, for training period
LSTM (Long Short-Term Memory), một dạng đặc and 0.912, 0.026 and 0.92, respectively, for testing
biệt của mạng nơ-ron hồi quy (RNN-Recurrent period. The LSTM network model demonstrates
Neural Network), để dự báo lưu lượng nước tại good predictive capability for water flow at the Hanoi
Trạm Thủy văn Hà Nội trên sông Hồng. Dữ liệu lưu hydrological station and shows potential application
lượng, mực nước được thu thập theo giá trị trung in other hydrological stations.
bình hàng ngày từ năm 2011 đến năm 2019. Các KEYWORDS: Flow forcasting, Ha Noi, LSTM,
chỉ số thống kê như hệ số xác định (Coefficient of Machine Learning.
determination, R2), lỗi trung bình bình phương gốc
(Root Mean Squared Error, RMSE) và hệ số NASH
(Nash-Sutcliffe efficiency coefficient) được sử dụng
để đánh giá tính chính xác của mô hình. Nghiên
cứu đánh giá khả năng dự báo lưu lượng nước của
thuật toán LSTM với số nơ-ron khác nhau (1, 2, 3, 4) 1. ĐẶT VẤN ĐỀ
ở các thời gian dự báo khác nhau: 1, 2, 3 ngày tiếp Lũ lụt là hiện tượng tự nhiên nguy hiểm, ảnh hưởng
theo (t+1, t+2, t+3). Kết quả cho thấy mô hình mạng đến đời sống người dân, đặc biệt là cộng đồng dân cư
LSTM có 3 nơ-ron dự báo tối ưu nhất ở 1 ngày vùng hạ lưu. Dự báo chính xác thời điểm và dấu hiệu của
tiếp theo (t + 1) với R2 = 0,9335, RMSE = 0,026, lũ lụt là điều vô cùng quan trọng trong công tác quản lý
NASH = 0,927 cho huấn luyện, R2 = 0,912, RMSE nguồn nước nhằm giảm thiểu tác động tiêu cực và có kế
= 0,026, NASH = 0,92 cho tập kiểm tra. Mô hình hoạch ứng phó kịp thời với tình huống lũ lụt bất ngờ. Tuy
mạng LSTM dự báo khá tốt lưu lượng trạm Hà Nội nhiên, công tác dự báo chính xác lưu lượng nước là vấn đề
và tiềm năng ứng dụng cho các trạm thủy văn khác. vô cùng khó khăn do lưu lượng dòng chảy chịu tác động
TỪ KHÓA: Dự báo lưu lượng, Hà Nội, LSTM, của rất nhiều yếu tố thủy văn như chế độ triều, dòng chảy,
Machine Learning. lượng mưa, địa hình lòng sông [1]. Nhiều nghiên cứu đã
nỗ lực đưa ra các phương pháp dự báo lưu lượng nước, với
ABSTRACT: This paper presents the results of các mô hình chủ yếu dựa trên toán học, được chia thành
developing an LSTM (Long Short-Term Memory) hai nhóm chính: (1) Mô hình tiến trình (Process-based
model, a specialized form of Recurrent Neural models) là loại mô hình kết hợp toán - lý, dựa trên các
Network (RNN), to provide an effective approach
for forecasting flow rates at the Hanoi hydrology quy luật thủy văn được mô tả và ước tính chính xác nhờ
station on the Hong River. The flow and water các quy luật vật lý được nghiên cứu và tích hợp sẵn trong
level data used in the study were collected as daily mô hình [2, 3]. (2) Một cách tiếp cận khác là sử dụng các
average values from 2011 to 2019. The Coefficient thuật toán học máy (machine learning) trong dự báo lưu
of Determination (R2), Root Mean Squared Error lượng, ví dụ K-Nearest Neighbors, Decision Tree, Random
(RMSE) and Nash-Sutcliffe efficiency coefficien Forest, Support Vector Machine, Artificial eural etwork và
(NASH) were utilized to evaluate the performances Long Short-Term Memory (LSTM). Phương pháp này có ưu
of the LSTM model. The study assesses the điểm là dễ áp dụng, độ chính xác cao, không yêu cầu nhiều
LSTM algorithm ability to predict water flow using số liệu. Tuy nhiên, do các mô hình học máy thuộc nhóm
different number of neurons (1, 2, 3, 4) at various “black-box” nên đôi khi khó giải thích kết quả [2, 4 ,5]. Việc
forecasting intervals: 1, 2, 3 day ahead (t+1, t+2, thu thập đầy đủ các thông tin về các yếu tố ảnh hưởng đến
t+3). The results indicate that the LSTM model lưu lượng dòng chảy thường rất khó khăn và không toàn
with 3 neurons achieved a high performance for diện [2]. Vì vậy, việc lựa chọn các mô hình học máy để dự
flow rate forecasting. When forecasting one day báo lưu lượng dòng chảy trong trường hợp này là phù hợp.
Bài báo được thực hiện với các mục tiêu: (i) Đánh giá
103