Page 105 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 105
KHOA HỌC CÔNG NGHỆ Tập 6 4
Tập 64
Số 12/2024 (748)
tính hiệu quả của mô hình mạng LSTM trong dự báo lưu Mạng LSTM là một kiến trúc nâng cấp đặc biệt từ
lượng nước ở trạm Hà Nội trên sông Hồng; (ii) Tìm ra các mạng RNN, do Hochreiter và Schmidhuber phát minh năm
thông số tối ưu của mô hình, phù hợp với bộ dữ liệu hiện 1997 [10]. Mạng LSTM khắc phục được hạn chế của RNN
có. Kết quả nghiên cứu có thể cung cấp một cách tiếp cận truyền thống trong việc duy trì thông tin lâu dài (long-
mới và tiềm năng trong quản lý tài nguyên nước cũng term dependencies) [11]. Cấu trúc của mạng LSTM bao
như trong nghiên cứu dự báo các đặc điểm thủy văn, biến gồm nhiều tế bào LSTM liên kết tuần tự (Hình 2.1b). Mỗi
động môi trường. tế bào LSTM có thêm trạng thái bên trong và 3 cổng kiểm
soát thông tin: Cổng quên (forget gate), cổng vào (input
2. SỐ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU gate) và cổng ra (output gate) [6, 12].
2.1. Số liệu 2.3. Các chỉ số đánh giá chất lượng mô hình
Trong nghiên cứu này, số liệu được sử dụng bao gồm Ba chỉ số thống kê, gồm R (công thức 2), NASH (công
2
lưu lượng nước thực đo tại các trạm Hòa Bình, Yên Bái, Vụ thức 3) và RMSE (công thức 4), được sử dụng để đánh
Quang và Hà Nội kết hợp với mực nước đo tại các trạm Hà giá tính chính xác của mô hình dự báo. Hệ số NASH và R
2
Nội và Ba Lạt, dưới dạng số liệu trung bình ngày từ năm (dao động từ 0 đến 1) phản ánh mức độ giải thích của các
2011 đến năm 2019. biến độc lập đối với các biến phụ thuộc; giá trị càng cao,
2.2. Phương pháp nghiên cứu mô hình càng chính xác [9]. Chỉ số RMSE (0<RMSE<∞) đo
Với dữ liệu chuỗi thời gian, chất lượng dữ liệu phải lường mức độ sai khác giữa các giá trị dự đoán và giá trị
đảm bảo số lượng đủ lớn, liên tục và ít giá trị ngoại lai… thực tế, giá trị này càng thấp thì mô hình sẽ tốt hơn.
là yếu tố quyết định đến độ chính xác của các mô hình dự
báo [6]. Do đó, dữ liệu được tiền xử lý qua hai bước trước (2)
khi được đưa vào mô hình để huấn luyện thuật toán:
1) Giá trị ngoại lai khác thường trong bộ số liệu cần (3)
được kiểm tra lại. Nếu xác định là giá trị lỗi, chúng được
thay thế bằng trung bình của 4 giá trị lân cận. (4)
2) Tất cả dữ liệu được chuẩn hóa về một phạm vi
từ 0 đến 1 bằng phương pháp bình thường hóa dữ liệu
(normalization scaling, công thức 1), được thực hiện trong Trong đó: Q - Giá trị dự báo; Q - Giá trị quan trắc; Q -
tđ
tđ
tt
thư viện scikit-learn [10]. Trung bình giá trị quan trắc; n - Số mẫu.
(1) Nghiên cứu này sẽ đánh giá khả năng dự báo lưu
lượng nước của thuật toán LSTM với số nơ-ron khác nhau
Trong đó: max(x), min(x) - Giá trị lớn nhất và nhỏ nhất (1, 2, 3, 4) ở các thời gian dự báo 1, 2, 3 ngày tiếp theo.
của bộ dữ liệu; x - Giá trị dữ liệu; z - Giá trị đã được chuẩn Dữ liệu được chia làm hai phần: 70% cho tập huấn luyện
hóa từ x. Việc chuẩn hóa giúp dữ liệu hội tụ và giảm sự (training), 30% cho tập kiểm tra (testing). Phương pháp
phân tán [7], đồng thời tăng tốc quá trình huấn luyện đánh giá độ chính xác trung bình của mô hình phân
thuật toán mà không ảnh hưởng đến độ chính xác của mô lớp CV (Cross Validation) được áp dụng để hạn chế hiện
hình [8]. tượng mô hình dự đoán quá khớp với dữ liệu huấn luyện
Mạng nơ-ron hồi quy (RNN) được thiết kế để xử lý các (overfitting). CV là phương pháp chia tập training ra thành
dạng dữ liệu chuỗi thời gian. RNN nhận một đầu vào x , N phần. Tại mỗi vòng huấn luyện, mô hình sẽ sử dụng N-1
t
xử lý và đưa ra đầu ra h . RNN sẽ lưu lại giá trị của h để sử phần để huấn luyện và phần còn lại để kiểm tra, giúp giảm
t
t
dụng cho đầu vào bước kế tiếp. Mạng RNN có thể được thiểu khả năng xảy ra overfittings. Nghiên cứu sử dụng CV
xem là một chuỗi những mạng con giống hệt nhau, mỗi = 10, đây là số phổ biến trong huấn luyện thuật toán học
mạng con sẽ truyền thông tin nó vừa xử lý cho mạng phía máy [10, 13].
sau nó. Nếu ta tách từng vòng lặp xử lý trong RNN ra thành
từng mạng nhỏ thì sẽ có một mạng RNN có kiến trúc như 3. KẾT QUẢ VÀ THẢO LUẬN
Hình 2.1a [9]. Đối với mạng LSTM có 1 nơ-ron, chỉ số R đạt cao nhất
2
tại thời gian dự báo t+1, với giá trị 0,924. Khi thời gian dự
báo tăng lên t+2, t+3 thì giá trị R giảm dần, lần lượt là
2
0,756 và 0,623. Giá trị RMSE thấp nhất đạt được ở thời gian
dự báo t+1 và tăng dần khi thời gian dự báo từ t+2 đến t+3.
2
Mạng LSTM có từ 2 đến 4 nơ-ron, chỉ số R ở thời gian
t+1 đạt cao nhất, dao động từ 0,935 đến 0,938. Khác với
mạng LSTM có 1 nơ-ron, R giảm rồi tăng khi tăng thời gian
2
dự báo, mạng LSTM có có từ 2 đến 4 nơ-ron cho thấy chỉ
2
số R giảm liên tục khi tăng thời gian dự báo từ t+1 lên t+3
(Bảng 3.1).
2
Trong mạng LSTM 1 nơ-ron, R khá thấp. Tuy nhiên,
khi tăng số nơ-ron (từ 2 đến 4), R tăng lên đáng kể. Ngoài
2
ra, giá trị R , RMSE và MAE không có khác biệt đáng kể giữa
2
các mạng 2, 3 và 4 nơ-ron (Bảng 3.1).
Hình 2.1: Cấu trúc mạng RNN truyền thống (a) và mạng LSTM (b)
104