Page 106 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 106
Số 12/2024 (748) KHOA HỌC CÔNG NGHỆ
Tập 64
Tập
4
6
Bảng 3.1. Các giá trị R , RMSE và NASH ở các thời gian dự báo theo
2
số lượng nơ-ron
Thời gian Số nơ-ron
Chỉ số
dự báo 1 2 3 4
t+1 0,924 0,9354 0,9335 0,938
R 2 t+2 0,756 0,767 0,775 0,735
t+3 0,623 0,645 0,642 0,645
t+1 0,026 0,026 0,026 0,025
RMSE t+2 0,031 0,043 0,035 0,032
Hình 3.2: Hàm loss cho mô hình LSTM dự báo lưu lượng nước với số
t+3 0,038 0,051 0,047 0,039
lượng nơ-ron khác nhau ở thời gian t+1
t+1 0,927 0,926 0,927 0,933 Trong quá trình huấn luyện, tương quan giữa giá trị dự
NASH t+2 0,841 0,823 0,814 0,779 báo và giá trị thực tế rất cao (r >96%, p <0,0001). Cụ thể,
hệ số tương quan r là 0,9354, 0,9335, 0,938 tương ứng với
t+3 0,69 0,74 0,73 0,701
mạng LSTM có 2, 3, 4 nơ-ron. Tương tự, trong quá trình kiểm
Bảng 3.2. Các chỉ số đánh giá mô hình LSTM tra, hệ số tương quan r ở mạng 2, 3, 4 nơ-ron cũng rất cao,
Các tham số Phạm vi lần lượt đạt 0,927; 0,926; 0,915 (Hình 3.3). Như vậy, giá trị dự
báo từ mô hình rất gần với giá trị thực tế và mô hình với
Dropout [16, 32, 64, 128, 256] số nơ-ron 2, 3, 4 có độ chính xác tốt. Ngoài ra, hệ số tương
Số đơn vị ẩn LSTM [0,1, 0,2, 0,25, 0,5] quan r trong tập huấn luyện và kiểm tra của ba mạng LSTM
Learning_rate [0,01, 0,005, 0,001] không có sự khác biệt đáng kể.
Batch_size [16, 32, 64, 128, 256]
Epochs [100, 200]
Hình 3.1 so sánh các chỉ số đánh giá tính hiệu quả mô
hình LSTM với số lượng các nơ-ron và thời gian dự báo
khác nhau. Nhìn chung, khi tăng thời gian dự báo, chỉ số
R có xu thế giảm, trong khi RMSE và NASH tăng. Ngoài ra,
2
khi tăng số nơ-ron trong mạng, chỉ số R tăng, trong khi
2
RMSE và MAE giảm. Do đó, độ chính xác của mô hình dự
báo được cải thiện khi tăng số nơ-ron trong mạng. Hơn
nữa, độ chính xác của mạng LSTM giảm, thời gian dự báo
tăng lên với thời gian dự báo 1 ngày tiếp theo (t+1) là thời
gian dự báo tối ưu.
Hình 3.3: Quan hệ tuyến tính giữa lưu lượng thực tế và dự báo bằng
mô hình LSTM với số lượng nơ-ron khác nhau ở thời gian t+1. Giai
đoạn huấn luyện (cột trái), giai đoạn kiểm tra (cột phải)
Hình 3.4 so sánh các giá trị dự báo và thực tế ở tập
huấn luyện, kiểm tra và toàn bộ số liệu. Nhìn chung, giá
trị dự báo gần như trùng khớp với giá trị thực tế, mô hình
Hình 3.1: So sánh các chỉ số đánh giá tính hiệu quả mô hình LSTM LSTM dự báo với độ chính xác cao và đáng tin cậy. Świątek
với số lượng các nơ-ron và thời gian dự báo khác nhau và Okruszko năm 2011 đề xuất thang đánh giá tính chính
Hàm loss dùng cho cả 3 mạng LSTM (nơ-ron là 1, 2, xác của mô hình dự báo dựa vào giá trị R , cụ thể như sau:
2
3, 4) là loss = MSE, epochs = 100, batch size = 32, verbose Mô hình xuất sắc (0,99≤ R < 1,00), rất tốt (0,95≤ R <0,99),
2
2
= 1 và optimizer = ‘adam’. Đối với mạng LSTM với 3 nơ- tốt (0,90≤ R <0,95), khá tốt (0,85≤ R <0,90), trung bình
2
2
ron, không có dấu hiệu overfittings ở 100 epochs, do giá (0,80 ≤ R < 0,85), chấp nhận được (0,70 ≤ R < 0,80), không
2
2
trị loss của tập huấn luyện và kiểm tra đều giảm dần theo đáng tin cậy (R < 0,70) [14].
2
số epochs và gần như nằm trùng lên nhau. Tuy nhiên, có Như vậy, mô hình LSTM ứng với số lượng nơ-ron 2, 3, 4
overfittings xuất hiện ở 100 epochs với mạng nơ-ron = 2, được đánh giá là tốt trong giai đoạn huấn luyện và khá tốt
4, mặc dù rất thấp (Hình 3.2). trong giai đoạn kiểm tra đối với việc dự báo lưu lượng nước
105