Page 106 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 106

Số 12/2024 (748) KHOA HỌC CÔNG NGHỆ
                                                                                 Tập 64
                                                                                 Tập
                                                                                     4
                                                                                     6
         Bảng 3.1. Các giá trị R , RMSE và NASH ở các thời gian dự báo theo
                        2
                           số lượng nơ-ron
                 Thời gian           Số nơ-ron
          Chỉ số
                 dự báo     1       2       3       4
                   t+1     0,924   0,9354  0,9335  0,938
           R 2     t+2     0,756   0,767   0,775   0,735
                   t+3     0,623   0,645   0,642   0,645
                   t+1     0,026   0,026   0,026   0,025
          RMSE     t+2     0,031   0,043   0,035   0,032
                                                              Hình 3.2: Hàm loss cho mô hình LSTM dự báo lưu lượng nước với số
                   t+3     0,038   0,051   0,047   0,039
                                                                       lượng nơ-ron khác nhau ở thời gian t+1
                   t+1     0,927   0,926   0,927   0,933         Trong quá trình huấn luyện, tương quan giữa giá trị dự
          NASH     t+2     0,841   0,823   0,814   0,779     báo và giá trị thực tế rất cao (r >96%, p <0,0001). Cụ thể,
                                                             hệ số tương quan r là 0,9354, 0,9335, 0,938 tương ứng với
                   t+3     0,69    0,74     0,73   0,701
                                                             mạng LSTM có 2, 3, 4 nơ-ron. Tương tự, trong quá trình kiểm
                 Bảng 3.2. Các chỉ số đánh giá mô hình LSTM  tra, hệ số tương quan r ở mạng 2, 3, 4 nơ-ron cũng rất cao,
                Các tham số              Phạm vi             lần lượt đạt 0,927; 0,926; 0,915 (Hình 3.3). Như vậy, giá trị dự
                                                             báo từ mô hình rất gần với giá trị thực tế và mô hình với
         Dropout                [16, 32, 64, 128, 256]       số nơ-ron 2, 3, 4 có độ chính xác tốt. Ngoài ra, hệ số tương
         Số đơn vị ẩn LSTM      [0,1, 0,2, 0,25, 0,5]        quan r trong tập huấn luyện và kiểm tra của ba mạng LSTM
         Learning_rate          [0,01, 0,005, 0,001]         không có sự khác biệt đáng kể.
         Batch_size             [16, 32, 64, 128, 256]
         Epochs                 [100, 200]
            Hình 3.1 so sánh các chỉ số đánh giá tính hiệu quả mô
        hình LSTM với số lượng các nơ-ron và thời gian dự báo
        khác nhau. Nhìn chung, khi tăng thời gian dự báo, chỉ số
        R  có xu thế giảm, trong khi RMSE và NASH tăng. Ngoài ra,
         2
        khi tăng số nơ-ron trong mạng, chỉ số R  tăng, trong khi
                                           2
        RMSE và MAE giảm. Do đó, độ chính xác của mô hình dự
        báo được cải thiện khi tăng số nơ-ron trong mạng. Hơn
        nữa, độ chính xác của mạng LSTM giảm, thời gian dự báo
        tăng lên với thời gian dự báo 1 ngày tiếp theo (t+1) là thời
        gian dự báo tối ưu.










                                                             Hình 3.3: Quan hệ tuyến tính giữa lưu lượng thực tế và dự báo bằng
                                                              mô hình LSTM với số lượng nơ-ron khác nhau ở thời gian t+1. Giai
                                                                  đoạn huấn luyện (cột trái), giai đoạn kiểm tra (cột phải)
                                                                 Hình 3.4 so sánh các giá trị dự báo và thực tế ở tập
                                                             huấn luyện, kiểm tra và toàn bộ số liệu. Nhìn chung, giá
                                                             trị dự báo gần như trùng khớp với giá trị thực tế, mô hình
         Hình 3.1: So sánh các chỉ số đánh giá tính hiệu quả mô hình LSTM   LSTM dự báo với độ chính xác cao và đáng tin cậy. Świątek
             với số lượng các nơ-ron và thời gian dự báo khác nhau  và Okruszko năm 2011 đề xuất thang đánh giá tính chính
            Hàm loss dùng cho cả 3 mạng LSTM (nơ-ron là 1, 2,   xác của mô hình dự báo dựa vào giá trị R , cụ thể như sau:
                                                                                               2
        3, 4) là loss = MSE, epochs = 100, batch size = 32, verbose   Mô hình xuất sắc (0,99≤ R  < 1,00), rất tốt (0,95≤ R  <0,99),
                                                                                   2
                                                                                                       2
        = 1 và optimizer = ‘adam’. Đối với mạng LSTM với 3 nơ-  tốt (0,90≤ R  <0,95), khá tốt (0,85≤ R  <0,90), trung bình
                                                                                             2
                                                                       2
        ron, không có dấu hiệu overfittings ở 100 epochs, do giá   (0,80 ≤ R  < 0,85), chấp nhận được (0,70 ≤ R < 0,80), không
                                                                    2
                                                                                                 2
        trị loss của tập huấn luyện và kiểm tra đều giảm dần theo   đáng tin cậy (R  < 0,70) [14].
                                                                         2
        số epochs và gần như nằm trùng lên nhau. Tuy nhiên, có   Như vậy, mô hình LSTM ứng với số lượng nơ-ron 2, 3, 4
        overfittings xuất hiện ở 100 epochs với mạng nơ-ron = 2,   được đánh giá là tốt trong giai đoạn huấn luyện và khá tốt
        4, mặc dù rất thấp (Hình 3.2).                       trong giai đoạn kiểm tra đối với việc dự báo lưu lượng nước
                                                                                                         105
   101   102   103   104   105   106   107   108   109   110   111