Page 105 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 105

KHOA HỌC CÔNG NGHỆ     Tập  6 4
                                   Tập 64
                                   Số 12/2024 (748)
            tính hiệu quả của mô hình mạng LSTM trong dự báo lưu    Mạng LSTM là một kiến trúc nâng cấp đặc biệt từ
            lượng nước ở trạm Hà Nội trên sông Hồng; (ii) Tìm ra các   mạng RNN, do Hochreiter và Schmidhuber phát minh năm
            thông số tối ưu của mô hình, phù hợp với bộ dữ liệu hiện   1997 [10]. Mạng LSTM khắc phục được hạn chế của  RNN
            có. Kết quả nghiên cứu có thể cung cấp một cách tiếp cận   truyền  thống  trong  việc  duy  trì  thông  tin  lâu  dài  (long-
            mới và tiềm năng  trong  quản lý  tài nguyên  nước cũng   term dependencies) [11]. Cấu trúc của mạng LSTM bao
            như trong nghiên cứu dự báo các đặc điểm thủy văn, biến   gồm nhiều tế bào LSTM liên kết tuần tự (Hình 2.1b). Mỗi
            động môi trường.                                    tế bào LSTM có thêm trạng thái bên trong và 3 cổng kiểm
                                                                soát thông tin: Cổng quên (forget gate), cổng vào (input
                2. SỐ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU            gate) và cổng ra (output gate) [6, 12].
                2.1. Số liệu                                        2.3. Các chỉ số đánh giá chất lượng mô hình
                Trong nghiên cứu này, số liệu được sử dụng bao gồm   Ba chỉ số thống kê, gồm R  (công thức 2), NASH (công
                                                                                          2
            lưu lượng nước thực đo tại các trạm Hòa Bình, Yên Bái, Vụ   thức 3) và  RMSE  (công thức 4), được sử dụng để đánh
            Quang và Hà Nội kết hợp với mực nước đo tại các trạm Hà   giá tính chính xác của mô hình dự báo. Hệ số NASH và R
                                                                                                                2
            Nội và Ba Lạt, dưới dạng số liệu trung bình ngày từ năm   (dao động từ 0 đến 1) phản ánh mức độ giải thích của các
            2011 đến năm 2019.                                  biến độc lập đối với các biến phụ thuộc; giá trị càng cao,
                2.2. Phương pháp nghiên cứu                     mô hình càng chính xác [9]. Chỉ số RMSE (0<RMSE<∞) đo
                Với dữ liệu chuỗi thời gian, chất lượng dữ liệu phải   lường mức độ sai khác giữa các giá trị dự đoán và giá trị
            đảm bảo số lượng đủ lớn, liên tục và ít giá trị ngoại lai…   thực tế, giá trị này càng thấp thì mô hình sẽ tốt hơn.
            là yếu tố quyết định đến độ chính xác của các mô hình dự
            báo [6]. Do đó, dữ liệu được tiền xử lý qua hai bước trước                                         (2)
            khi được đưa vào mô hình để huấn luyện thuật toán:
                1) Giá trị ngoại lai khác thường trong bộ số liệu cần                                          (3)
            được kiểm tra lại. Nếu xác định là giá trị lỗi, chúng được
            thay thế bằng trung bình của 4 giá trị lân cận.                                                    (4)
                2) Tất cả dữ liệu được chuẩn hóa về một phạm vi
            từ 0 đến 1 bằng phương pháp bình thường hóa dữ liệu
            (normalization scaling, công thức 1), được thực hiện trong   Trong đó: Q  - Giá trị dự báo; Q - Giá trị quan trắc; Q -
                                                                                                               tđ
                                                                                             tđ
                                                                              tt
            thư viện scikit-learn [10].                         Trung bình giá trị quan trắc; n - Số mẫu.
                                                                    (1)  Nghiên cứu này sẽ đánh giá khả năng dự báo lưu
                                                                lượng nước của thuật toán LSTM với số nơ-ron khác nhau
                Trong đó: max(x), min(x) - Giá trị lớn nhất và nhỏ nhất   (1, 2, 3, 4) ở các thời gian dự báo 1, 2, 3 ngày tiếp theo.
            của bộ dữ liệu; x - Giá trị dữ liệu; z - Giá trị đã được chuẩn   Dữ liệu được chia làm hai phần: 70% cho tập huấn luyện
            hóa từ x. Việc chuẩn hóa giúp dữ liệu hội tụ và giảm sự   (training), 30% cho tập kiểm tra (testing). Phương pháp
            phân tán [7],  đồng thời tăng tốc quá trình huấn luyện   đánh giá độ chính xác trung bình của mô hình phân
            thuật toán mà không ảnh hưởng đến độ chính xác của mô   lớp CV (Cross Validation) được áp dụng để hạn chế hiện
            hình [8].                                           tượng mô hình dự đoán quá khớp với dữ liệu huấn luyện
                Mạng nơ-ron hồi quy (RNN) được thiết kế để xử lý các   (overfitting). CV là phương pháp chia tập training ra thành
            dạng dữ liệu chuỗi thời gian. RNN nhận một đầu vào x ,   N phần. Tại mỗi vòng huấn luyện, mô hình sẽ sử dụng N-1
                                                           t
            xử lý và đưa ra đầu ra h  . RNN sẽ lưu lại giá trị của h  để sử   phần để huấn luyện và phần còn lại để kiểm tra, giúp giảm
                                                      t
                               t
            dụng cho đầu vào bước kế tiếp. Mạng RNN có thể được   thiểu khả năng xảy ra overfittings. Nghiên cứu sử dụng CV
            xem là một chuỗi những mạng con giống hệt nhau, mỗi   = 10, đây là số phổ biến trong huấn luyện thuật toán học
            mạng con sẽ truyền thông tin nó vừa xử lý cho mạng phía   máy [10, 13].
            sau nó. Nếu ta tách từng vòng lặp xử lý trong RNN ra thành
            từng mạng nhỏ thì sẽ có một mạng RNN có kiến trúc như   3. KẾT QUẢ VÀ THẢO LUẬN
            Hình 2.1a [9].                                          Đối với mạng LSTM có 1 nơ-ron, chỉ số R  đạt cao nhất
                                                                                                     2
                                                                tại thời gian dự báo t+1, với giá trị 0,924. Khi thời gian dự
                                                                báo tăng lên t+2, t+3 thì giá trị R  giảm dần, lần lượt là
                                                                                             2
                                                                0,756 và 0,623. Giá trị RMSE thấp nhất đạt được ở thời gian
                                                                dự báo t+1 và tăng dần khi thời gian dự báo từ t+2 đến t+3.
                                                                                                       2
                                                                    Mạng LSTM có từ 2 đến 4 nơ-ron, chỉ số R  ở thời gian
                                                                t+1 đạt cao nhất, dao động từ 0,935 đến 0,938. Khác với
                                                                mạng LSTM có 1 nơ-ron, R  giảm rồi tăng khi tăng thời gian
                                                                                      2
                                                                dự báo, mạng LSTM có có từ 2 đến 4 nơ-ron cho thấy chỉ
                                                                    2
                                                                số R  giảm liên tục khi tăng thời gian dự báo từ t+1 lên t+3
                                                                (Bảng 3.1).
                                                                                              2
                                                                    Trong mạng LSTM 1 nơ-ron, R  khá thấp. Tuy nhiên,
                                                                khi tăng số nơ-ron (từ 2 đến 4), R  tăng lên đáng kể. Ngoài
                                                                                            2
                                                                ra, giá trị R , RMSE và MAE không có khác biệt đáng kể giữa
                                                                         2
                                                                các mạng 2, 3 và 4 nơ-ron (Bảng 3.1).
             Hình 2.1: Cấu trúc mạng RNN truyền thống (a) và mạng LSTM (b)
            104
   100   101   102   103   104   105   106   107   108   109   110