Page 104 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 104

Số 12/2024 (748) KHOA HỌC CÔNG NGHỆ
                                                                                 Tập
                                                                                 Tập 64
                                                                                     4
                                                                                     6
        Nghiên cứu xây dựng mô hình máy học LSTM

        (Long short-Term Memory) dự báo lưu lượng nước


        tại Trạm Thủy văn Hà Nội trên sông Hồng




                          (1)
                                                      (2)
        n ThS. TRẦN THỊ TÚ ; ThS. NGUYỄN THỊ BÍCH NGỌC ; ThS. MAI QUANG TUẤN (3)
           Trường Đại học Tài nguyên và Môi trường Hà Nội
                                  (2)
           Email:  tttu.@hunre.edu.vn;  ntbngoc@hunre.edu.vn;  mqtuan@hunre.edu.vn
                (1)
                                                        (3)

            TÓM TẮT: Bài báo trình bày kết quả của nghiên        ahead  (t+1),  R2,  RMSE,  NASH  reached  0.9335,
            cứu  xây  dựng  mô  hình  mạng  bộ  nhớ  dài-ngắn    0.026, and 0.927, respectively, for training period
            LSTM (Long Short-Term Memory), một dạng đặc          and 0.912, 0.026 and 0.92, respectively, for testing
            biệt  của  mạng  nơ-ron  hồi  quy  (RNN-Recurrent    period.  The  LSTM  network  model  demonstrates
            Neural  Network),  để  dự  báo  lưu  lượng  nước  tại   good predictive capability for water flow at the Hanoi
            Trạm Thủy văn Hà Nội trên sông Hồng. Dữ liệu lưu     hydrological station and shows potential application
            lượng, mực nước được thu thập theo giá trị trung     in other hydrological stations.
            bình hàng ngày từ năm 2011 đến năm 2019. Các         KEYWORDS:  Flow  forcasting,  Ha  Noi,  LSTM,
            chỉ số thống kê như hệ số xác định (Coefficient of   Machine Learning.
            determination, R2), lỗi trung bình bình phương gốc
            (Root Mean Squared Error, RMSE) và hệ số NASH
            (Nash-Sutcliffe efficiency coefficient) được sử dụng
            để đánh giá tính chính xác của mô hình. Nghiên
            cứu đánh giá khả năng dự báo lưu lượng nước của
            thuật toán LSTM với số nơ-ron khác nhau (1, 2, 3, 4)     1. ĐẶT VẤN ĐỀ
            ở các thời gian dự báo khác nhau: 1, 2, 3 ngày tiếp   Lũ lụt là hiện tượng tự nhiên nguy hiểm, ảnh hưởng
            theo (t+1, t+2, t+3). Kết quả cho thấy mô hình mạng   đến đời sống người dân, đặc biệt là cộng đồng dân cư
            LSTM  có  3  nơ-ron  dự  báo  tối  ưu  nhất  ở  1  ngày   vùng hạ lưu. Dự báo chính xác thời điểm và dấu hiệu của
            tiếp theo (t + 1) với R2 = 0,9335, RMSE = 0,026,   lũ lụt là điều vô cùng quan trọng trong công tác quản lý
            NASH = 0,927 cho huấn luyện, R2 = 0,912, RMSE    nguồn nước nhằm giảm thiểu tác động tiêu cực và có kế
            = 0,026, NASH = 0,92 cho tập kiểm tra. Mô hình   hoạch ứng phó kịp thời với tình huống lũ lụt bất ngờ. Tuy
            mạng LSTM dự báo khá tốt lưu lượng trạm Hà Nội   nhiên, công tác dự báo chính xác lưu lượng nước là vấn đề
            và tiềm năng ứng dụng cho các trạm thủy văn khác.  vô cùng khó khăn do lưu lượng dòng chảy chịu tác động
            TỪ  KHÓA:  Dự  báo  lưu  lượng,  Hà  Nội,  LSTM,   của rất nhiều yếu tố thủy văn như chế độ triều, dòng chảy,
            Machine Learning.                                lượng mưa, địa hình lòng sông [1]. Nhiều nghiên cứu đã
                                                             nỗ lực đưa ra các phương pháp dự báo lưu lượng nước, với
            ABSTRACT:  This  paper  presents  the  results  of   các mô hình chủ yếu dựa trên toán học, được chia thành
            developing  an  LSTM  (Long  Short-Term  Memory)   hai nhóm chính: (1) Mô hình tiến trình (Process-based
            model,  a  specialized  form  of  Recurrent  Neural   models) là loại mô hình kết hợp toán - lý, dựa trên các
            Network  (RNN),  to  provide  an  effective  approach
            for  forecasting  flow  rates  at  the  Hanoi  hydrology   quy luật thủy văn được mô tả và ước tính chính xác nhờ
            station  on  the  Hong  River.  The  flow  and  water   các quy luật vật lý được nghiên cứu và tích hợp sẵn trong
            level data used in the study were collected as daily   mô hình [2, 3]. (2) Một cách tiếp cận khác là sử dụng các
            average values from 2011 to 2019. The Coefficient   thuật toán học máy (machine learning) trong dự báo lưu
            of  Determination  (R2),  Root  Mean  Squared  Error   lượng, ví dụ K-Nearest Neighbors, Decision Tree, Random
            (RMSE)  and  Nash-Sutcliffe  efficiency  coefficien   Forest, Support Vector Machine, Artificial eural etwork và
            (NASH) were utilized to evaluate the performances   Long Short-Term Memory (LSTM). Phương pháp này có ưu
            of  the  LSTM  model.  The  study  assesses  the   điểm là dễ áp dụng, độ chính xác cao, không yêu cầu nhiều
            LSTM algorithm ability to predict water flow using   số liệu. Tuy nhiên, do các mô hình học máy thuộc nhóm
            different number of neurons (1, 2, 3, 4) at various   “black-box” nên đôi khi khó giải thích kết quả [2, 4 ,5]. Việc
            forecasting intervals: 1, 2, 3  day ahead (t+1, t+2,   thu thập đầy đủ các thông tin về các yếu tố ảnh hưởng đến
            t+3).  The  results  indicate  that  the  LSTM  model   lưu lượng dòng chảy thường rất khó khăn và không toàn
            with  3  neurons  achieved  a  high  performance  for   diện [2]. Vì vậy, việc lựa chọn các mô hình học máy để dự
            flow  rate  forecasting.  When  forecasting  one  day   báo lưu lượng dòng chảy trong trường hợp này là phù hợp.
                                                                 Bài báo được thực hiện với các mục tiêu: (i) Đánh giá

                                                                                                         103
   99   100   101   102   103   104   105   106   107   108   109