Page 88 - Tạp chí Giao thông Vận Tải - Số Tết Dương Lịch
P. 88
Số 12/2024 (748) KHOA HỌC CÔNG NGHỆ
Tập 64
6
4
Tập
bình 1.920x1.080 pixel, trong đó 2.290 ảnh (khoảng 70%) huấn luyện. Ở đây, sau 300 vòng lặp thì quá trình huấn
được sử dụng để huấn luyện mô hình (tập huấn luyện), 654 luyện kết thúc, mô hình tốt nhất trong các vòng lặp sẽ được
ảnh (khoảng 20%) được sử dụng để kiểm chứng mô hình lưu lại và được sử dụng để phát hiện và phân loại phương
(tập kiểm chứng) và 330 ảnh (khoảng 10%) được sử dụng để tiện. Để xác định được mô hình YOLOv8 phù hợp nhất với
kiểm tra và đánh giá mô hình (tập kiểm tra). Mô hình YOLO tập dữ liệu, nghiên cứu này thực hiện huấn luyện đối với tất
sẽ lấy dữ liệu và “học” từ tập huấn luyện, còn tập kiểm chứng cả các mô hình của YOLOv8. Kết quả huấn luyện ở các mô
được sử dụng để tinh chỉnh các siêu tham số của mô hình hình khác nhau được thể hiện trên Bảng 3.1.
YOLO. Tập dữ liệu ảnh phương tiện giao thông trong nghiên Bảng 3.1. Kết quả huấn luyện mô hình YOLOv8
cứu này như thể hiện trên Hình 3.1, số lượng nhãn của các Thời gian
phương tiện giao thông được thể hiện trên Hình 3.2. Mô hình P R mAP50 mAP50-95 huấn luyện
(giờ)
YOLOv8-n 0,95235 0,92482 0,9559 0,81547 3,694
YOLOv8-s 0,94036 0,93685 0,96239 0,83011 4,303
Từ Bảng 3.1 chi thấy, mô hình YOLOv8-n có giá trị P
cao hơn YOLOv8-s, nhưng các giá trị khác lại thấp hơn. Nói
chung, YOLOv8-s cho kết quả tốt hơn YOLOv8-n nhưng thời
gian huấn luyện dài hơn. Tuy nhiên, sự chênh lệch giữa hai
mô hình này là không lớn. Khi phát triển các mô hình trong
các hệ nhúng ưu tiên sử dụng YOLOv8-n hơn. Một số đồ thị
Hình 3.1: Tập hình ảnh phương tiện giao thông
trong quá trình huấn luyện của mô hình YOLOv8-n được
thể hiện trong Hình 3.3. Từ các đồ thị này cho thấy mô hình
được huấn luyện tương đối tốt. Điều này được thể hiện bởi
giá trị các thành phần tiêu biểu của hàm tổn thất box_loss,
cls_loss ở tập huấn luyện (“train”) và box_loss, cls_loss, ở
tập kiểm chứng (“val”) đều giảm dần sau 300 vòng lặp.
Đồng thời, các giá trị độ chính xác (metrics/precision), độ
triệu hồi (metrics/recall) đều tăng và cao. Bên cạnh đó,
mAP50 và mAP50-95 cũng tăng và tiến gần bằng 1, điều
này có nghĩa kết quả dự đoán của mô hình và vị trí thực tế
của phương tiện giao thông trên ảnh gần giống nhau.
Hình 3.2: Phân bố nhãn của loại phương tiện giao thông
3.3. Huấn luyện mô hình
Huấn luyện YOLOv8 được thực hiện trên môi trường Hình 3.3: Các đồ thị của quá trình huấn luyện mô hình YOLOv8-s
Kaggle (https://www.kaggle.com/). Đây là môi trường có 3.4. Đánh giá mô hình huấn luyện
sẵn GPU (Graphic Proccessing Unit) giúp kéo ngắn thời Để đánh giá mô hình đã huấn luyện, nhóm nghiên cứu
gian huấn luyện. Truy cập Kaggle và cài đặt (Git Clone) dự sử dụng tập kiểm tra với 330 ảnh. Sau khi vận hành trên môi
án YOLOv8 về máy chủ Kaggle, đồng thời cài đặt GPU T4x2. trường Kaggle với đạt được kết quả như trên Bảng 3.2. Từ kết
Hệ thống sau đó sẽ tự động cài các thư viện cần thiết cho quả Bảng 3.2 cho thấy, hai mô hình YOLOv8-n và YOLOv8-s
quá trình huấn luyện. Các bước huấn luyện như sau: cho kết quả trên tập kiểm tra khá tương đồng nhau, giá trị
- Bước 1: Tải dữ liệu huấn luyện lên Kaggle. mAP50-95 đều lớn hơn 0,82 và mô hình YOLOv8-s cho kết
- Bước 2: Cài đặt YOLOv8 trên Kaggle. quả cao hơn, gia tăng khoảng 1,93% về giá trị mAP50-95
- Bước 3: Huấn luyện mô hình và phát hiện phương tiện nhưng lại có thời gian nhận dạng dài hơn.
giao thông. Độ chính xác trung bình mAP50 đều cao hơn 0,95.
Quá trình huấn luyện được thực hiện qua các vòng lặp Điều này cho thấy rằng, chúng ta hoàn toàn có thể sử dụng
cho đến khi các hàm lỗi trong việc dự đoán lớp đối tượng hệ thống nhận dạng phương tiện giao thông từ mô hình
cho mỗi hộp giới hạn (box_loss), hàm định lượng (cls_loss) YOLOv8-n để nghiên cứu một nút giao thông hoặc một
ít thay đổi, tức là sai số trong việc định vị trí và nhận dạng đoạn đường. Một số hình ảnh phương tiện giao thông
phương tiện giao thông thay đổi không đáng kể thì dừng được nhận dạng từ YOLOv8-s như hình dưới đây (Hình 3.4).
87