So sánh mô hình: YOLOv5 so với YOLOv6-3.0 để phát hiện đối tượng
Việc lựa chọn mô hình phát hiện đối tượng tối ưu là rất quan trọng đối với các ứng dụng thị giác máy tính thành công. Cả hai Ultralytics YOLOv5 và Meituan YOLOv6-3.0 là những lựa chọn phổ biến được biết đến với hiệu quả và độ chính xác. Trang này cung cấp so sánh kỹ thuật để giúp bạn quyết định mô hình nào phù hợp nhất với nhu cầu dự án của bạn. Chúng tôi đi sâu vào các sắc thái kiến trúc, chuẩn mực hiệu suất, phương pháp đào tạo và ứng dụng phù hợp của chúng.
Ultralytics YOLOv5
YOLOv5 là mô hình phát hiện đối tượng một giai đoạn, nổi tiếng về tốc độ và khả năng thích ứng. Được phát triển bởi Ultralytics và ban đầu được phát hành vào ngày 26 tháng 6 năm 2020, YOLOv5 được xây dựng với kiến trúc linh hoạt cho phép dễ dàng mở rộng quy mô và tùy chỉnh. Kiến trúc của nó sử dụng các thành phần như CSPBottleneck, tập trung vào tốc độ suy luận được tối ưu hóa và duy trì sự cân bằng với độ chính xác.
- Tác giả : Glenn Jocher
- Tổ chức : Ultralytics
- Ngày : 2020-06-26
- GitHub : Kho lưu trữ GitHub YOLOv5
- Tài liệu : Tài liệu YOLOv5
YOLOv5 cung cấp nhiều kích thước mô hình (n, s, m, l, x), mỗi kích thước được thiết kế để đáp ứng các yêu cầu hiệu suất khác nhau. Các mô hình nhỏ hơn như YOLOv5n lý tưởng cho các thiết bị biên do kích thước nhỏ gọn và suy luận nhanh, trong khi các mô hình lớn hơn như YOLOv5x cung cấp độ chính xác nâng cao cho các tác vụ đòi hỏi khắt khe hơn. YOLOv5 đặc biệt mạnh mẽ trong các ứng dụng yêu cầu phát hiện đối tượng theo thời gian thực do tốc độ và hiệu quả của nó.
Điểm mạnh của YOLOv5 :
- Tốc độ : YOLOv5 có tốc độ suy luận vượt trội, phù hợp với các ứng dụng thời gian thực.
- Tính linh hoạt : Kiến trúc của nó có khả năng tùy chỉnh và mở rộng cao.
- Hỗ trợ cộng đồng : Được hỗ trợ bởi một cộng đồng lớn và năng động, cung cấp nhiều nguồn lực và hỗ trợ.
- Dễ sử dụng : Quy trình làm việc đơn giản để đào tạo, xác thực và triển khai, được tăng cường bởi Ultralytics TRUNG TÂM.
Điểm yếu của YOLOv5 :
- Độ chính xác : Mặc dù chính xác, các mô hình YOLOv6-3.0 lớn hơn có thể đạt được mAP tốt hơn một chút trong một số điểm chuẩn.
Meituan YOLOv6-3.0
YOLOv6-3.0 , được Meituan phát triển và giới thiệu vào tháng 1 năm 2023, đại diện cho sự tiến bộ trong YOLO loạt, tập trung vào độ chính xác và tốc độ được cải thiện. Trong khi các chi tiết kiến trúc cụ thể được tìm thấy tốt nhất trong các tài nguyên YOLOv6 chính thức, nó kết hợp các cải tiến như mô-đun Bi-directional Concatenation (BiC) và chiến lược Anchor-Aided Training (AAT). Những cải tiến này nhằm mục đích tăng cường độ chính xác của việc trích xuất và phát hiện tính năng mà không làm giảm tốc độ đáng kể.
- Tác giả : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
- Tổ chức : Meituan
- Ngày : 2023-01-13
- arXiv : YOLOv6 v3.0: Tải lại toàn diện
- GitHub : Kho lưu trữ GitHub của YOLOv6
- Tài liệu : Tài liệu YOLOv6
YOLOv6-3.0 cũng cung cấp các mô hình ở nhiều kích cỡ khác nhau (n, s, m, l) để cân bằng hiệu suất và tài nguyên tính toán. Các điểm chuẩn cho thấy các mô hình YOLOv6-3.0 có thể đạt được mAP cạnh tranh hoặc vượt trội so với các mô hình có kích thước tương tự YOLOv5 các mô hình, đặc biệt là trong các cấu hình lớn hơn, cho thấy độ chính xác được nâng cao trong các nhiệm vụ phát hiện đối tượng.
Điểm mạnh của YOLOv6-3.0:
- Độ chính xác : Nói chung cung cấp mAP cạnh tranh hoặc tốt hơn, đặc biệt là ở các mô hình có kích thước lớn hơn.
- Tốc độ suy luận : Đạt được tốc độ suy luận nhanh, phù hợp để phát hiện đối tượng theo thời gian thực.
- Đổi mới về kiến trúc : Kết hợp mô-đun BiC và AAT để tăng hiệu suất.
Điểm yếu của YOLOv6-3.0:
- Cộng đồng và Tài nguyên : Mặc dù hiệu quả, nhưng nó có thể không có sự hỗ trợ rộng rãi của cộng đồng và các nguồn lực sẵn có so với YOLOv5 .
- Tích hợp : Tích hợp trực tiếp với Ultralytics HUB và các công cụ liên quan có thể kém liền mạch hơn so với bản gốc Ultralytics mô hình.
Bảng so sánh hiệu suất
Người mẫu | kích thước (pixel) | mAP giá trị 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | tham số (M) | FLOP (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0 giây | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Phần kết luận
Cả hai YOLOv5 và YOLOv6-3.0 là các mô hình phát hiện đối tượng mạnh mẽ, mỗi mô hình có thế mạnh riêng. YOLOv5 vẫn là một mô hình linh hoạt và nhanh chóng, được hưởng lợi từ sự hỗ trợ rộng rãi của cộng đồng và sự tích hợp liền mạch trong Ultralytics hệ sinh thái. Đây là lựa chọn tuyệt vời cho nhiều ứng dụng thời gian thực. YOLOv6-3.0 cung cấp giải pháp thay thế hấp dẫn cho các dự án ưu tiên độ chính xác cao hơn mà không ảnh hưởng đến tốc độ suy luận. Các cải tiến về mặt kiến trúc của nó mang lại lợi thế về hiệu suất trong một số tình huống nhất định.
Đối với người dùng đang tìm kiếm các mô hình tiên tiến, hãy cân nhắc khám phá các mô hình mới hơn Ultralytics các mô hình như YOLOv8 , YOLOv9 , YOLOv10 và YOLO11 . Đối với các ứng dụng chuyên biệt, các mô hình như YOLO -NAS và RT-DETR mang lại những lợi thế độc đáo, trong khi FastSAM cung cấp khả năng phân đoạn hiệu quả.
Để biết thêm chi tiết và phạm vi mô hình rộng hơn, hãy tham khảo Tài liệu về mô hình Ultralytics .