So sánh Mô hình: YOLOv5 so với YOLOv6-3.0 để Phát hiện Đối tượng
Việc lựa chọn mô hình phát hiện đối tượng tối ưu là rất quan trọng để ứng dụng thị giác máy tính thành công. Cả Ultralytics YOLOv5 và Meituan YOLOv6-3.0 đều là những lựa chọn phổ biến được biết đến với hiệu quả và độ chính xác. Trang này cung cấp so sánh kỹ thuật để giúp bạn quyết định mô hình nào phù hợp nhất với nhu cầu dự án của bạn. Chúng ta sẽ đi sâu vào sự khác biệt về kiến trúc, các chuẩn mực hiệu suất, các phương pháp đào tạo và các ứng dụng phù hợp, làm nổi bật những điểm mạnh của hệ sinh thái Ultralytics.
Ultralytics YOLOv5: Tiêu chuẩn công nghiệp đã được thiết lập
Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Tài liệu: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5 là mô hình phát hiện đối tượng một giai đoạn, nổi tiếng về tốc độ, tính dễ sử dụng và khả năng thích ứng. Được phát triển bởi Ultralytics , nó đại diện cho một bước tiến quan trọng trong việc tạo điều kiện cho việc phát hiện đối tượng hiệu suất cao. Được xây dựng hoàn toàn bằng PyTorch , YOLOv5 Hệ thống này được trang bị xương sống CSPDarknet53 và một nút PANet để trích xuất và hợp nhất các đặc điểm một cách hiệu quả. Kiến trúc của nó có tính mô-đun cao, cho phép dễ dàng mở rộng trên các kích thước mô hình khác nhau (n, s, m, l, x) để đáp ứng các yêu cầu hiệu suất đa dạng.
Điểm mạnh của YOLOv5
- Tốc độ và hiệu quả: YOLOv5 vượt trội về tốc độ suy luận, khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực và triển khai trên các thiết bị biên có tài nguyên hạn chế. Như được thấy trong bảng hiệu suất, mô hình YOLOv5n cung cấp thời gian suy luận CPU và GPU nhanh nhất trong số các mô hình nhỏ hơn.
- Dễ sử dụng: Được biết đến với sự đơn giản, YOLOv5 mang đến trải nghiệm người dùng được tối ưu hóa với API đơn giản, tài liệu phong phú và nhiều hướng dẫn.
- Hệ sinh thái được duy trì tốt: Hưởng lợi từ hệ sinh thái Ultralytics tích hợp, bao gồm phát triển tích cực, hỗ trợ cộng đồng mạnh mẽ thông qua Discord, cập nhật thường xuyên và tích hợp liền mạch với Ultralytics HUB cho MLOps.
- Tính linh hoạt: Hỗ trợ nhiều tác vụ bao gồm phát hiện đối tượng, phân vùng thể hiện và phân loại ảnh, cung cấp một giải pháp toàn diện hơn so với các mô hình đơn tác vụ.
- Hiệu Quả Huấn Luyện: Cung cấp quy trình huấn luyện hiệu quả, trọng số đã được huấn luyện trước có sẵn và yêu cầu bộ nhớ thấp hơn so với nhiều kiến trúc khác, đặc biệt là các mô hình dựa trên transformer.
Điểm yếu của YOLOv5
- Độ chính xác: Mặc dù có độ chính xác và hiệu quả cao, các mô hình mới hơn như YOLOv6-3.0 hoặc Ultralytics YOLOv8 có thể cung cấp mAP cao hơn một chút trên một số chuẩn đánh giá nhất định, đặc biệt là các biến thể mô hình lớn hơn.
- Phát hiện dựa trên Anchor: Dựa vào các hộp anchor, có thể yêu cầu điều chỉnh để có hiệu suất tối ưu trên các bộ dữ liệu đa dạng so với các bộ dò tìm không cần anchor hiện đại.
Meituan YOLOv6-3.0: Ứng Viên Công Nghiệp
Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
Tổ chức: Meituan
Ngày: 13-01-2023
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Tài liệu: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0, được phát triển bởi Meituan, là một framework phát hiện đối tượng được thiết kế chủ yếu cho các ứng dụng công nghiệp. Được phát hành vào đầu năm 2023, nó hướng đến việc cung cấp sự cân bằng giữa tốc độ và độ chính xác phù hợp với các tình huống triển khai thực tế. YOLOv6 giới thiệu các sửa đổi kiến trúc như thiết kế backbone và neck hiệu quả. Phiên bản 3.0 tinh chỉnh thêm các yếu tố này và kết hợp các kỹ thuật như tự chưng cất trong quá trình huấn luyện để tăng hiệu suất. Nó cũng cung cấp các mô hình cụ thể được tối ưu hóa cho việc triển khai trên thiết bị di động (YOLOv6Lite).
Điểm mạnh của YOLOv6-3.0
- Sự cân bằng tốt giữa tốc độ và độ chính xác: Mang lại hiệu suất cạnh tranh, đặc biệt cho các tác vụ phát hiện đối tượng công nghiệp, nơi tối đa hóa mAP trên GPU là mục tiêu.
- Hỗ trợ lượng tử hóa: Cung cấp các công cụ và hướng dẫn cho lượng tử hóa mô hình, có lợi cho việc triển khai trên phần cứng có tài nguyên hạn chế.
- Tối ưu hóa cho thiết bị di động: Bao gồm các biến thể YOLOv6Lite được thiết kế đặc biệt để suy luận trên thiết bị di động hoặc dựa trên CPU.
Điểm yếu của YOLOv6-3.0
- Tính linh hoạt của tác vụ bị hạn chế: Chủ yếu tập trung vào phát hiện đối tượng, thiếu sự hỗ trợ gốc cho phân đoạn, phân loại hoặc ước tính tư thế được tìm thấy trong các mô hình Ultralytics như YOLOv5 và YOLOv8.
- Hệ sinh thái và Bảo trì: Mặc dù là mã nguồn mở, hệ sinh thái này không toàn diện hoặc được duy trì tích cực như nền tảng Ultralytics, có khả năng dẫn đến việc cập nhật chậm hơn và ít hỗ trợ từ cộng đồng hơn.
- Sử dụng tài nguyên cao hơn: Các mô hình YOLOv6 lớn hơn có thể có số lượng tham số và FLOPs lớn hơn đáng kể so với các mô hình YOLOv5 tương đương để đạt được mAP tương tự, có khả năng đòi hỏi nhiều tài nguyên tính toán hơn.
So sánh trực tiếp hiệu năng
Bảng dưới đây cung cấp so sánh trực tiếp các số liệu hiệu suất giữa các mô hình YOLOv5 và YOLOv6-3.0 trên tập dữ liệu COCO. Ultralytics YOLOv5 thể hiện tốc độ vượt trội trên cả CPU và GPU đối với các mô hình nhỏ hơn, khiến nó trở thành một lựa chọn tuyệt vời cho các ứng dụng biên thời gian thực. Trong khi các mô hình YOLOv6-3.0 lớn hơn có thể đạt được mAP đỉnh cao hơn, YOLOv5 mang lại hiệu suất cân bằng và hiệu quả hơn trên toàn diện, đặc biệt khi xem xét số lượng tham số và FLOP thấp hơn.
Mô hình | Kích thước (pixels) |
mAPval 50-95 |
Tốc độ CPU ONNX (ms) |
Tốc độ T4 TensorRT10 (ms) |
Tham số (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Phương pháp Huấn luyện
Cả hai mô hình đều tận dụng các kỹ thuật học sâu tiêu chuẩn để huấn luyện trên các bộ dữ liệu lớn như COCO. Tuy nhiên, Ultralytics YOLOv5 được hưởng lợi đáng kể từ hệ sinh thái Ultralytics, cung cấp quy trình huấn luyện được sắp xếp hợp lý, hướng dẫn mở rộng, tối ưu hóa AutoAnchor và tích hợp với các công cụ như Weights & Biases và ClearML để theo dõi thử nghiệm. Cách tiếp cận tích hợp này giúp đơn giản hóa chu kỳ phát triển và tăng tốc thời gian triển khai. Việc huấn luyện YOLOv6-3.0 tuân theo các quy trình được nêu trong kho lưu trữ chính thức của nó.
Các trường hợp sử dụng lý tưởng
- Ultralytics YOLOv5: Rất được khuyến khích cho các ứng dụng đòi hỏi hiệu suất thời gian thực và dễ triển khai, đặc biệt là trên CPU hoặc các thiết bị biên. Tính linh hoạt, hỗ trợ mở rộng và sử dụng tài nguyên hiệu quả của nó làm cho nó lý tưởng để tạo mẫu nhanh, ứng dụng di động, giám sát video (thị giác máy tính để ngăn chặn trộm cắp) và các dự án được hưởng lợi từ một hệ sinh thái trưởng thành, được ghi chép đầy đủ.
- Meituan YOLOv6-3.0: Một lựa chọn mạnh mẽ khi tối đa hóa độ chính xác trên GPU là mục tiêu chính, đồng thời vẫn yêu cầu suy luận nhanh. Nó phù hợp cho các ứng dụng công nghiệp, nơi mà những cải tiến nhỏ về mAP so với YOLOv5 có thể biện minh cho sự phức tạp gia tăng hoặc ít hỗ trợ hệ sinh thái hơn.
Kết luận
Ultralytics YOLOv5 vẫn là một lựa chọn nổi bật, đặc biệt được đánh giá cao vì tốc độ vượt trội, tính dễ sử dụng và hệ sinh thái mạnh mẽ. Nó cung cấp sự cân bằng tuyệt vời giữa hiệu suất và hiệu quả, được hỗ trợ bởi tài liệu mở rộng và hỗ trợ cộng đồng, giúp các nhà phát triển và nhà nghiên cứu dễ dàng tiếp cận.
YOLOv6-3.0 cung cấp hiệu suất cạnh tranh, đặc biệt về mAP đỉnh cho các mô hình lớn hơn trên GPU. Nó đóng vai trò như một giải pháp thay thế khả thi cho những người dùng ưu tiên độ chính xác cao nhất có thể trong khuôn khổ YOLO cho các tác vụ công nghiệp chuyên biệt.
Đối với những ai đang tìm kiếm những tiến bộ mới nhất, hãy cân nhắc khám phá các mô hình Ultralytics mới hơn như YOLOv8, YOLOv9, YOLOv10 và YOLO11, mang lại những cải tiến hơn nữa về hiệu suất, tính linh hoạt và hiệu quả. Các mô hình chuyên dụng như RT-DETR cũng cung cấp những lợi thế riêng cho các trường hợp sử dụng cụ thể.
Khám phá đầy đủ các tùy chọn trong Tài liệu về Mô hình Ultralytics.