So sánh mô hình: YOLOv6-3.0 so với YOLOv5 để phát hiện đối tượng
Việc lựa chọn mô hình phát hiện đối tượng tối ưu là rất quan trọng để ứng dụng thị giác máy tính thành công. Cả Meituan YOLOv6-3.0 và Ultralytics YOLOv5 đều là những lựa chọn phổ biến được biết đến với hiệu quả và độ chính xác. Trang này cung cấp so sánh kỹ thuật để giúp bạn quyết định mô hình nào phù hợp nhất với nhu cầu dự án của bạn. Chúng ta sẽ đi sâu vào sự khác biệt về kiến trúc, các chuẩn mực hiệu suất, các phương pháp đào tạo và các ứng dụng phù hợp, làm nổi bật những điểm mạnh của hệ sinh thái Ultralytics.
Meituan YOLOv6-3.0
YOLOv6-3.0, được phát triển bởi Meituan, là một framework phát hiện đối tượng được thiết kế chủ yếu cho các ứng dụng công nghiệp. Được phát hành vào đầu năm 2023, nó nhằm mục đích cung cấp sự cân bằng giữa tốc độ và độ chính xác phù hợp cho các tình huống triển khai thực tế.
- Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
- Tổ chức: Meituan
- Ngày: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- Tài liệu: https://docs.ultralytics.com/models/yolov6/
Kiến trúc và các tính năng chính
YOLOv6 giới thiệu các sửa đổi kiến trúc như một backbone có thể tái tham số hóa hiệu quả và thiết kế neck được sắp xếp hợp lý. Phiên bản 3.0 tiếp tục tinh chỉnh các yếu tố này và kết hợp các kỹ thuật như tự chưng cất trong quá trình huấn luyện để tăng hiệu suất. Nó cũng cung cấp các mô hình cụ thể được tối ưu hóa để triển khai trên thiết bị di động (YOLOv6Lite).
Điểm mạnh
- Sự cân bằng tốt giữa tốc độ và độ chính xác: Mang lại hiệu suất cạnh tranh, đặc biệt cho các tác vụ phát hiện đối tượng công nghiệp trên GPU.
- Hỗ trợ lượng tử hóa: Cung cấp các công cụ và hướng dẫn cho lượng tử hóa mô hình, có lợi cho việc triển khai trên phần cứng có tài nguyên hạn chế.
- Tối ưu hóa cho thiết bị di động: Bao gồm các biến thể YOLOv6Lite được thiết kế đặc biệt để suy luận trên thiết bị di động hoặc dựa trên CPU.
Điểm yếu
- Tính linh hoạt của tác vụ bị hạn chế: Chủ yếu tập trung vào phát hiện đối tượng, thiếu sự hỗ trợ gốc cho phân đoạn thể hiện, phân loại hình ảnh và ước tính tư thế được tìm thấy trong các mô hình Ultralytics như YOLOv8.
- Hệ sinh thái và Bảo trì: Mặc dù là mã nguồn mở, hệ sinh thái này không toàn diện hoặc được duy trì tích cực như nền tảng Ultralytics. Điều này có thể dẫn đến việc cập nhật chậm hơn, ít hỗ trợ từ cộng đồng hơn và trải nghiệm người dùng phức tạp hơn.
- Mức sử dụng tài nguyên cao hơn: Như được thấy trong bảng hiệu suất, các mô hình YOLOv6 lớn hơn có thể có nhiều tham số và FLOP hơn so với các mô hình YOLOv5 tương đương, có khả năng đòi hỏi nhiều tài nguyên tính toán hơn.
Ultralytics YOLOv5
Ultralytics YOLOv5 là một mô hình phát hiện đối tượng một giai đoạn, nổi tiếng về tốc độ, dễ sử dụng và khả năng thích ứng. Được phát triển bởi Ultralytics, nó đại diện cho một bước tiến quan trọng trong việc làm cho phát hiện đối tượng hiệu suất cao trở nên dễ tiếp cận với nhiều đối tượng.
- Tác giả: Glenn Jocher
- Tổ chức: Ultralytics
- Ngày: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Tài liệu: https://docs.ultralytics.com/models/yolov5/
Được xây dựng hoàn toàn bằng PyTorch , YOLOv5 Hệ thống này được trang bị xương sống CSPDarknet53 và một nút PANet để trích xuất và hợp nhất các đặc điểm một cách hiệu quả. Kiến trúc của nó có tính mô-đun cao, cho phép dễ dàng mở rộng trên các kích thước mô hình khác nhau (n, s, m, l, x) để đáp ứng các yêu cầu hiệu suất đa dạng.
Điểm mạnh của YOLOv5
- Tốc độ và hiệu quả: YOLOv5 vượt trội về tốc độ suy luận, khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực và triển khai trên các thiết bị biên có tài nguyên hạn chế. Hiệu suất CPU của nó đặc biệt đáng chú ý.
- Dễ sử dụng: Được biết đến với sự đơn giản, YOLOv5 mang đến trải nghiệm người dùng được tối ưu hóa với API đơn giản, tài liệu phong phú và nhiều hướng dẫn.
- Hệ sinh thái được duy trì tốt: Hưởng lợi từ hệ sinh thái Ultralytics tích hợp, bao gồm phát triển tích cực, hỗ trợ cộng đồng mạnh mẽ, cập nhật thường xuyên và tích hợp liền mạch với Ultralytics HUB cho MLOps.
- Cân bằng hiệu suất: Đạt được sự cân bằng tốt giữa tốc độ và độ chính xác, phù hợp với nhiều tình huống triển khai thực tế khác nhau.
- Hiệu Quả Huấn Luyện: Cung cấp quy trình huấn luyện hiệu quả, các trọng số đã được huấn luyện trước có sẵn và yêu cầu bộ nhớ thấp hơn so với nhiều kiến trúc khác, đặc biệt là các mô hình dựa trên transformer.
- Tính linh hoạt: Hỗ trợ nhiều tác vụ bao gồm phát hiện đối tượng, phân vùng thể hiện và phân loại ảnh trong một khuôn khổ thống nhất.
Điểm yếu của YOLOv5
- Độ chính xác cao nhất: Mặc dù có độ chính xác và hiệu quả cao, các mô hình mới hơn như YOLOv6-3.0 hoặc Ultralytics YOLOv8 có thể cung cấp mAP cao hơn một chút trên một số chuẩn nhất định, đặc biệt là các biến thể mô hình lớn hơn trên GPU.
So sánh hiệu năng trực tiếp: YOLOv6-3.0 so với YOLOv5
Bảng dưới đây cung cấp so sánh hiệu suất chi tiết giữa các mô hình YOLOv6-3.0 và YOLOv5 trên bộ dữ liệu COCO.
Mô hình | Kích thước (pixels) |
mAPval 50-95 |
Tốc độ CPU ONNX (ms) |
Tốc độ T4 TensorRT10 (ms) |
Tham số (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Từ dữ liệu, các mô hình YOLOv6-3.0 có xu hướng đạt được điểm mAP cao hơn cho các kích thước tương ứng của chúng trên GPU. Tuy nhiên, Ultralytics YOLOv5 thể hiện sự cân bằng vượt trội về hiệu suất, đặc biệt về tốc độ CPU và hiệu quả mô hình. Ví dụ: YOLOv5n nhanh hơn đáng kể trên CPU và có ít tham số và FLOP hơn bất kỳ mô hình YOLOv6-3.0 nào, khiến nó trở thành một lựa chọn tuyệt vời cho các ứng dụng thời gian thực, nhẹ. Mặc dù YOLOv6-3.0l có mAP cao nhất, nhưng YOLOv5x cung cấp mAP cạnh tranh với một khung được hỗ trợ và ghi chép đầy đủ.
Phương pháp Huấn luyện
Cả hai mô hình đều tận dụng các kỹ thuật học sâu tiêu chuẩn để huấn luyện trên các bộ dữ liệu lớn như COCO. Ultralytics YOLOv5 được hưởng lợi đáng kể từ hệ sinh thái Ultralytics, cung cấp quy trình huấn luyện được sắp xếp hợp lý, hướng dẫn mở rộng, tối ưu hóa AutoAnchor và tích hợp với các công cụ như Weights & Biases và ClearML để theo dõi thử nghiệm. Việc huấn luyện YOLOv6-3.0 tuân theo các quy trình được nêu trong kho lưu trữ của nó, có thể yêu cầu thiết lập thủ công nhiều hơn và thiếu các công cụ MLOps tích hợp của nền tảng Ultralytics.
Các trường hợp sử dụng lý tưởng
- Meituan YOLOv6-3.0: Một lựa chọn mạnh mẽ khi tối đa hóa độ chính xác trên GPU là mục tiêu chính, đồng thời vẫn yêu cầu suy luận nhanh. Nó phù hợp cho các ứng dụng mà những cải tiến nhỏ về mAP so với YOLOv5 có thể biện minh cho sự phức tạp gia tăng hoặc ít hỗ trợ hệ sinh thái hơn, chẳng hạn như trong tự động hóa công nghiệp chuyên dụng.
- Ultralytics YOLOv5: Rất được khuyến khích cho các ứng dụng đòi hỏi hiệu suất thời gian thực và dễ triển khai, đặc biệt là trên CPU hoặc các thiết bị biên. Tính linh hoạt, hỗ trợ mở rộng và sử dụng tài nguyên hiệu quả của nó làm cho nó lý tưởng để tạo mẫu nhanh, ứng dụng di động, giám sát video và các dự án được hưởng lợi từ một hệ sinh thái trưởng thành, được ghi chép đầy đủ.
Kết luận
Ultralytics YOLOv5 vẫn là một lựa chọn nổi bật, đặc biệt được đánh giá cao vì tốc độ vượt trội, tính dễ sử dụng và hệ sinh thái mạnh mẽ. Nó cung cấp sự cân bằng tuyệt vời giữa hiệu suất và hiệu quả, được hỗ trợ bởi tài liệu mở rộng và hỗ trợ cộng đồng, giúp các nhà phát triển và nhà nghiên cứu dễ dàng tiếp cận.
YOLOv6-3.0 cung cấp hiệu suất cạnh tranh, đặc biệt về mAP đỉnh cho các mô hình lớn hơn trên GPU. Nó đóng vai trò như một giải pháp thay thế khả thi cho những người dùng ưu tiên độ chính xác cao nhất có thể trong khuôn khổ YOLO, đặc biệt cho các ứng dụng công nghiệp.
Đối với những ai đang tìm kiếm những tiến bộ mới nhất, hãy cân nhắc khám phá các mô hình Ultralytics mới hơn như YOLOv8, YOLOv9, YOLOv10 và YOLO11, mang lại những cải tiến hơn nữa về hiệu suất, tính linh hoạt và hiệu quả. Các mô hình chuyên dụng như RT-DETR cũng cung cấp những lợi thế riêng cho các trường hợp sử dụng cụ thể.
Khám phá đầy đủ các tùy chọn trong Tài liệu về Mô hình Ultralytics.