YOLOv5 so với YOLOv10 So sánh kỹ thuật giữa các thiết bị phát hiện vật thể thời gian thực
Sự tiến hóa của câu nói "Bạn chỉ nhìn một lần thôi" ( YOLO Kiến trúc YOLO (System-on-Data Screening) đã trở thành một câu chuyện định hình trong lịch sử thị giác máy tính. Hai cột mốc quan trọng trong dòng thời gian này là YOLOv5 , tiêu chuẩn ngành về độ tin cậy và dễ sử dụng, và YOLOv10 , một bước đột phá trong giới học thuật tập trung vào việc loại bỏ các nút thắt cổ chai trong quá trình xử lý hậu kỳ. Hướng dẫn này cung cấp một so sánh kỹ thuật chi tiết để giúp các nhà phát triển lựa chọn công cụ phù hợp cho ứng dụng của họ, đồng thời khám phá cách YOLO26 mới nhất kết hợp những điểm mạnh của cả hai.
Nguồn gốc và thông số kỹ thuật của mô hình
Trước khi đi sâu vào các chỉ số hiệu suất, điều cần thiết là phải hiểu rõ bối cảnh của từng mô hình.
YOLOv5
Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 26/06/2020
GitHub: ultralytics / yolov5
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv5
YOLOv10
Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Ngày: 23/05/2024
Arxiv: arXiv:2405.14458
GitHub: THU-MIG/yolov10
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv10
Phân tích hiệu suất
Bảng sau đây so sánh các mô hình trên tập dữ liệu COCO , một chuẩn mực thông dụng cho việc phát hiện đối tượng .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv10 Nhìn chung, nó đạt được độ chính xác trung bình ( mAP ) cao hơn với ít tham số hơn, làm nổi bật những lợi ích về hiệu quả từ kiến trúc mới hơn của nó. Tuy nhiên, YOLOv5 vẫn duy trì khả năng cạnh tranh trong GPU Tốc độ suy luận, đặc biệt là trên phần cứng cũ, nhờ vào khả năng tối ưu hóa cao của nó. CUDA các triển khai.
Kiến trúc và Thiết kế
YOLOv5 Tiêu chuẩn đáng tin cậy
YOLOv5 Mạng này được xây dựng trên nền tảng CSPNet đã được sửa đổi và phần cổ PANet. Nó sử dụng các đầu phát hiện dựa trên neo tiêu chuẩn, yêu cầu loại bỏ các hộp giới hạn trùng lặp (Non-Maximum Suppression - NMS ) trong quá trình xử lý hậu kỳ.
- Điểm mạnh: Mã nguồn cực kỳ hoàn thiện, được hỗ trợ rộng rãi bởi các công cụ của bên thứ ba và triển khai ổn định trên các thiết bị biên như Raspberry Pi .
- Điểm yếu: Phụ thuộc vào NMS Điều này có thể gây ra sự thay đổi về độ trễ tùy thuộc vào số lượng đối tượng trong cảnh.
YOLOv10 : Cái NMS -Free Pioneer
YOLOv10 đã giới thiệu một sự thay đổi mô hình bằng cách sử dụng Phân công kép nhất quán cho NMS - huấn luyện miễn phí. Điều này cho phép mô hình dự đoán chính xác một hộp cho mỗi đối tượng, loại bỏ sự cần thiết phải NMS các bước suy luận.
- Ưu điểm: Độ trễ suy luận thấp hơn trong các cảnh có mật độ điểm ảnh cao nhờ vào... NMS việc loại bỏ; thiết kế khối hướng dẫn theo thứ hạng hiệu quả giúp giảm sự dư thừa tính toán.
- Điểm yếu: Kiến trúc mới hơn có thể yêu cầu các thiết lập xuất cụ thể cho một số trình biên dịch; sự hỗ trợ từ cộng đồng ít hơn so với phiên bản 5.
Nút thắt NMS
Không ức chế tối đa ( NMS (Đây là bước xử lý hậu kỳ nhằm lọc các hộp giới hạn chồng chéo. Mặc dù hiệu quả, nhưng nó là một bước tuần tự và tốn nhiều tài nguyên tính toán trên CPU. Việc loại bỏ nó, như đã thực hiện trong...) YOLOv10 và YOLO26 , rất quan trọng đối với các ứng dụng thời gian thực trên phần cứng biên.
Hệ sinh thái và Dễ sử dụng
Một trong những yếu tố quan trọng nhất đối với các nhà phát triển là hệ sinh thái xung quanh mô hình. Đây là điểm khác biệt rõ rệt giữa kho lưu trữ nghiên cứu và nền tảng sản xuất.
Lợi thế của Ultralytics
Cả hai mô hình đều có thể được chạy thông qua ultralytics Python gói phần mềm này cung cấp cho họ quyền truy cập vào một bộ công cụ mạnh mẽ.
- Nền tảng Ultralytics : Người dùng có thể quản lý tập dữ liệu, huấn luyện trên đám mây và triển khai mô hình một cách liền mạch bằng cách sử dụng Nền tảng Ultralytics .
- Hiệu quả đào tạo: Ultralytics Các mô hình được tối ưu hóa về hiệu quả bộ nhớ trong quá trình huấn luyện, thường yêu cầu lượng VRAM ít hơn đáng kể so với các mô hình thay thế dựa trên transformer.
- Tính linh hoạt: Trong khi YOLOv10 chủ yếu là một mô hình phát hiện, Ultralytics Hệ sinh thái này hỗ trợ Phân đoạn ảnh , Ước tính tư thế và Phát hiện đối tượng định hướng (OBB) trên các mô hình cốt lõi của nó.
Ví dụ mã
Việc chuyển đổi giữa các mô hình rất đơn giản, chỉ cần thay đổi chuỗi tên mô hình.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)
# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")
Các trường hợp sử dụng lý tưởng
Khi nào nên chọn YOLOv5
- Hệ thống cũ: Nếu bạn có một quy trình hiện có được xây dựng dựa trên... YOLOv5 định dạng xuất khẩu.
- Khả năng tương thích rộng nhất: Dành cho việc triển khai trên các hệ thống nhúng cũ hơn, nơi mà các nhà điều hành mới hơn có thể chưa được hỗ trợ.
- Tài nguyên cộng đồng: Khi bạn cần truy cập vào hàng ngàn hướng dẫn và tích hợp của bên thứ ba được tạo ra trong năm năm qua.
Khi nào nên chọn YOLOv10
- Phát hiện mật độ cao: Các kịch bản như đếm đám đông hoặc phân tích giao thông, trong đó... NMS Làm chậm quá trình xử lý.
- Các ràng buộc độ trễ nghiêm ngặt: Robot thời gian thực hoặc lái xe tự hành, nơi mà mỗi mili giây độ trễ suy luận đều rất quan trọng.
- Nghiên cứu: Thử nghiệm các tiến bộ mới nhất trong chiến lược phân bổ và tối ưu hóa kiến trúc hệ thống.
Gợi ý tuyệt vời nhất: YOLO26
Trong khi YOLOv5 mang lại sự ổn định và YOLOv10 ưu đãi NMS - Với khả năng suy luận không cần dữ liệu, Ultralytics YOLO26 mới ra mắt kết hợp những ưu điểm này vào một khung phần mềm duy nhất, vượt trội.
Tại sao nên nâng cấp lên YOLO26? YOLO26 là hệ thống end-to-end hoàn chỉnh, áp dụng thiết kế không cần NMS tiên phong bởi... YOLOv10 nhưng nâng cao nó với sức mạnh Ultralytics quy trình đào tạo.
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM (cụ thể là Kimi K2 của Moonshot AI), bộ tối ưu hóa này đảm bảo sự hội tụ ổn định và tốc độ huấn luyện nhanh hơn.
- Hiệu năng: Được tối ưu hóa cho điện toán biên, mang lại khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ trước.
- Độ chính xác: Tích hợp ProgLoss và STAL (Semantic-Token Alignment Loss), cải thiện đáng kể khả năng phát hiện vật thể nhỏ, vốn thường là điểm yếu trong các mô hình trước đây.
- Tính linh hoạt toàn diện: Không giống như YOLOv10 Tập trung vào khả năng phát hiện, YOLO26 cung cấp các mô hình tiên tiến nhất cho việc phân đoạn , nhận diện tư thế , phân loại và OBB .
Đối với bất kỳ dự án mới nào bắt đầu vào năm 2026, YOLO26 là lựa chọn được khuyến nghị, cung cấp con đường dễ dàng nhất từ việc chú thích tập dữ liệu đến xuất mô hình .
Kết luận
Cả hai YOLOv5 Và YOLOv10 Chúng đại diện cho những thời điểm then chốt trong lĩnh vực thị giác máy tính. YOLOv5 đã dân chủ hóa AI bằng cách làm cho nó dễ tiếp cận và đáng tin cậy, trong khi YOLOv10 đã đẩy mạnh các giới hạn kỹ thuật của quá trình xử lý đầu cuối. Tuy nhiên, lĩnh vực này phát triển rất nhanh. Với sự ra mắt của YOLO26 , các nhà phát triển không còn cần phải lựa chọn giữa độ tin cậy của... Ultralytics hệ sinh thái và tốc độ của NMS - Kiến trúc không cần giấy phép—YOLO26 cung cấp cả hai.
Đối với các giải pháp thay thế hiện đại khác, bạn cũng có thể xem xét khám phá YOLO11 cho các tác vụ thị giác đa năng hoặc Real-Time DETR ( RT-DETR ) cho việc phát hiện dựa trên bộ chuyển đổi.