YOLOv10 so với YOLOv8 Những tiến bộ trong kiến trúc phát hiện đối tượng thời gian thực
Lĩnh vực phát hiện đối tượng thời gian thực liên tục phát triển, với các kiến trúc mới liên tục đẩy mạnh giới hạn về tốc độ, độ chính xác và hiệu quả. Bài so sánh kỹ thuật này đi sâu vào YOLOv10 , một bước đột phá trong giới học thuật tập trung vào việc loại bỏ hiện tượng triệt tiêu cực đại cục bộ (non-maximum suppression). NMS ), và Ultralytics YOLOv8 , khung phần mềm mạnh mẽ theo tiêu chuẩn ngành được thiết kế cho nhiều nhiệm vụ xử lý hình ảnh khác nhau.
Bằng cách phân tích sự khác biệt về kiến trúc, các chỉ số hiệu năng và phương pháp huấn luyện của chúng, các nhà phát triển có thể đưa ra quyết định sáng suốt khi lựa chọn mô hình cho các ứng dụng thị giác máy tính , từ triển khai tại biên đến suy luận đám mây hiệu suất cao.
So sánh Các chỉ số Hiệu suất
Bảng sau đây trình bày so sánh chi tiết các chỉ số hiệu suất chính. Lưu ý rằng YOLOv10 Đạt được độ trễ cạnh tranh bằng cách loại bỏ NMS bước xử lý hậu kỳ, trong khi YOLOv8 Duy trì cấu hình cân bằng, phù hợp với nhiều nhiệm vụ hơn là chỉ phát hiện.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10: Tiên phong End-to-End
YOLOv10 được các nhà nghiên cứu từ Đại học Thanh Hoa giới thiệu với mục tiêu chính là loại bỏ sự phụ thuộc vào phương pháp loại bỏ tối đa không đồng nhất (Non-Maximum Suppression). NMS ) trong quá trình xử lý hậu kỳ. Truyền thống YOLO các mô hình dự đoán nhiều hộp giới hạn cho một đối tượng duy nhất và dựa vào NMS để lọc bỏ các mục trùng lặp. YOLOv10 Mô hình sử dụng chiến lược phân công kép nhất quán trong quá trình huấn luyện, cho phép dự đoán trực tiếp một hộp tối ưu nhất cho mỗi đối tượng.
Kiến trúc và Đổi mới
- NMS - Đào tạo miễn phí: Bằng cách sử dụng gán nhãn kép — một-nhiều để giám sát chi tiết và một-một để suy luận hiệu quả — YOLOv10 loại bỏ độ trễ suy luận gây ra bởi NMS .
- Thiết kế hiệu quả toàn diện: Kiến trúc này bao gồm các đầu phân loại nhẹ và lấy mẫu giảm độ phân giải tách rời kênh không gian để giảm chi phí tính toán (FLOPs) mà không làm giảm độ chính xác .
- Tích chập nhân lớn: Việc sử dụng có mục tiêu các tích chập theo chiều sâu với nhân lớn giúp cải thiện trường tiếp nhận, hỗ trợ phát hiện các vật thể nhỏ.
Siêu dữ liệu:
- Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
- Tổ chức:Đại học Thanh Hoa
- Ngày: 2024-05-23
- Arxiv:arXiv:2405.14458
- GitHub:THU-MIG/yolov10
Ultralytics YOLOv8 Tiêu chuẩn ngành mạnh mẽ
Ultralytics YOLOv8 là một framework hoàn thiện, sẵn sàng cho môi trường sản xuất, được thiết kế để linh hoạt và dễ sử dụng. Mặc dù nó sử dụng các công nghệ tiêu chuẩn. NMS Với kiến trúc được tối ưu hóa cao và khả năng tích hợp vào hệ sinh thái Ultralytics , nó trở thành lựa chọn ưu tiên cho các nhà phát triển cần sự ổn định, hỗ trợ đa nhiệm và triển khai liền mạch.
Điểm mạnh chính về kiến trúc
- Khung thống nhất: Không giống như nhiều mô hình học thuật bị giới hạn ở khả năng phát hiện, YOLOv8 Hỗ trợ đầy đủ các chức năng phân đoạn đối tượng , ước lượng tư thế , OBB và phân loại trong cùng một mã nguồn.
- Phát hiện không cần neo: Loại bỏ các phương pháp dựa trên neo để trực tiếp dự đoán tâm đối tượng, đơn giản hóa quy trình huấn luyện và cải thiện khả năng khái quát hóa trên các tập dữ liệu khác nhau.
- Tăng cường khả năng ghép ảnh: Công nghệ tăng cường dữ liệu tức thời tiên tiến giúp tăng cường khả năng chống lại hiện tượng che khuất và điều kiện ánh sáng thay đổi.
- Hệ sinh thái được tối ưu hóa: Người dùng được hưởng lợi từ Nền tảng Ultralytics (trước đây là HUB) để quản lý tập dữ liệu, huấn luyện mô hình và xuất dữ liệu chỉ bằng một cú nhấp chuột sang các định dạng như... TensorRT , CoreML , Và ONNX .
Siêu dữ liệu:
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2023-01-10
- GitHub:ultralytics/ultralytics
- Tài liệu:Tài liệu YOLOv8
Tương lai của phát hiện từ đầu đến cuối
Trong khi YOLOv10 tiên phong NMS - Phát hiện lỗ hổng miễn phí, YOLO26 mới ra mắt được xây dựng dựa trên nền tảng này. YOLO26 là phần mềm mã nguồn mở hoàn chỉnh, loại bỏ NMS và Distribution Focal Loss (DFL) giúp tăng tốc độ suy luận CPU lên đến 43% . Nó tích hợp trình tối ưu hóa MuSGD và các chức năng ProgLoss, mang lại độ ổn định vượt trội và khả năng phát hiện vật thể nhỏ tốt hơn so với cả hai phương pháp kia. YOLOv8 Và YOLOv10 .
Các trường hợp sử dụng và Ứng dụng thực tế
Việc lựa chọn giữa các mô hình này thường phụ thuộc vào những ràng buộc cụ thể của môi trường triển khai.
Các kịch bản lý tưởng cho YOLOv10
YOLOv10 Nó đặc biệt phù hợp cho các ứng dụng mà độ trễ xử lý hậu kỳ là một trở ngại.
- Phân tích cảnh đông đúc: Trong các tình huống có nhiều cụm đối tượng dày đặc, chẳng hạn như phát hiện người đi bộ , việc loại bỏ NMS Ngăn chặn việc "bỏ sót" các phát hiện hợp lệ có sự chồng chéo đáng kể.
- Các thiết bị biên công suất thấp: Số lượng phép tính FLOPs và tham số giảm giúp triển khai trên các thiết bị có khả năng tính toán hạn chế, chẳng hạn như Raspberry Pi hoặc Jetson Nano , nơi mỗi mili giây xử lý đều rất quan trọng.
Các kịch bản lý tưởng cho Ultralytics YOLOv8
YOLOv8 Đây vẫn là lựa chọn tối ưu cho các giải pháp AI toàn diện đòi hỏi độ tin cậy và khả năng xử lý đa nhiệm.
- Kiểm tra công nghiệp phức tạp: Khả năng phân đoạn cho phép khoanh vùng khuyết tật chính xác hơn thay vì chỉ là các khung bao đơn giản, điều này rất quan trọng đối với việc kiểm soát chất lượng trong sản xuất.
- Phân tích thể thao: Với hỗ trợ ước tính tư thế gốc, YOLOv8 Có thể track Các chuyển động của người chơi và các điểm mấu chốt về cấu trúc xương để phân tích sinh cơ học.
- Phân tích bán lẻ: Khả năng theo dõi đối tượng mạnh mẽ được tích hợp vào... Ultralytics API giúp nó trở nên lý tưởng để theo dõi lưu lượng khách hàng và hàng tồn kho.
Dễ sử dụng và hệ sinh thái
Một trong những ưu điểm quan trọng nhất của việc lựa chọn một Ultralytics mô hình như YOLOv8 (hoặc mẫu YOLO26 mới hơn) là hệ sinh thái xung quanh.
API Python đơn giản: Các nhà phát triển có thể tải, huấn luyện và triển khai mô hình chỉ với một vài dòng mã.
from ultralytics import YOLO # Load a model model = YOLO("yolov8n.pt") # Train model.train(data="coco8.yaml", epochs=100)Tài liệu hướng dẫn chi tiết: Tài liệu của Ultralytics cung cấp hướng dẫn đầy đủ về mọi thứ, từ tinh chỉnh siêu tham số đến xuất mô hình . iOS Và Android .
- Hiệu quả bộ nhớ: Ultralytics các mô hình được tối ưu hóa cho mức thấp hơn CUDA Mức sử dụng bộ nhớ trong quá trình huấn luyện so với nhiều phương pháp thay thế dựa trên Transformer như RT-DETR , cho phép kích thước batch lớn hơn trên các GPU tiêu chuẩn dành cho người tiêu dùng.
Kết luận
Cả hai kiến trúc đều có những ưu điểm riêng biệt. YOLOv10 là một đóng góp học thuật xuất sắc, thể hiện tiềm năng của... NMS - Phát hiện không cần bảo mật, mang lại hiệu quả cao cho các tác vụ chỉ phát hiện cụ thể.
Ultralytics YOLOv8 nổi bật như một lựa chọn đa năng, toàn diện, được hỗ trợ bởi một hệ sinh thái được duy trì giúp đơn giản hóa toàn bộ vòng đời học máy. Nó vẫn là một trong những lựa chọn hàng đầu được khuyến nghị cho các nhà phát triển cần nhanh chóng chuyển từ giai đoạn nguyên mẫu sang sản phẩm hoàn chỉnh cho nhiều tác vụ khác nhau, bao gồm phân đoạn và ước tính tư thế.
Đối với những ai tìm kiếm hiệu năng tiên tiến nhất, YOLO26 là sự lựa chọn tối ưu. Nó kết hợp mọi yếu tố từ đầu đến cuối, NMS - Các lợi ích miễn phí được tiên phong bởi YOLOv10 với độ bền bỉ, khả năng hỗ trợ đa nhiệm và tính dễ sử dụng của Ultralytics Hệ sinh thái. Với những cải tiến như bộ tối ưu hóa MuSGD và các hàm mất mát được nâng cao, YOLO26 mang đến sự cân bằng tối ưu giữa tốc độ và độ chính xác cho năm 2026.
Đọc thêm
- Khám phá mẫu SOTA mới nhất: YOLO26
- Tìm hiểu về bộ chuyển đổi thời gian thực: RT-DETR
- Hiểu rõ các chỉ số: Giải thích về mAP và IoU
- Hướng dẫn đào tạo hiệu quả: Mẹo đào tạo mẫu