Chuyển đến nội dung

YOLOv10 so với YOLOv6 -3.0: Cuộc đối đầu giữa các công nghệ phát hiện đối tượng thời gian thực thế hệ tiếp theo

Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng để đạt được thành công. Hai kiến ​​trúc nổi bật, YOLOv10YOLOv6 , đã có những bước tiến đáng kể trong việc cân bằng tốc độ và độ chính xác. Bài so sánh chi tiết này sẽ khám phá những cải tiến về kiến ​​trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng của chúng để giúp bạn quyết định mô hình nào phù hợp nhất với nhu cầu triển khai của mình.

Mặc dù cả hai mô hình đều cung cấp các giải pháp mạnh mẽ cho các ứng dụng công nghiệp và nghiên cứu, hệ sinh thái Ultralytics cung cấp một nền tảng thống nhất để đào tạo, xác thực và triển khai các kiến ​​trúc này một cách dễ dàng. Cho dù bạn đang xây dựng cơ sở hạ tầng thành phố thông minh hay tối ưu hóa dây chuyền sản xuất, việc hiểu rõ những điểm khác biệt tinh tế của các mô hình này là rất quan trọng.

So sánh Các chỉ số Hiệu suất

Bảng sau đây nêu bật hiệu suất của YOLOv10 Và YOLOv6 -3.0 trên nhiều thang đo mô hình khác nhau. Cả hai mô hình đều được đánh giá trên COCO tập dữ liệu, tập trung vào độ chính xác trung bình (Average Precision) mAP và độ trễ suy luận trên phần cứng tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10: Nhà đổi mới từ đầu đến cuối

YOLOv10 , được giới thiệu bởi các nhà nghiên cứu từ Đại học Thanh Hoa, đại diện cho một sự thay đổi mang tính đột phá trong... YOLO dòng dõi. Đặc điểm nổi bật nhất của nó là việc loại bỏ sự ức chế không tối đa (Non-Maximum Suppression) NMS Trong quá trình xử lý hậu kỳ, điều này đạt được thông qua chiến lược phân công kép nhất quán. Thiết kế này cho phép đào tạo và triển khai thực sự từ đầu đến cuối, giảm đáng kể sự biến động độ trễ trong các ứng dụng thực tế.

Các tính năng kiến trúc chính

  • NMS - Đào tạo miễn phí: Bằng cách sử dụng gán nhãn kép — một-nhiều để giám sát chi tiết và một-một để suy luận hiệu quả — YOLOv10 loại bỏ nút thắt cổ chai về mặt tính toán của NMS .
  • Thiết kế hiệu quả toàn diện: Kiến trúc này có đầu phân loại nhẹ và lấy mẫu giảm không gian-kênh tách rời, tối ưu hóa cả số lượng tham số và FLOPs.
  • Thiết kế khối dựa trên thứ hạng: Để giảm sự dư thừa, YOLOv10 Nó sử dụng thiết kế khối hướng dẫn theo thứ hạng, điều chỉnh độ phức tạp dựa trên giai đoạn của mạng.

Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Đại học Thanh Hoa
Ngày: 23 tháng 5 năm 2024
Liên kết: arXiv | GitHub | Tài liệu

Tìm hiểu thêm về YOLOv10

YOLOv6-3.0: Ông hoàng công nghiệp

YOLOv6 -3.0 , được phát triển bởi Meituan, tập trung mạnh vào các kịch bản ứng dụng công nghiệp, nơi mà hiệu suất trên phần cứng chuyên dụng (như GPU) là tối quan trọng. Nó giới thiệu bản cập nhật "Reloading", tinh chỉnh mạng để đạt được độ chính xác và hiệu suất lượng tử hóa tốt hơn.

Các tính năng kiến trúc chính

  • Ghép nối hai chiều (Bi-Directional Concatenation - BiC): Một mô-đun mới trong vùng cổ giúp cải thiện độ chính xác định vị bằng cách kết hợp tốt hơn các đặc điểm từ các tỷ lệ khác nhau.
  • Huấn luyện hỗ trợ neo (Anchor-Aided Training - AAT): Chiến lược này cho phép mô hình hưởng lợi từ sự ổn định tối ưu hóa dựa trên neo trong khi vẫn duy trì kiến ​​trúc không có neo cho quá trình suy luận.
  • Thân thiện với lượng tử hóa: Kiến trúc này được thiết kế đặc biệt để giảm thiểu sự suy giảm độ chính xác khi lượng tử hóa thành INT8, lý tưởng cho các thiết bị biên sử dụng TensorRT .

Tác giả: Chuyi Li, Lulu Li, Yifei Geng, et al.
Tổ chức: Meituan
Ngày: 13 tháng 1 năm 2023
Liên kết: arXiv | GitHub | Tài liệu

Tìm hiểu thêm về YOLOv6

Phân tích So sánh

1. Độ trễ và hiệu quả

YOLOv10 thường có hiệu suất vượt trội YOLOv6 -3.0 về hiệu quả tham số và FLOPs. Ví dụ, mô hình YOLOv10s đạt được mức cao hơn. mAP (46,3% so với 45,0%) với số lượng tham số ít hơn đáng kể (7,2 triệu so với 18,5 triệu) so với YOLOv6 -3.0s . Việc loại bỏ NMS TRONG YOLOv10 góp phần làm giảm độ trễ và giúp dự đoán độ trễ tốt hơn, đặc biệt là trên các CPU có chi phí xử lý hậu kỳ đáng kể. Ngược lại, YOLOv6 -3.0 được tối ưu hóa cao cho GPU Thông lượng, thường thể hiện ưu thế về tốc độ vượt trội trong các kịch bản xử lý hàng loạt trên GPU T4.

2. Triển khai và Dễ sử dụng

Cả hai mô hình đều được hỗ trợ bởi hệ sinh thái Ultralytics , đảm bảo các nhà phát triển có thể truy cập chúng thông qua một API thống nhất. Tuy nhiên, YOLOv10 Tính chất khép kín từ đầu đến cuối của nó giúp đơn giản hóa quy trình xuất sang các định dạng như ONNX và CoreML vì không cần phải thêm phần phức tạp NMS các thao tác đối với đồ thị mô hình.

Mẹo triển khai

Khi triển khai trên các thiết bị biên như Raspberry Pi hoặc NVIDIA Jetson, YOLOv10 số lượng tham số thấp hơn của 's và NMS Thiết kế không dùng bộ nhớ thường giúp tiết kiệm bộ nhớ hơn và thời gian khởi động nhanh hơn so với các kiến ​​trúc cũ.

3. Phương pháp đào tạo

YOLOv6 -3.0 dựa vào các kỹ thuật như tự chưng cất và huấn luyện hỗ trợ neo để tăng hiệu suất, điều này có thể làm tăng thời gian huấn luyện và mức sử dụng bộ nhớ. YOLOv10 Giới thiệu các nhiệm vụ kép nhất quán, giúp đơn giản hóa việc tính toán tổn thất và hội tụ hiệu quả. Người dùng tận dụng Nền tảng Ultralytics Nhờ vào sự trừu tượng hóa, người dùng có thể huấn luyện cả hai mô hình mà không cần lo lắng về những phức tạp nội bộ này. model.train() giao diện.

Lợi thế của Ultralytics

Chọn một mô hình trong số Ultralytics Hệ sinh thái đảm bảo trải nghiệm "từ con số không đến chuyên gia". Không giống như các kho lưu trữ độc lập có thể thiếu tài liệu hoặc không được bảo trì, Ultralytics Các mô hình được hưởng lợi từ:

  • API thống nhất: Chuyển đổi giữa YOLOv10 , YOLOv6 và những cách khác bằng cách thay đổi một chuỗi ký tự duy nhất trong mã của bạn.
  • Tính linh hoạt trong công việc: Trong khi YOLOv10 Và YOLOv6 chủ yếu là các thiết bị dò, Ultralytics Nó hỗ trợ ước lượng tư thế , phân đoạn đối tượngphân loại trên các mô hình cốt lõi của mình.
  • Xuất dữ liệu mạnh mẽ: Xuất mô hình liền mạch sang TensorRT , OpenVINO , Và TFLite để triển khai sản xuất.
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Đảm bảo tương lai với YOLO26

Trong khi YOLOv10 Và YOLOv6 -3.0 là những lựa chọn tuyệt vời, lĩnh vực này vẫn tiếp tục phát triển. Đối với các nhà phát triển đang tìm kiếm công nghệ tiên tiến nhất, YOLO26 được xây dựng dựa trên nền tảng đó. NMS - bước đột phá miễn phí của YOLOv10 nhưng mang đến những cải tiến quan trọng cho phần cứng năm 2026.

Tại sao nên nâng cấp lên YOLO26?

  • Ứng dụng gốc từ đầu đến cuối: Giống như YOLOv10 YOLO26 là NMS -miễn phí, đảm bảo quy trình triển khai đơn giản nhất.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM, bộ tối ưu hóa lai này đảm bảo sự hội tụ ổn định và giảm thiểu nhu cầu tinh chỉnh siêu tham số phức tạp.
  • Thiết kế ưu tiên xử lý biên: Với việc loại bỏ hiện tượng suy hao tiêu điểm phân tán (DFL) và tối ưu hóa các khối, YOLO26 cung cấp khả năng suy luận CPU nhanh hơn tới 43% , trở thành lựa chọn vượt trội cho các ứng dụng di động và IoT.
  • Tính đặc thù của nhiệm vụ: Không giống như các phiên bản trước, YOLO26 bao gồm các hàm mất mát chuyên dụng như ProgLoss và STAL, giúp tăng cường khả năng phát hiện vật thể nhỏ và cung cấp hỗ trợ gốc cho các tác vụ OBB và Pose.

Tìm hiểu thêm về YOLO26

Kết luận

YOLOv10 là lựa chọn được khuyến nghị cho người dùng ưu tiên hiệu quả tham số và quy trình triển khai đơn giản, từ đầu đến cuối. Khả năng cung cấp độ chính xác cao với số phép tính FLOPs ít hơn khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực trên nhiều loại phần cứng khác nhau.

YOLOv6 -3.0 vẫn là một ứng cử viên mạnh mẽ cho môi trường công nghiệp với các thiết bị chuyên dụng. GPU cơ sở hạ tầng, nơi có những tối ưu hóa cụ thể cho TensorRT Việc lượng tử hóa có thể được tận dụng tối đa.

Đối với những ai yêu cầu hiệu năng đỉnh cao, tính linh hoạt trong nhiều tác vụ (Phân đoạn, Tư thế, OBB) và khả năng hỗ trợ trong tương lai, YOLO26 là sự lựa chọn tối ưu nhất. Ultralytics .

Đọc thêm


Bình luận