YOLO26 so với... YOLOv6 -3.0: Sự tiến hóa của phát hiện đối tượng thời gian thực
Lĩnh vực thị giác máy tính đã thay đổi đáng kể từ năm 2023 đến năm 2026. Trong khi YOLOv6 -3.0 đã thiết lập những tiêu chuẩn quan trọng cho các ứng dụng công nghiệp khi ra mắt, Ultralytics YOLO26 lại đại diện cho một bước tiến vượt bậc về kiến trúc, hiệu quả và tính dễ sử dụng. Bài so sánh toàn diện này sẽ xem xét hai mô hình này như thế nào về sự đổi mới kiến trúc, các chỉ số hiệu năng và khả năng ứng dụng thực tế.
Tóm tắt điều hành
YOLOv6 -3.0 , được Meituan phát hành vào đầu năm 2023, được thiết kế với trọng tâm chính là triển khai trong môi trường công nghiệp, đặc biệt là tối ưu hóa cho... GPU thông lượng sử dụng TensorRT Nó giới thiệu khái niệm "Tái nạp" với các chiến lược lượng tử hóa và chưng cất được cải tiến.
YOLO26 , phát hành bởi Ultralytics Vào tháng 1 năm 2026, phiên bản này giới thiệu một sự thay đổi cơ bản với thiết kế không sử dụng NMS từ đầu đến cuối , lần đầu tiên được tiên phong trong YOLOv10 . Bằng cách loại bỏ Non-Maximum Suppression ( NMS Với các tính năng như ) và Distribution Focal Loss (DFL), YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% , trở thành lựa chọn hàng đầu cho điện toán biên, triển khai di động và robot thời gian thực. GPU Nguồn lực có thể bị hạn chế.
Thông số kỹ thuật và hiệu năng
Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa hai dòng mô hình. YOLO26 thể hiện độ chính xác vượt trội ( mAP ) trên mọi quy mô đồng thời duy trì tốc độ vượt trội, đặc biệt là trên CPU Suy luận dựa trên kiến trúc, nơi mà các tối ưu hóa kiến trúc phát huy hiệu quả.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Đổi mới kiến trúc
Ultralytics YOLO26
YOLO26 giới thiệu một số tính năng đột phá giúp định nghĩa lại hiệu quả:
- NMS từ đầu đến cuối - Miễn phí: Dự đoán trực tiếp các đối tượng mà không cần xử lý hậu kỳ. NMS YOLO26 đơn giản hóa quy trình triển khai và giảm sự biến động về độ trễ, một yếu tố quan trọng đối với các hệ thống an toàn thiết yếu như xe tự hành .
- Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Mô hình Ngôn ngữ Lớn (LLM) (cụ thể là Kimi K2 của Moonshot AI), bộ tối ưu hóa lai này kết hợp SGD và Muon để đảm bảo quá trình huấn luyện ổn định và hội tụ nhanh hơn, ngay cả với kích thước lô nhỏ hơn.
- Loại bỏ DFL: Việc loại bỏ Suy hao tiêu điểm phân tán giúp đơn giản hóa kiến trúc mô hình, giúp việc xuất sang các định dạng như ONNX và... CoreML Hiệu quả hơn đáng kể đối với các thiết bị biên.
- ProgLoss + STAL: Các hàm mất mát mới cải thiện khả năng phát hiện vật thể nhỏ, khắc phục điểm yếu thường gặp ở các thế hệ trước và mang lại lợi ích cho các ứng dụng như giám sát trên không và hình ảnh y tế .
YOLOv6-3.0
YOLOv6 - Phiên bản 3.0 tập trung vào việc tối ưu hóa kiến trúc xương sống kiểu RepVGG để đạt hiệu quả phần cứng cao nhất:
- Ghép nối hai chiều (Bi-Directional Concatenation - BiC): Được sử dụng trong vùng cổ để cải thiện khả năng kết hợp các đặc điểm.
- Huấn luyện có hỗ trợ neo (Anchor-Aided Training - AAT): Một chiến lược ổn định quá trình huấn luyện bằng cách sử dụng các neo trong giai đoạn khởi động trước khi chuyển sang suy luận không có neo.
- Tự chưng cất: Một tính năng tiêu chuẩn trong phiên bản 3.0, trong đó mô hình học hỏi từ chính các dự đoán của nó để nâng cao độ chính xác mà không làm tăng chi phí suy luận.
Điểm khác biệt chính: Xử lý hậu kỳ
YOLOv6 dựa trên NMS (Loại bỏ các giá trị cực đại không trùng lặp) để lọc các hộp chồng chéo. Bước này thường chậm trên CPU và yêu cầu điều chỉnh tham số cẩn thận.
YOLO26 không sử dụng NMS , nghĩa là đầu ra thô của mô hình chính là danh sách phát hiện cuối cùng. Điều này giúp giảm độ trễ và tăng tốc độ thực thi. CPU - các thiết bị ràng buộc như Raspberry Pi.
Huấn luyện và Khả năng sử dụng
Trải nghiệm Ultralytics
Một trong những ưu điểm quan trọng nhất của YOLO26 là khả năng tích hợp vào hệ sinh thái Ultralytics . Các nhà phát triển được hưởng lợi từ API thống nhất hỗ trợ phát hiện, phân đoạn, ước tính tư thế và phân loại một cách liền mạch.
- Dễ sử dụng: Chỉ vài dòng lệnh Python Mã nguồn đủ để tải, huấn luyện và triển khai mô hình.
- Tích hợp nền tảng: Hỗ trợ gốc cho Nền tảng Ultralytics cho phép đào tạo dựa trên đám mây, quản lý tập dữ liệu và tự động chú thích.
- Hiệu quả bộ nhớ: YOLO26 được tối ưu hóa để chạy trên phần cứng dành cho người tiêu dùng, yêu cầu ít bộ nhớ hơn đáng kể. CUDA có bộ nhớ tốt hơn so với các giải pháp thay thế dựa trên bộ biến đổi như RT-DETR .
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with the MuSGD optimizer (auto-configured)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX - NMS-free by default
path = model.export(format="onnx")
YOLOv6 Quy trình làm việc
YOLOv6 Nó hoạt động như một kho lưu trữ nghiên cứu truyền thống hơn. Mặc dù mạnh mẽ, nhưng nó yêu cầu người dùng phải sao chép kho lưu trữ GitHub cụ thể, quản lý các phụ thuộc theo cách thủ công và chạy quá trình huấn luyện thông qua các tập lệnh shell phức tạp. Nó thiếu tính thống nhất. Python Cấu trúc gói và hỗ trợ nhiều tác vụ khác nhau (như OBB gốc hoặc Pose) được tìm thấy trong Ultralytics khung.
Các trường hợp sử dụng và tính linh hoạt
Các kịch bản lý tưởng cho YOLO26
- AI và IoT tại biên: Tăng trưởng 43% CPU Tốc độ và khả năng loại bỏ DFL (Dynamic Level Function) khiến YOLO26 trở thành lựa chọn tốt nhất trong phân khúc dành cho các thiết bị như Raspberry Pi. NVIDIA Jetson Nano và điện thoại di động.
- Robot học: Thiết kế toàn diện cung cấp đầu ra có độ trễ thấp và mang tính xác định, rất cần thiết cho việc điều hướng robot .
- Ứng dụng đa nhiệm: Với sự hỗ trợ cho phân đoạn , ước lượng tư thế và OBB , một khung phần mềm duy nhất có thể xử lý các quy trình phức tạp, chẳng hạn như phân tích chuyển động của người chơi trong thể thao hoặc kiểm tra các kiện hàng bất thường trong lĩnh vực hậu cần.
Các kịch bản lý tưởng cho YOLOv6-3.0
- Hệ thống GPU cũ: Dành cho các quy trình công nghiệp hiện có đã được tối ưu hóa cao. TensorRT 7 hoặc 8 trên phần cứng cũ hơn (như GPU T4), YOLOv6 vẫn là một lựa chọn ổn định.
- Nhiệm vụ phát hiện thuần túy: Trong các kịch bản chỉ giới hạn nghiêm ngặt ở việc phát hiện hộp giới hạn, nơi cơ sở hạ tầng đã được xây dựng sẵn cho việc đó. YOLOv6 mã nguồn.
Kết luận
Mặc dù YOLOv6 -3.0 là một đối thủ đáng gờm vào năm 2023, Ultralytics YOLO26 mang đến một bản nâng cấp toàn diện cho năm 2026 và những năm tiếp theo. Bằng cách giải quyết các vấn đề... NMS Bằng cách khắc phục các điểm nghẽn, giảm độ phức tạp của mô hình khi xuất khẩu và tích hợp các tính năng nâng cao như trình tối ưu hóa MuSGD, YOLO26 mang lại hiệu suất vượt trội với mức độ phức tạp khi triển khai thấp hơn nhiều.
Đối với các nhà phát triển đang tìm kiếm một giải pháp có khả năng đáp ứng nhu cầu trong tương lai, cân bằng giữa độ chính xác hiện đại và sự dễ dàng của quy trình làm việc "từ con số không đến chuyên gia", YOLO26 là lựa chọn được khuyến nghị.
Đọc thêm
Khám phá các mẫu khác trong Ultralytics Gia đình chúng tôi sẽ tìm ra giải pháp hoàn hảo phù hợp với nhu cầu cụ thể của bạn:
- YOLO11 : Phiên bản tiền nhiệm mạnh mẽ của YOLO26, nổi tiếng với hiệu năng đa dụng tuyệt vời.
- YOLOv10 : Tiên phong trong kiến trúc đầu cuối, mở đường cho YOLO26.
- YOLO -World : Lý tưởng cho việc phát hiện từ vựng mở, nơi bạn cần... detect Các đối tượng không có trong tập dữ liệu huấn luyện.
Chi tiết so sánh
YOLO26
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2026-01-14
- Tài liệu:Tài liệu YOLO26
YOLOv6-3.0
- Tác giả: Chuyi Li, Lulu Li, Yifei Geng, et al.
- Tổ chức: Meituan
- Ngày: 2023-01-13
- Arxiv:YOLOv6 v3.0: A Full-Scale Reloading
- GitHub: Meituan YOLOv6