Ultralytics YOLO26
Sắp ra mắt ⚠️
🚧 Các mô hình YOLO26 vẫn đang trong quá trình phát triển và chưa được phát hành. Các số liệu hiệu suất được hiển thị ở đây chỉ là bản xem trước. Các bản tải xuống và phát hành cuối cùng sẽ sớm được công bố — hãy cập nhật thông tin qua YOLO Vision 2025.
Tổng quan
Ultralytics YOLO26 là một bước tiến mới nhất trong dòng YOLO về công cụ phát hiện đối tượng theo thời gian thực, được thiết kế từ đầu cho các thiết bị biên và thiết bị có công suất thấp. Nó giới thiệu một thiết kế tinh gọn, loại bỏ sự phức tạp không cần thiết, đồng thời tích hợp các cải tiến có mục tiêu để mang lại khả năng triển khai nhanh hơn, nhẹ hơn và dễ tiếp cận hơn.
Kiến trúc của YOLO26 được định hướng bởi ba nguyên tắc cốt lõi:
- Đơn giản: YOLO26 là một mô hình end-to-end gốc, tạo ra các dự đoán trực tiếp mà không cần đến non-maximum suppression (NMS). Bằng cách loại bỏ bước hậu xử lý này, suy luận trở nên nhanh hơn, nhẹ hơn và dễ triển khai hơn trong các hệ thống thực tế. Cách tiếp cận đột phá này lần đầu tiên được tiên phong trong YOLOv10 bởi Ao Wang tại Đại học Thanh Hoa và đã được phát triển hơn nữa trong YOLO26.
- Hiệu quả triển khai: Thiết kế end-to-end loại bỏ toàn bộ một giai đoạn của quy trình, đơn giản hóa đáng kể việc tích hợp, giảm độ trễ và làm cho việc triển khai trở nên mạnh mẽ hơn trong các môi trường khác nhau.
- Đổi mới trong huấn luyện: YOLO26 giới thiệu bộ tối ưu hóa MuSGD, một sự kết hợp giữa SGD và Muon — lấy cảm hứng từ những đột phá của Kimi K2 của Moonshot AI trong huấn luyện LLM. Bộ tối ưu hóa này mang lại sự ổn định nâng cao và hội tụ nhanh hơn, chuyển các tiến bộ tối ưu hóa từ mô hình ngôn ngữ sang thị giác máy tính.
Cùng với nhau, những cải tiến này mang lại một họ mô hình đạt được độ chính xác cao hơn trên các đối tượng nhỏ, cung cấp khả năng triển khai liền mạch và chạy nhanh hơn tới 43% trên CPU — làm cho YOLO26 trở thành một trong những mô hình YOLO thiết thực và dễ triển khai nhất cho đến nay đối với các môi trường bị hạn chế về tài nguyên.
Các tính năng chính
-
Loại bỏ DFL
Mô-đun Distribution Focal Loss (DFL), mặc dù hiệu quả, nhưng thường làm phức tạp quá trình xuất và hạn chế khả năng tương thích phần cứng. YOLO26 loại bỏ hoàn toàn DFL, đơn giản hóa suy luận và mở rộng hỗ trợ cho các thiết bị biên và thiết bị có công suất thấp. -
Suy luận End-to-End không cần NMS
Không giống như các công cụ dò tìm truyền thống dựa vào NMS như một bước hậu xử lý riêng biệt, YOLO26 là end-to-end gốc. Các dự đoán được tạo trực tiếp, giảm độ trễ và làm cho việc tích hợp vào các hệ thống sản xuất nhanh hơn, nhẹ hơn và đáng tin cậy hơn. -
ProgLoss + STAL
Các hàm mất mát được cải thiện làm tăng độ chính xác dò tìm, với những cải tiến đáng chú ý trong nhận dạng đối tượng nhỏ, một yêu cầu quan trọng đối với IoT, robot, ảnh chụp trên không và các ứng dụng biên khác. -
Bộ tối ưu hóa MuSGD
Một bộ tối ưu hóa kết hợp mới kết hợp SGD với Muon. Lấy cảm hứng từ Kimi K2 của Moonshot AI, MuSGD giới thiệu các phương pháp tối ưu hóa tiên tiến từ huấn luyện LLM vào thị giác máy tính, cho phép huấn luyện ổn định hơn và hội tụ nhanh hơn. -
Suy luận CPU nhanh hơn tới 43%
Được tối ưu hóa đặc biệt cho điện toán biên, YOLO26 mang lại suy luận CPU nhanh hơn đáng kể, đảm bảo hiệu suất theo thời gian thực trên các thiết bị không có GPU.
Các Tác vụ và Chế độ được Hỗ trợ
YOLO26 được thiết kế như một họ mô hình đa nhiệm, mở rộng tính linh hoạt của YOLO trên nhiều thách thức thị giác máy tính khác nhau:
Mô hình | Tác vụ | Suy luận | Xác thực | Huấn luyện | Xuất |
---|---|---|---|---|---|
YOLO26 | Phát hiện vật thể | ✅ | ✅ | ✅ | ✅ |
YOLO26-seg | Phân đoạn thực thể | ✅ | ✅ | ✅ | ✅ |
YOLO26-pose | Tư thế/Điểm chính | ✅ | ✅ | ✅ | ✅ |
YOLO26-obb | Phát hiện theo hướng (Oriented Detection) | ✅ | ✅ | ✅ | ✅ |
YOLO26-cls | Phân loại (Classification) | ✅ | ✅ | ✅ | ✅ |
Khung thống nhất này đảm bảo YOLO26 có thể áp dụng trên các lĩnh vực dò tìm theo thời gian thực, phân đoạn, phân loại, ước tính tư thế và dò tìm đối tượng theo hướng — tất cả đều có hỗ trợ huấn luyện, xác thực, suy luận và xuất.
Các chỉ số hiệu suất
Xem trước hiệu suất
Các điểm chuẩn sau đây là bản xem trước ban đầu. Các số liệu cuối cùng và trọng số có thể tải xuống sẽ được phát hành sau khi quá trình huấn luyện hoàn tất.
Được huấn luyện trên COCO với 80 lớp được huấn luyện trước. Xem Tài liệu về Detection để biết cách sử dụng sau khi các mô hình được phát hành.
Mô hình | Kích thước (pixels) |
mAPval 50-95(e2e) |
mAPval 50-95 |
Tốc độ CPU ONNX (ms) |
Tốc độ T4 TensorRT10 (ms) |
Tham số (M) |
FLOPs (B) |
---|---|---|---|---|---|---|---|
YOLO26n | 640 | 39.8 | 40.3 | 38.90 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
YOLO26s | 640 | 47.2 | 47.6 | 87.16 ± 0.9 | 2.7 ± 0.0 | 9.5 | 20.7 |
YOLO26m | 640 | 51.5 | 51.7 | 220.0 ± 1.4 | 4.9 ± 0.1 | 20.4 | 68.2 |
YOLO26l | 640 | 53.0* | 53.4* | 286.17 ± 2.0* | 6.5 ± 0.2* | 24.8 | 86.4 |
YOLO26x | 640 | - | - | - | - | - | - |
*Các số liệu cho YOLO26l và YOLO26x đang được tiến hành. Điểm chuẩn cuối cùng sẽ được thêm vào đây.
Các chỉ số hiệu suất sẽ sớm được công bố.
Các chỉ số hiệu suất sẽ sớm được công bố.
Các chỉ số hiệu suất sẽ sớm được công bố.
Các chỉ số hiệu suất sẽ sớm được công bố.
Trích dẫn và ghi nhận
Ấn phẩm Ultralytics YOLO26
Ultralytics chưa công bố bài nghiên cứu chính thức nào cho YOLO26 do tính chất phát triển nhanh chóng của các mô hình. Thay vào đó, chúng tôi tập trung vào việc cung cấp các mô hình tiên tiến và giúp chúng dễ sử dụng. Để biết các bản cập nhật mới nhất về các tính năng, kiến trúc và cách sử dụng YOLO, hãy truy cập kho lưu trữ GitHub và tài liệu của chúng tôi.
Nếu bạn sử dụng YOLO26 hoặc phần mềm Ultralytics khác trong công việc của mình, vui lòng trích dẫn như sau:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2025},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}
Đang chờ DOI. YOLO26 có sẵn theo giấy phép AGPL-3.0 và Enterprise.
Câu hỏi thường gặp
Những cải tiến chính trong YOLO26 so với YOLO11 là gì?
- Loại bỏ DFL: Đơn giản hóa xuất và mở rộng khả năng tương thích edge
- Suy luận NMS-Free End-to-End: Loại bỏ NMS để triển khai nhanh hơn, đơn giản hơn
- ProgLoss + STAL: Tăng độ chính xác, đặc biệt là trên các vật thể nhỏ
- Trình tối ưu hóa MuSGD: Kết hợp SGD và Muon (lấy cảm hứng từ Kimi K2 của Moonshot) để đào tạo ổn định và hiệu quả hơn
- Suy luận CPU nhanh hơn tới 43%: Cải thiện hiệu suất đáng kể cho các thiết bị chỉ có CPU
YOLO26 sẽ hỗ trợ những tác vụ nào?
YOLO26 được thiết kế như một họ mô hình thống nhất, cung cấp hỗ trợ end-to-end cho nhiều tác vụ thị giác máy tính:
- Phát Hiện Đối Tượng
- Phân đoạn thực thể
- Phân loại hình ảnh
- Ước tính tư thế
- Phát hiện đối tượng theo hướng (OBB)
Mỗi biến thể kích thước (n, s, m, l, x) đều được lên kế hoạch hỗ trợ tất cả các tác vụ khi phát hành.
Tại sao YOLO26 được tối ưu hóa để triển khai ở biên?
YOLO26 mang lại hiệu suất vượt trội ở biên với:
- Suy luận CPU nhanh hơn đến 43%
- Giảm kích thước mô hình và dung lượng bộ nhớ
- Kiến trúc được đơn giản hóa để tương thích (không DFL, không NMS)
- Định dạng xuất linh hoạt bao gồm TensorRT, ONNX, CoreML, TFLite và OpenVINO
Khi nào các mô hình YOLO26 sẽ có sẵn?
Các mô hình YOLO26 vẫn đang trong quá trình huấn luyện và chưa được mở nguồn. Bản xem trước hiệu suất được hiển thị ở đây, với các bản tải xuống và phát hành chính thức được lên kế hoạch trong tương lai gần. Xem YOLO Vision 2025 để biết các buổi nói chuyện về YOLO26.