Chuyển đến nội dung

Ultralytics YOLO26

Sắp ra mắt ⚠️

🚧 Các mô hình YOLO26 vẫn đang trong quá trình phát triển và chưa được phát hành. Các số liệu hiệu suất được hiển thị ở đây chỉ là bản xem trước. Các bản tải xuống và phát hành cuối cùng sẽ sớm được công bố — hãy cập nhật thông tin qua YOLO Vision 2025.

Tổng quan

Ultralytics YOLO26 là một bước tiến mới nhất trong dòng YOLO về công cụ phát hiện đối tượng theo thời gian thực, được thiết kế từ đầu cho các thiết bị biên và thiết bị có công suất thấp. Nó giới thiệu một thiết kế tinh gọn, loại bỏ sự phức tạp không cần thiết, đồng thời tích hợp các cải tiến có mục tiêu để mang lại khả năng triển khai nhanh hơn, nhẹ hơn và dễ tiếp cận hơn.

Kiến trúc của YOLO26 được định hướng bởi ba nguyên tắc cốt lõi:

  • Đơn giản: YOLO26 là một mô hình end-to-end gốc, tạo ra các dự đoán trực tiếp mà không cần đến non-maximum suppression (NMS). Bằng cách loại bỏ bước hậu xử lý này, suy luận trở nên nhanh hơn, nhẹ hơn và dễ triển khai hơn trong các hệ thống thực tế. Cách tiếp cận đột phá này lần đầu tiên được tiên phong trong YOLOv10 bởi Ao Wang tại Đại học Thanh Hoa và đã được phát triển hơn nữa trong YOLO26.
  • Hiệu quả triển khai: Thiết kế end-to-end loại bỏ toàn bộ một giai đoạn của quy trình, đơn giản hóa đáng kể việc tích hợp, giảm độ trễ và làm cho việc triển khai trở nên mạnh mẽ hơn trong các môi trường khác nhau.
  • Đổi mới trong huấn luyện: YOLO26 giới thiệu bộ tối ưu hóa MuSGD, một sự kết hợp giữa SGDMuon — lấy cảm hứng từ những đột phá của Kimi K2 của Moonshot AI trong huấn luyện LLM. Bộ tối ưu hóa này mang lại sự ổn định nâng cao và hội tụ nhanh hơn, chuyển các tiến bộ tối ưu hóa từ mô hình ngôn ngữ sang thị giác máy tính.

Cùng với nhau, những cải tiến này mang lại một họ mô hình đạt được độ chính xác cao hơn trên các đối tượng nhỏ, cung cấp khả năng triển khai liền mạch và chạy nhanh hơn tới 43% trên CPU — làm cho YOLO26 trở thành một trong những mô hình YOLO thiết thực và dễ triển khai nhất cho đến nay đối với các môi trường bị hạn chế về tài nguyên.

Biểu đồ so sánh Ultralytics YOLO26

Các tính năng chính

  • Loại bỏ DFL
    Mô-đun Phân tán Tiêu cự (DFL) tuy hiệu quả, nhưng thường phức tạp trong việc xuất dữ liệu và khả năng tương thích phần cứng hạn chế. YOLO26 loại bỏ hoàn toàn DFL, đơn giản hóa suy luận và mở rộng hỗ trợ cho các thiết bị biên và công suất thấp .

  • Suy luận không cần NMS đầu cuối
    Không giống như các bộ phát hiện truyền thống dựa vào NMS như một bước hậu xử lý riêng biệt, YOLO26 là giải pháp đầu cuối (end-to-end) nguyên bản . Các dự đoán được tạo trực tiếp, giảm độ trễ và giúp tích hợp vào hệ thống sản xuất nhanh hơn, nhẹ hơn và đáng tin cậy hơn.

  • ProgLoss + STAL
    Các hàm mất mát được cải thiện sẽ tăng độ chính xác phát hiện, với những cải tiến đáng chú ý trong khả năng nhận dạng vật thể nhỏ , một yêu cầu quan trọng đối với IoT, robot, hình ảnh trên không và các ứng dụng biên khác.

  • Trình tối ưu hóa MuSGD
    Một trình tối ưu hóa lai mới kết hợp SGD với Muon . Lấy cảm hứng từ Kimi K2 của Moonshot AI, MuSGD giới thiệu các phương pháp tối ưu hóa tiên tiến từ đào tạo LLM vào thị giác máy tính, cho phép đào tạo ổn định hơn và hội tụ nhanh hơn.

  • Tốc độ suy luận CPU nhanh hơn tới 43%
    Được tối ưu hóa đặc biệt cho điện toán biên, YOLO26 mang lại tốc độ nhanh hơn đáng kể CPU suy luận, đảm bảo hiệu suất thời gian thực trên các thiết bị không có GPU.


Các Tác vụ và Chế độ được Hỗ trợ

YOLO26 được thiết kế như một họ mô hình đa nhiệm, mở rộng tính linh hoạt của YOLO trên nhiều thách thức thị giác máy tính khác nhau:

Mô hìnhTác vụSuy luậnXác thựcHuấn luyệnXuất
YOLO26Phát hiện vật thể
YOLO26-segPhân đoạn thực thể
YOLO26-poseTư thế/Điểm chính
YOLO26-obbPhát hiện theo hướng (Oriented Detection)
YOLO26-clsPhân loại (Classification)

Khung thống nhất này đảm bảo YOLO26 có thể áp dụng trên các lĩnh vực dò tìm theo thời gian thực, phân đoạn, phân loại, ước tính tư thế và dò tìm đối tượng theo hướng — tất cả đều có hỗ trợ huấn luyện, xác thực, suy luận và xuất.


Các chỉ số hiệu suất

Xem trước hiệu suất

Các điểm chuẩn sau đây là bản xem trước ban đầu. Các số liệu cuối cùng và trọng số có thể tải xuống sẽ được phát hành sau khi quá trình huấn luyện hoàn tất.

Được huấn luyện trên COCO với 80 lớp được huấn luyện trước. Xem Tài liệu về Detection để biết cách sử dụng sau khi các mô hình được phát hành.

Mô hìnhKích thước
(pixels)
mAPval
50-95(e2e)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64039.840.338.90 ± 0.71.7 ± 0.02.45.4
YOLO26s64047.247.687.16 ± 0.92.7 ± 0.09.520.7
YOLO26m64051.551.7220.0 ± 1.44.9 ± 0.120.468.2
YOLO26l64053.0*53.4*286.17 ± 2.0*6.5 ± 0.2*24.886.4
YOLO26x640------

*Các số liệu cho YOLO26l và YOLO26x đang được tiến hành. Điểm chuẩn cuối cùng sẽ được thêm vào đây.

Các chỉ số hiệu suất sẽ sớm được công bố.

Các chỉ số hiệu suất sẽ sớm được công bố.

Các chỉ số hiệu suất sẽ sớm được công bố.

Các chỉ số hiệu suất sẽ sớm được công bố.


Trích dẫn và Lời cảm ơn

Ấn phẩm Ultralytics YOLO26

Ultralytics chưa công bố bài nghiên cứu chính thức nào cho YOLO26 do tính chất phát triển nhanh chóng của các mô hình. Thay vào đó, chúng tôi tập trung vào việc cung cấp các mô hình tiên tiến và giúp chúng dễ sử dụng. Để biết các bản cập nhật mới nhất về các tính năng, kiến trúc và cách sử dụng YOLO, hãy truy cập kho lưu trữ GitHubtài liệu của chúng tôi.

Nếu bạn sử dụng YOLO26 hoặc phần mềm Ultralytics khác trong công việc của mình, vui lòng trích dẫn như sau:

@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2025},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Đang chờ DOI. YOLO26 có sẵn theo giấy phép AGPL-3.0Enterprise.


Câu hỏi thường gặp

Những cải tiến chính trong YOLO26 so với YOLO11 là gì?

  • Loại bỏ DFL: Đơn giản hóa xuất và mở rộng khả năng tương thích edge
  • Suy luận NMS-Free End-to-End: Loại bỏ NMS để triển khai nhanh hơn, đơn giản hơn
  • ProgLoss + STAL: Tăng độ chính xác, đặc biệt là trên các vật thể nhỏ
  • Trình tối ưu hóa MuSGD: Kết hợp SGD và Muon (lấy cảm hứng từ Kimi K2 của Moonshot) để đào tạo ổn định và hiệu quả hơn
  • Suy luận CPU nhanh hơn tới 43%: Cải thiện hiệu suất đáng kể cho các thiết bị chỉ có CPU

YOLO26 sẽ hỗ trợ những tác vụ nào?

YOLO26 được thiết kế như một họ mô hình thống nhất, cung cấp hỗ trợ end-to-end cho nhiều tác vụ thị giác máy tính:

Mỗi biến thể kích thước (n, s, m, l, x) đều được lên kế hoạch hỗ trợ tất cả các tác vụ khi phát hành.

Tại sao YOLO26 được tối ưu hóa để triển khai ở biên?

YOLO26 mang lại hiệu suất vượt trội ở biên với:

  • Suy luận CPU nhanh hơn đến 43%
  • Giảm kích thước mô hình và dung lượng bộ nhớ
  • Kiến trúc được đơn giản hóa để tương thích (không DFL, không NMS)
  • Định dạng xuất linh hoạt bao gồm TensorRT, ONNX, CoreML, TFLite và OpenVINO

Khi nào các mô hình YOLO26 sẽ có sẵn?

Các mô hình YOLO26 vẫn đang trong quá trình huấn luyện và chưa được mở nguồn. Bản xem trước hiệu suất được hiển thị ở đây, với các bản tải xuống và phát hành chính thức được lên kế hoạch trong tương lai gần. Xem YOLO Vision 2025 để biết các buổi nói chuyện về YOLO26.



📅 Được tạo cách đây 1 tháng ✏️ Đã cập nhật cách đây 12 ngày
glenn-jocherY-T-GLaughing-q

Bình luận