Chuyển đến nội dung

Ultralytics YOLO26

Sắp ra mắt ⚠️

🚧 Các mô hình YOLO26 vẫn đang trong quá trình phát triển và chưa được phát hành. Các số liệu hiệu suất được hiển thị ở đây chỉ là bản xem trước. Các bản tải xuống và phát hành cuối cùng sẽ sớm được công bố — hãy cập nhật thông tin qua YOLO Vision 2025.

Tổng quan

Ultralytics YOLO26 là một bước tiến mới nhất trong dòng YOLO về công cụ phát hiện đối tượng theo thời gian thực, được thiết kế từ đầu cho các thiết bị biên và thiết bị có công suất thấp. Nó giới thiệu một thiết kế tinh gọn, loại bỏ sự phức tạp không cần thiết, đồng thời tích hợp các cải tiến có mục tiêu để mang lại khả năng triển khai nhanh hơn, nhẹ hơn và dễ tiếp cận hơn.

Kiến trúc của YOLO26 được định hướng bởi ba nguyên tắc cốt lõi:

  • Đơn giản: YOLO26 là một mô hình end-to-end gốc, tạo ra các dự đoán trực tiếp mà không cần đến non-maximum suppression (NMS). Bằng cách loại bỏ bước hậu xử lý này, suy luận trở nên nhanh hơn, nhẹ hơn và dễ triển khai hơn trong các hệ thống thực tế. Cách tiếp cận đột phá này lần đầu tiên được tiên phong trong YOLOv10 bởi Ao Wang tại Đại học Thanh Hoa và đã được phát triển hơn nữa trong YOLO26.
  • Hiệu quả triển khai: Thiết kế end-to-end loại bỏ toàn bộ một giai đoạn của quy trình, đơn giản hóa đáng kể việc tích hợp, giảm độ trễ và làm cho việc triển khai trở nên mạnh mẽ hơn trong các môi trường khác nhau.
  • Đổi mới trong huấn luyện: YOLO26 giới thiệu bộ tối ưu hóa MuSGD, một sự kết hợp giữa SGDMuon — lấy cảm hứng từ những đột phá của Kimi K2 của Moonshot AI trong huấn luyện LLM. Bộ tối ưu hóa này mang lại sự ổn định nâng cao và hội tụ nhanh hơn, chuyển các tiến bộ tối ưu hóa từ mô hình ngôn ngữ sang thị giác máy tính.

Cùng với nhau, những cải tiến này mang lại một họ mô hình đạt được độ chính xác cao hơn trên các đối tượng nhỏ, cung cấp khả năng triển khai liền mạch và chạy nhanh hơn tới 43% trên CPU — làm cho YOLO26 trở thành một trong những mô hình YOLO thiết thực và dễ triển khai nhất cho đến nay đối với các môi trường bị hạn chế về tài nguyên.

Biểu đồ so sánh Ultralytics YOLO26

Các tính năng chính

  • Loại bỏ DFL
    Mô-đun Distribution Focal Loss (DFL), mặc dù hiệu quả, nhưng thường làm phức tạp quá trình xuất và hạn chế khả năng tương thích phần cứng. YOLO26 loại bỏ hoàn toàn DFL, đơn giản hóa suy luận và mở rộng hỗ trợ cho các thiết bị biên và thiết bị có công suất thấp.

  • Suy luận End-to-End không cần NMS
    Không giống như các công cụ dò tìm truyền thống dựa vào NMS như một bước hậu xử lý riêng biệt, YOLO26 là end-to-end gốc. Các dự đoán được tạo trực tiếp, giảm độ trễ và làm cho việc tích hợp vào các hệ thống sản xuất nhanh hơn, nhẹ hơn và đáng tin cậy hơn.

  • ProgLoss + STAL
    Các hàm mất mát được cải thiện làm tăng độ chính xác dò tìm, với những cải tiến đáng chú ý trong nhận dạng đối tượng nhỏ, một yêu cầu quan trọng đối với IoT, robot, ảnh chụp trên không và các ứng dụng biên khác.

  • Bộ tối ưu hóa MuSGD
    Một bộ tối ưu hóa kết hợp mới kết hợp SGD với Muon. Lấy cảm hứng từ Kimi K2 của Moonshot AI, MuSGD giới thiệu các phương pháp tối ưu hóa tiên tiến từ huấn luyện LLM vào thị giác máy tính, cho phép huấn luyện ổn định hơn và hội tụ nhanh hơn.

  • Suy luận CPU nhanh hơn tới 43%
    Được tối ưu hóa đặc biệt cho điện toán biên, YOLO26 mang lại suy luận CPU nhanh hơn đáng kể, đảm bảo hiệu suất theo thời gian thực trên các thiết bị không có GPU.


Các Tác vụ và Chế độ được Hỗ trợ

YOLO26 được thiết kế như một họ mô hình đa nhiệm, mở rộng tính linh hoạt của YOLO trên nhiều thách thức thị giác máy tính khác nhau:

Mô hình Tác vụ Suy luận Xác thực Huấn luyện Xuất
YOLO26 Phát hiện vật thể
YOLO26-seg Phân đoạn thực thể
YOLO26-pose Tư thế/Điểm chính
YOLO26-obb Phát hiện theo hướng (Oriented Detection)
YOLO26-cls Phân loại (Classification)

Khung thống nhất này đảm bảo YOLO26 có thể áp dụng trên các lĩnh vực dò tìm theo thời gian thực, phân đoạn, phân loại, ước tính tư thế và dò tìm đối tượng theo hướng — tất cả đều có hỗ trợ huấn luyện, xác thực, suy luận và xuất.


Các chỉ số hiệu suất

Xem trước hiệu suất

Các điểm chuẩn sau đây là bản xem trước ban đầu. Các số liệu cuối cùng và trọng số có thể tải xuống sẽ được phát hành sau khi quá trình huấn luyện hoàn tất.

Được huấn luyện trên COCO với 80 lớp được huấn luyện trước. Xem Tài liệu về Detection để biết cách sử dụng sau khi các mô hình được phát hành.

Mô hình Kích thước
(pixels)
mAPval
50-95(e2e)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n 640 39.8 40.3 38.90 ± 0.7 1.7 ± 0.0 2.4 5.4
YOLO26s 640 47.2 47.6 87.16 ± 0.9 2.7 ± 0.0 9.5 20.7
YOLO26m 640 51.5 51.7 220.0 ± 1.4 4.9 ± 0.1 20.4 68.2
YOLO26l 640 53.0* 53.4* 286.17 ± 2.0* 6.5 ± 0.2* 24.8 86.4
YOLO26x 640 - - - - - -

*Các số liệu cho YOLO26l và YOLO26x đang được tiến hành. Điểm chuẩn cuối cùng sẽ được thêm vào đây.

Các chỉ số hiệu suất sẽ sớm được công bố.

Các chỉ số hiệu suất sẽ sớm được công bố.

Các chỉ số hiệu suất sẽ sớm được công bố.

Các chỉ số hiệu suất sẽ sớm được công bố.


Trích dẫn và ghi nhận

Ấn phẩm Ultralytics YOLO26

Ultralytics chưa công bố bài nghiên cứu chính thức nào cho YOLO26 do tính chất phát triển nhanh chóng của các mô hình. Thay vào đó, chúng tôi tập trung vào việc cung cấp các mô hình tiên tiến và giúp chúng dễ sử dụng. Để biết các bản cập nhật mới nhất về các tính năng, kiến trúc và cách sử dụng YOLO, hãy truy cập kho lưu trữ GitHubtài liệu của chúng tôi.

Nếu bạn sử dụng YOLO26 hoặc phần mềm Ultralytics khác trong công việc của mình, vui lòng trích dẫn như sau:

@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2025},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Đang chờ DOI. YOLO26 có sẵn theo giấy phép AGPL-3.0Enterprise.


Câu hỏi thường gặp

Những cải tiến chính trong YOLO26 so với YOLO11 là gì?

  • Loại bỏ DFL: Đơn giản hóa xuất và mở rộng khả năng tương thích edge
  • Suy luận NMS-Free End-to-End: Loại bỏ NMS để triển khai nhanh hơn, đơn giản hơn
  • ProgLoss + STAL: Tăng độ chính xác, đặc biệt là trên các vật thể nhỏ
  • Trình tối ưu hóa MuSGD: Kết hợp SGD và Muon (lấy cảm hứng từ Kimi K2 của Moonshot) để đào tạo ổn định và hiệu quả hơn
  • Suy luận CPU nhanh hơn tới 43%: Cải thiện hiệu suất đáng kể cho các thiết bị chỉ có CPU

YOLO26 sẽ hỗ trợ những tác vụ nào?

YOLO26 được thiết kế như một họ mô hình thống nhất, cung cấp hỗ trợ end-to-end cho nhiều tác vụ thị giác máy tính:

Mỗi biến thể kích thước (n, s, m, l, x) đều được lên kế hoạch hỗ trợ tất cả các tác vụ khi phát hành.

Tại sao YOLO26 được tối ưu hóa để triển khai ở biên?

YOLO26 mang lại hiệu suất vượt trội ở biên với:

  • Suy luận CPU nhanh hơn đến 43%
  • Giảm kích thước mô hình và dung lượng bộ nhớ
  • Kiến trúc được đơn giản hóa để tương thích (không DFL, không NMS)
  • Định dạng xuất linh hoạt bao gồm TensorRT, ONNX, CoreML, TFLite và OpenVINO

Khi nào các mô hình YOLO26 sẽ có sẵn?

Các mô hình YOLO26 vẫn đang trong quá trình huấn luyện và chưa được mở nguồn. Bản xem trước hiệu suất được hiển thị ở đây, với các bản tải xuống và phát hành chính thức được lên kế hoạch trong tương lai gần. Xem YOLO Vision 2025 để biết các buổi nói chuyện về YOLO26.



📅 Được tạo cách đây 21 ngày ✏️ Đã cập nhật cách đây 2 ngày

Bình luận