Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ so với YOLO26#

Bối cảnh thị giác máy tính thời gian thực đã chứng kiến sự tăng trưởng vượt bậc, được thúc đẩy bởi nhu cầu về các mô hình phát hiện đối tượng có khả năng mở rộng, hiệu quả và độ chính xác cao. Hai kiến trúc nổi bật trong lĩnh vực này là PP-YOLOE+, một bộ phát hiện mạnh mẽ từ hệ sinh thái PaddlePaddle, và Ultralytics YOLO26, mô hình tiên tiến nhất đang định nghĩa lại hiệu quả đào tạo và triển khai trên biên.

Hướng dẫn toàn diện này so sánh hai mô hình này, nêu bật kiến trúc, chỉ số hiệu suất, phương pháp đào tạo và các trường hợp sử dụng lý tưởng để giúp bạn đưa ra quyết định sáng suốt cho dự án AI tiếp theo của mình.

Link to this sectionThông số kỹ thuật và Quyền tác giả#

Việc hiểu nguồn gốc và triết lý thiết kế đằng sau các mô hình này cung cấp bối cảnh quan trọng cho các ứng dụng thực tế của chúng.

Chi tiết về PP-YOLOE+:

Tìm hiểu thêm về PP-YOLOE+

Chi tiết về YOLO26:

Tìm hiểu thêm về YOLO26

Link to this sectionCải tiến kiến trúc#

Link to this sectionKiến trúc PP-YOLOE+#

Được xây dựng dựa trên phiên bản tiền nhiệm PP-YOLOv2, PP-YOLOE+ giới thiệu một thiết kế mạnh mẽ phù hợp cho các ứng dụng công nghiệp. Nó tận dụng backbone CSPRepResNet và ET-head (Efficient Task-aligned head) để cân bằng giữa tốc độ và độ chính xác. PP-YOLOE+ sử dụng gán nhãn động (TAL) và tích hợp liền mạch với framework PaddlePaddle của Baidu, giúp nó được tối ưu hóa cao cho các GPU NVIDIA như T4 và V100. Tuy nhiên, sự phụ thuộc nặng nề vào hệ sinh thái PaddlePaddle có thể gây ra khó khăn cho các nhà phát triển đã quen với các quy trình làm việc PyTorch.

Link to this sectionKiến trúc YOLO26: Cuộc cách mạng ưu tiên biên#

Được phát hành vào đầu năm 2026, Ultralytics YOLO26 định hình lại hoàn toàn quy trình phát hiện thời gian thực, đặt trọng tâm lớn vào sự đơn giản khi triển khai và hiệu suất trên biên.

Những cải tiến chính của YOLO26 bao gồm:

  • Thiết kế End-to-End không cần NMS: YOLO26 là mô hình end-to-end gốc, loại bỏ hoàn toàn nhu cầu hậu xử lý bằng Non-Maximum Suppression (NMS). Đột phá này, lần đầu tiên được tiên phong trong YOLOv10, đảm bảo độ trễ suy luận nhất quán bất kể mức độ đông đúc của cảnh, giúp việc triển khai trở nên đơn giản hơn đáng kể.
  • Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss (DFL), YOLO26 đơn giản hóa đáng kể head đầu ra của nó. Điều này dẫn đến khả năng tương thích tốt hơn nhiều với các thiết bị biên và vi điều khiển.
  • Suy luận trên CPU nhanh hơn tới 43%: Nhờ việc loại bỏ DFL và các tối ưu hóa cấu trúc, YOLO26 được tối ưu hóa mạnh mẽ cho các môi trường không có GPU chuyên dụng, đạt tốc độ suy luận nhanh hơn tới 43% trên CPU so với YOLO11.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật đào tạo LLM tiên tiến như từ Moonshot AI, YOLO26 giới thiệu sự kết hợp giữa SGD và Muon. Điều này mang lại sự ổn định khi đào tạo chưa từng có và khả năng hội tụ nhanh hơn cho các tác vụ thị giác máy tính.
  • ProgLoss + STAL: Các hàm mất mát nâng cao nhắm mục tiêu cụ thể và cải thiện khả năng nhận diện vật thể nhỏ, điều này rất quan trọng đối với hoạt động của drone và các cảm biến IoT biên.
Những cải tiến cụ thể theo tác vụ trong YOLO26

Ngoài các hộp bao tiêu chuẩn, YOLO26 giới thiệu các nâng cấp cụ thể trên tất cả các tác vụ thị giác. Nó sử dụng loss phân đoạn ngữ nghĩa và tạo mẫu đa quy mô cho Phân đoạn, Ước tính log-likelihood thặng dư (RLE) cho Ước tính tư thế, và một loss góc chuyên biệt để giải quyết các vấn đề về biên trong phát hiện Hộp bao định hướng (OBB).

Link to this sectionHiệu suất và chỉ số#

Bảng dưới đây cung cấp cái nhìn toàn diện về cách PP-YOLOE+ so sánh với YOLO26 trên các kích thước mô hình khác nhau. Các mô hình YOLO26 chiếm ưu thế rõ ràng về tốc độ thô, hiệu quả tham số và Độ chính xác trung bình (mAP) tổng thể.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Lưu ý: Các giá trị in đậm làm nổi bật các chỉ số đạt hiệu suất tốt nhất trên tất cả các mô hình.

Link to this sectionPhân tích#

  • Yêu cầu bộ nhớ và Hiệu quả: YOLO26 yêu cầu ít tham số và FLOPs hơn đáng kể để đạt được điểm mAP cao hơn. Ví dụ, mô hình YOLO26n (Nano) đạt mAP 40.9 chỉ với 2.4 triệu tham số, vượt trội hơn mô hình PP-YOLOE+t trong khi kích thước chỉ bằng một nửa. Điều này dẫn đến việc sử dụng bộ nhớ thấp hơn trong cả quá trình đào tạo và triển khai.
  • Tốc độ suy luận: Khi xuất bằng TensorRT, YOLO26 thống trị các chỉ số về độ trễ. Việc loại bỏ NMS đảm bảo rằng thời gian suy luận 1.7ms trên GPU T4 vẫn ổn định hoàn hảo, trong khi PP-YOLOE+ phụ thuộc vào thời gian xử lý hậu kỳ có thể thay đổi.

Link to this sectionLợi thế của Ultralytics: Hệ sinh thái và tính dễ sử dụng#

Mặc dù các chỉ số thô rất quan trọng, trải nghiệm của nhà phát triển thường quyết định sự thành công của dự án. Nền tảng Ultralytics cung cấp một hệ sinh thái được duy trì tốt, hoàn toàn vượt trội so với các framework cũ hơn.

  1. Dễ sử dụng: Ultralytics lược bỏ mã boilerplate phức tạp. Việc đào tạo YOLO26 chỉ mất vài dòng code Python, tránh các tệp cấu hình dày đặc như yêu cầu của PP-YOLOE+.
  2. Tính linh hoạt: PP-YOLOE+ chủ yếu là một kiến trúc phát hiện đối tượng. YOLO26 cung cấp hỗ trợ sẵn có cho phân đoạn, phân loại, ước tính tư thế và OBB.
  3. Hiệu quả đào tạo: Các mô hình Ultralytics YOLO yêu cầu bộ nhớ CUDA thấp hơn rất nhiều so với các mô hình Transformer cồng kềnh như RT-DETR hoặc các kiến trúc cũ, cho phép các nhà nghiên cứu đào tạo các mô hình tiên tiến trên phần cứng cấp người tiêu dùng.
Các mô hình Ultralytics khác

Mặc dù YOLO26 là đỉnh cao của nghiên cứu hiện tại, hệ sinh thái Ultralytics cũng bao gồm YOLO11YOLOv8. Cả hai vẫn là những mô hình rất mạnh mẽ với sự hỗ trợ cộng đồng khổng lồ, lý tưởng cho những người dùng đang di chuyển từ các hệ thống cũ hơn.

Link to this sectionVí dụ mã: Huấn luyện YOLO26#

Bắt đầu với Ultralytics rất liền mạch. Đây là một ví dụ có thể chạy hoàn toàn để minh họa cách tải, đào tạo và xác thực một mô hình YOLO26:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset using the new MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    optimizer="auto",  # MuSGD is automatically engaged for YOLO26
)

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
print(f"Model successfully exported to: {export_path}")

Link to this sectionCác trường hợp sử dụng lý tưởng#

Link to this sectionKhi nào nên chọn PP-YOLOE+#

  • Cơ sở hạ tầng PaddlePaddle cũ: Nếu một doanh nghiệp đã gắn bó sâu sắc với công nghệ của Baidu và sử dụng phần cứng được cấu hình sẵn cho Paddle Inference, PP-YOLOE+ là một lựa chọn an toàn và ổn định.
  • Các trung tâm sản xuất tại Châu Á: Nhiều quy trình thị giác công nghiệp ở Châu Á có sự hỗ trợ mạnh mẽ, tồn tại từ trước cho PP-YOLOE+ trong phát hiện lỗi tự động.

Link to this sectionKhi nào nên chọn YOLO26#

  • Điện toán biên và IoT: Khả năng suy luận trên CPU nhanh hơn 43% và việc loại bỏ DFL khiến YOLO26 trở thành nhà vô địch không thể tranh cãi cho việc triển khai trên Raspberry Pi, điện thoại di động và các thiết bị nhúng.
  • Cảnh đông đúc và Thành phố thông minh: Kiến trúc End-to-End không cần NMS đảm bảo độ trễ ổn định trong các môi trường dày đặc như quản lý bãi đỗ xe và giám sát giao thông, nơi NMS truyền thống sẽ gây ra các nút thắt cổ chai.
  • Dự án đa tác vụ: Nếu quy trình của bạn yêu cầu theo dõi đối tượng, ước tính tư thế con người hoặc tạo mặt nạ pixel hoàn hảo, YOLO26 xử lý tất cả trong một gói Python thống nhất duy nhất.

Link to this sectionKết luận#

Mặc dù PP-YOLOE+ vẫn là một bộ phát hiện rất có khả năng trong hệ sinh thái riêng của nó, sự ra mắt của YOLO26 đã thay đổi mô hình. Bằng cách kết hợp các tối ưu hóa đào tạo lấy cảm hứng từ LLM (MuSGD) với một kiến trúc không cần NMS được tối ưu hóa không ngừng, Ultralytics đã tạo ra một mô hình vừa có độ chính xác cao vừa có thể triển khai dễ dàng. Đối với các nhà phát triển hiện đại đang tìm kiếm sự cân bằng tốt nhất giữa tốc độ, độ chính xác và trải nghiệm nhà phát triển, YOLO26 là lựa chọn dứt khoát.

Người đóng góp

Bình luận