Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX so với PP-YOLOE+#

Khi thiết kế một pipeline computer vision mạnh mẽ, việc lựa chọn model phát hiện đối tượng phù hợp là một quyết định mang tính then chốt. Bối cảnh của các trình phát hiện đối tượng thời gian thực rất cạnh tranh, với vô số kiến trúc nỗ lực mang lại sự cân bằng tối ưu giữa tốc độ suy luận (inference speed) và độ chính xác khi phát hiện. Trong bài so sánh kỹ thuật này, chúng tôi sẽ đánh giá hai model nổi bật: YOLOX và PP-YOLOE+. Bằng cách xem xét các thiết kế kiến trúc, phương pháp huấn luyện và các chỉ số hiệu năng, chúng tôi hướng tới việc cung cấp cho các nhà phát triển và nghiên cứu những thông tin chi tiết cần thiết để chọn đúng công cụ cho môi trường triển khai của họ.

Link to this sectionĐổi mới Kiến trúc và Thiết kế#

Cả hai model đều được thiết kế để giải quyết những điểm yếu cụ thể trong các phiên bản YOLO trước đó, tuy nhiên chúng áp dụng những phương pháp cơ bản khác nhau để giải quyết sự đánh đổi giữa tốc độ và độ chính xác.

Link to this sectionYOLOX: Kết nối Nghiên cứu và Công nghiệp#

Được phát triển bởi Zheng Ge, Songtao Liu, Feng Wang, Zeming Li và Jian Sun tại Megvii, YOLOX được ra mắt vào ngày 18 tháng 7 năm 2021. Nó đánh dấu một sự thay đổi đáng kể trong gia đình YOLO bằng cách áp dụng hoàn toàn thiết kế không cần neo (anchor-free). Bạn có thể tìm hiểu nghiên cứu nền tảng trong bài báo Arxiv chính thức của họ và mã nguồn gốc trong kho lưu trữ GitHub của YOLOX.

YOLOX tích hợp một decoupled head (đầu giải mã tách biệt), giúp tách biệt các tác vụ phân loại và hồi quy, cải thiện đáng kể tốc độ hội tụ trong quá trình huấn luyện. Ngoài ra, nó giới thiệu các chiến lược gán nhãn tiên tiến như SimOTA để gán các mẫu dương tính một cách linh hoạt. Điều này giúp model đạt hiệu quả cao, đặc biệt là trong các môi trường edge AI nơi tài nguyên tính toán bị hạn chế nghiêm ngặt.

Tìm hiểu thêm về YOLOX

Link to this sectionPP-YOLOE+: Phát hiện công nghiệp hiệu năng cao#

Được giới thiệu bởi các tác giả của PaddlePaddle tại Baidu vào ngày 2 tháng 4 năm 2022, PP-YOLOE+ đại diện cho một sự phát triển được tối ưu hóa cao của dòng PP-YOLO. Được mô tả chi tiết trong bài xuất bản Arxiv của họ, PP-YOLOE+ được tích hợp sâu vào hệ sinh thái Baidu và yêu cầu framework PaddlePaddle. Các cấu hình của model có thể được tìm thấy trong kho lưu trữ GitHub của PaddleDetection.

PP-YOLOE+ dựa trên backbone CSPRepResNet mạnh mẽ và sử dụng đầu Efficient Task-aligned head (ET-head) cùng với Task Alignment Learning (TAL). Kiến trúc này đạt được mean Average Precision (mAP) vượt trội trên tập dữ liệu COCO, biến nó thành một lựa chọn đáng gờm cho việc phát hiện lỗi công nghiệp và các xử lý phía máy chủ nặng, nơi độ chính xác được ưu tiên hơn việc giảm thiểu các phụ thuộc.

Tìm hiểu thêm về PP-YOLOE+

Link to this sectionĐiểm chuẩn hiệu năng#

Hiểu được cách các model này vận hành ở các quy mô khác nhau là điều cần thiết cho việc triển khai. Bảng dưới đây phác thảo các chỉ số chính, bao gồm mAP và tốc độ suy luận khi xuất sang TensorRT.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
Các cân nhắc khi triển khai

Trong khi PP-YOLOE+x đạt được độ chính xác tuyệt đối cao nhất, YOLOX cung cấp các biến thể cực kỳ gọn nhẹ (Nano và Tiny), rất phù hợp cho các vi điều khiển công suất thấp và phần cứng di động cũ.

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa YOLOX và PP-YOLOE+ phụ thuộc vào yêu cầu dự án cụ thể, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn YOLOX#

YOLOX là lựa chọn mạnh mẽ cho:

  • Nghiên cứu Phát hiện Anchor-Free: Nghiên cứu học thuật sử dụng kiến trúc anchor-free sạch, gọn của YOLOX làm baseline để thử nghiệm với các head phát hiện hoặc hàm mất mát mới.
  • Thiết bị biên siêu nhẹ: Triển khai trên vi điều khiển hoặc phần cứng di động cũ nơi mà footprint cực nhỏ của biến thể YOLOX-Nano (0.91M tham số) là rất quan trọng.
  • Nghiên cứu Gán nhãn SimOTA: Các dự án nghiên cứu điều tra các chiến lược gán nhãn dựa trên vận chuyển tối ưu và tác động của chúng đến sự hội tụ trong đào tạo.

Link to this sectionKhi nào nên chọn PP-YOLOE+#

PP-YOLOE+ được khuyến nghị cho:

  • Tích hợp hệ sinh thái PaddlePaddle: Các tổ chức có cơ sở hạ tầng hiện có được xây dựng trên framework và công cụ PaddlePaddle của Baidu.
  • Triển khai Paddle Lite Edge: Triển khai lên phần cứng với các kernel suy luận được tối ưu hóa cao dành riêng cho Paddle Lite hoặc engine suy luận Paddle.
  • Nhận diện phía máy chủ có độ chính xác cao: Các kịch bản ưu tiên độ chính xác nhận diện tối đa trên các máy chủ GPU mạnh mẽ, nơi sự phụ thuộc vào framework không phải là vấn đề.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionLợi thế của Ultralytics: Giới thiệu YOLO26#

Mặc dù cả YOLOX và PP-YOLOE+ đều mang lại những lợi thế riêng biệt, sự phát triển nhanh chóng của AI đòi hỏi các công cụ kết hợp độ chính xác hiện đại với sự dễ sử dụng vô song. Đây là nơi các model của Ultralytics, cụ thể là Ultralytics YOLO26 mới được phát hành, vượt xa các kho lưu trữ nghiên cứu cũ.

Được phát hành vào tháng 1 năm 2026, YOLO26 thiết lập một tiêu chuẩn mới cho object detection hiện đại và hơn thế nữa, mang lại trải nghiệm nhà phát triển mà các framework cạnh tranh đơn giản là không thể sánh kịp.

Link to this sectionTại sao các nhà phát triển chọn YOLO26#

  1. Thiết kế End-to-End NMS-Free: Dựa trên các khái niệm tiên phong trong YOLOv10, YOLO26 là native end-to-end. Bằng cách loại bỏ hoàn toàn quá trình hậu xử lý Non-Maximum Suppression (NMS), nó đảm bảo độ trễ nhất quán cao và đơn giản hóa đáng kể các pipeline xuất (export) cho môi trường edge.
  2. Tối ưu hóa thế hệ mới: Sự ổn định trong huấn luyện được cách mạng hóa bởi MuSGD Optimizer, một sự kết hợp giữa SGD và Muon (lấy cảm hứng từ các phương pháp LLM như Kimi K2 của Moonshot AI). Điều này đảm bảo tốc độ hội tụ nhanh hơn. Hơn nữa, YOLO26 sử dụng ProgLoss + STAL để cải thiện đáng kể khả năng nhận diện các đối tượng nhỏ, một tính năng quan trọng cho các ứng dụng liên quan đến aerial imagery và robot.
  3. Unmatched Hardware Efficiency: By removing Distribution Focal Loss (DFL), YOLO26 drastically lowers memory requirements. It boasts up to 43% faster CPU inference, making it the definitive choice for devices lacking dedicated GPU acceleration.
  4. Tính linh hoạt cực độ: Khác với PP-YOLOE+ chỉ tập trung nghiêm ngặt vào phát hiện, YOLO26 cung cấp khả năng hỗ trợ thống nhất cho nhiều tác vụ. Nó kết hợp một hàm mất mát (loss function) phân đoạn ngữ nghĩa chuyên biệt cho instance segmentation, Residual Log-Likelihood Estimation (RLE) để pose estimation chính xác, và các cơ chế angle loss tiên tiến cho Oriented Bounding Boxes (OBB).

Tìm hiểu thêm về YOLO26

Link to this sectionTích hợp hệ sinh thái liền mạch#

Ultralytics loại bỏ sự thất vọng khi cài đặt các framework phức tạp. Bằng cách sử dụng Python API thống nhất hoặc Ultralytics Platform trực quan, bạn có thể huấn luyện, xác thực và xuất model chỉ với vài dòng code.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

Đối với người dùng đang đánh giá các kiến trúc mạnh mẽ khác trong hệ sinh thái Ultralytics, YOLO11 vẫn là một lựa chọn cực kỳ đáng tin cậy cho các triển khai legacy, trong khi RT-DETR dựa trên transformer cung cấp các khả năng tuyệt vời cho những ai đang tìm kiếm các giải pháp dựa trên cơ chế attention.

Link to this sectionTóm tắt#

Việc lựa chọn giữa YOLOX và PP-YOLOE+ thường phụ thuộc vào các ràng buộc về framework chính của bạn—cho dù bạn thích sự linh hoạt dựa trên PyTorch hay sự tích hợp sâu với PaddlePaddle của Baidu. Tuy nhiên, đối với các tổ chức đang tìm cách chuẩn bị cho tương lai cơ sở hạ tầng AI của mình, Ultralytics YOLO26 cung cấp một giải pháp thay thế vượt trội hơn hẳn. Với thiết kế NMS-free mang tính cách mạng, dung lượng bộ nhớ nhẹ và khả năng đa nhiệm toàn diện, YOLO26 trao quyền cho các đội ngũ để xây dựng các ứng dụng computer vision nhanh hơn, thông minh hơn và hiệu quả hơn với sự dễ dàng chưa từng có.

Người đóng góp

Bình luận