Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 so với YOLOv6-3.0#

Sự phát triển của thị giác máy tính vẫn tiếp tục tăng tốc, cung cấp cho các nhà phát triển những công cụ mới mạnh mẽ cho các ứng dụng machine learning. Việc lựa chọn kiến trúc phù hợp cho việc triển khai thường quyết định sự thành công của một dự án. Trong bài so sánh kỹ thuật này, chúng ta sẽ khám phá những điểm khác biệt chính giữa YOLO26 tiên tiến và YOLOv6-3.0 được công nghiệp hóa chuyên sâu, đánh giá kiến trúc, phương pháp huấn luyện và các kịch bản triển khai lý tưởng của chúng.

Link to this sectionNguồn gốc và Chi tiết về Mô hình#

Trước khi đi sâu vào các chỉ số hiệu suất, điều hữu ích là hiểu rõ nền tảng và trọng tâm phát triển đằng sau hai mô hình thị giác mạnh mẽ này.

YOLO26

Tìm hiểu thêm về YOLO26

YOLOv6-3.0

Tìm hiểu thêm về YOLOv6-3.0

Link to this sectionĐổi mới và Khác biệt về Kiến trúc#

Cả hai mô hình đều được thiết kế cho object detection tốc độ cao, nhưng chúng áp dụng những cách tiếp cận hoàn toàn khác nhau để đạt được hiệu suất của mình.

Link to this sectionUltralytics YOLO26: Mô hình End-to-End tự nhiên tập trung vào Edge#

Ra mắt vào đầu năm 2026, YOLO26 đại diện cho một bước tiến nhảy vọt về hiệu suất mô hình. Nâng cấp kiến trúc đáng kể nhất là thiết kế End-to-End NMS-Free tự nhiên. Bằng cách loại bỏ bước hậu xử lý Non-Maximum Suppression (NMS) truyền thống—một khái niệm đã được tiên phong thành công trong YOLOv10—YOLO26 giảm thiểu đáng kể sự biến thiên về độ trễ, giúp nó có khả năng dự đoán cao cho các triển khai edge theo thời gian thực.

Additionally, YOLO26 features DFL Removal. By stripping out the Distribution Focal Loss, the model simplifies its export process and significantly enhances compatibility with low-power edge computing devices. This results in up to 43% Faster CPU Inference, making YOLO26 an absolute powerhouse for environments without dedicated graphics processing units (GPUs) like Raspberry Pi or mobile devices.

Link to this sectionYOLOv6-3.0: Chuyên gia Công nghiệp#

Được phát triển bởi đội ngũ thị giác tại Meituan, YOLOv6-3.0 là một CNN cấp công nghiệp, có khả năng cao, được tối ưu hóa mạnh mẽ cho triển khai TensorRT trên phần cứng NVIDIA. Nó dựa nhiều vào các kỹ thuật tự chưng cất (self-distillation) và thiết kế kiến trúc thần kinh nhận biết phần cứng. Mặc dù cực kỳ nhanh trên các GPU mạnh như T4 hoặc A100, nó vẫn dựa vào hậu xử lý NMS truyền thống, điều này có thể tạo ra các điểm nghẽn trong các môi trường phần cứng hạn chế.

Link to this sectionCân bằng Hiệu suất và Điểm chuẩn#

The true test of any model is how it balances mean average precision (mAP) with inference speed and parameter count. Ultralytics models are renowned for their exceptional memory requirements and performance balance, often outperforming transformer-based models that demand massive CUDA memory overhead.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Như đã thấy trong dữ liệu, YOLO26 liên tục đạt được mAP cao hơn với số lượng tham số chỉ bằng khoảng một nửa so với các đối tác YOLOv6. Ví dụ, YOLO26s vượt trội hơn YOLOv6-3.0s tới 3.6 điểm mAP trong khi chỉ sử dụng gần một nửa số lượng tham số (9.5M so với 18.5M).

Hiệu quả Bộ nhớ

Số lượng tham số và FLOPs thấp hơn của YOLO26 có nghĩa là mức tiêu thụ bộ nhớ thấp hơn đáng kể trong quá trình huấn luyện và inference so với YOLOv6, cho phép kích thước batch lớn hơn trên phần cứng phổ thông.

Link to this sectionHiệu quả và Phương pháp Huấn luyện#

Các phương pháp huấn luyện khác biệt rất lớn giữa hai framework. YOLO26 giới thiệu bộ tối ưu hóa MuSGD, một sự kết hợp giữa SGD và Muon lấy cảm hứng từ Kimi K2 của Moonshot AI. Điều này mang các cải tiến huấn luyện LLM trực tiếp vào thị giác máy tính, dẫn đến quá trình huấn luyện ổn định hơn và tốc độ hội tụ cực nhanh.

Furthermore, YOLO26 utilizes ProgLoss + STAL loss functions. These advanced loss functions yield notable improvements in small-object recognition, which is critical for AI in agriculture and high-altitude drone imagery.

Ngược lại, YOLOv6-3.0 sử dụng chiến lược tự chưng cất (self-distillation) nặng. Mặc dù hiệu quả, nó thường đòi hỏi lịch trình huấn luyện dài hơn và chi phí tính toán nhiều hơn để đạt được độ chính xác tối ưu.

Link to this sectionHệ sinh thái và tính dễ sử dụng#

Một trong những lợi thế lớn nhất của việc chọn YOLO26 là hệ sinh thái được duy trì tốt của Ultralytics Platform. Ultralytics nổi tiếng với sự dễ sử dụng "từ con số không". Các nhà phát triển có thể cài đặt gói Python và bắt đầu huấn luyện trong vài phút.

Ngược lại, YOLOv6 yêu cầu phải clone repository nghiên cứu, quản lý các dependency thủ công và điều hướng các script khởi chạy phức tạp, điều này có thể làm chậm quá trình triển khai đối với các đội ngũ kỹ thuật có nhịp độ làm việc nhanh.

Link to this sectionVí dụ mã: Bắt đầu với YOLO26#

Việc huấn luyện và chạy inference với các mô hình Ultralytics cực kỳ đơn giản. Python API mạnh mẽ xử lý mọi công việc nặng nhọc:

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run end-to-end NMS-free inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export seamlessly to ONNX for CPU deployment
model.export(format="onnx")

Link to this sectionTính linh hoạt chưa từng có trong các tác vụ thị giác#

Trong khi YOLOv6-3.0 chỉ đơn thuần là bộ phát hiện vật thể bounding-box, YOLO26 tự hào có tính linh hoạt đáng kinh ngạc. Sử dụng chính xác cùng một API đơn giản, các nhà phát triển có thể thực hiện instance segmentation, image classification, pose estimation, và phát hiện Oriented Bounding Box (OBB).

YOLO26 bao gồm các cải tiến cụ thể cho từng tác vụ trên toàn bộ các lĩnh vực, chẳng hạn như loss semantic segmentation cho việc mask hoàn hảo từng pixel, Residual Log-Likelihood Estimation (RLE) cho các keypoint chính xác cao và angle loss chuyên dụng để giải quyết các vấn đề về ranh giới OBB.

Link to this sectionCác trường hợp sử dụng lý tưởng#

Link to this sectionKhi nào nên sử dụng YOLO26#

YOLO26 is the undisputed champion for edge devices, Internet of Things (IoT), and robotics. Its 43% faster CPU inference and NMS-free architecture make it perfect for real-time security alarm systems running on standard CPUs or low-power ARM chips. Its superior small object detection (thanks to ProgLoss + STAL) makes it the ideal candidate for aerial wildlife detection and satellite imagery analysis.

Link to this sectionKhi nào nên dùng YOLOv6-3.0#

YOLOv6-3.0 tỏa sáng trong các môi trường công nghiệp được kiểm soát chặt chẽ, nơi các máy chủ được trang bị GPU NVIDIA cao cấp (như T4 hoặc A100) chạy các pipeline TensorRT được tối ưu hóa mạnh mẽ. Nó rất phù hợp cho việc phát hiện lỗi trên dây chuyền sản xuất tốc độ cao, nơi môi trường phần cứng là tĩnh và các biến thiên về độ trễ của NMS có thể chấp nhận được.

Link to this sectionKhám phá các mô hình khác#

Nếu bạn đang khám phá bối cảnh rộng lớn hơn của thị giác máy tính, bạn cũng có thể quan tâm đến các mô hình khác được hệ sinh thái Ultralytics hỗ trợ. Ví dụ, YOLO11 vẫn là một mô hình đa năng tuyệt vời với sự hỗ trợ lớn từ cộng đồng. Nếu bạn đặc biệt quan tâm đến kiến trúc transformer, mô hình RT-DETR cung cấp hiệu suất dựa trên cơ chế chú ý (attention) mạnh mẽ, mặc dù nó đòi hỏi nhiều bộ nhớ huấn luyện hơn đáng kể so với YOLO26. Đối với các khả năng zero-shot mà không cần huấn luyện, YOLO-World cung cấp khả năng phát hiện từ vựng mở (open-vocabulary) có thể prompt ngay khi sử dụng.

Link to this sectionTóm tắt#

Cả YOLOv6-3.0 và YOLO26 đều đại diện cho những thành tựu kỹ thuật to lớn. Tuy nhiên, đối với các ứng dụng hiện đại đòi hỏi phát triển nhanh, chi phí bộ nhớ thấp và triển khai liền mạch trên các thiết bị edge không đồng nhất, Ultralytics YOLO26 là lựa chọn vượt trội. Thiết kế end-to-end tự nhiên, bộ tối ưu hóa MuSGD mang tính cách mạng và sự tích hợp với Ultralytics ecosystem mạnh mẽ cho phép các đội ngũ đưa AI thị giác tiên tiến vào sản xuất nhanh chóng hơn bao giờ hết.

Những người đóng góp

Bình luận