Link to this sectionYOLO26 so với YOLO11#
Khi xây dựng các hệ thống thị giác máy tính hiện đại, việc lựa chọn mô hình phù hợp là rất quan trọng để cân bằng giữa độ chính xác, độ trễ và hiệu quả tài nguyên. Trong bối cảnh trí tuệ nhân tạo đang phát triển nhanh chóng, Ultralytics tiếp tục vượt qua các giới hạn của những gì có thể thực hiện được. Bài so sánh kỹ thuật chi tiết này khám phá quá trình chuyển đổi từ YOLO11 cực kỳ thành công sang YOLO26 mới đầy tính cách mạng, cung cấp cho các kỹ sư và nhà nghiên cứu AI những thông tin chi tiết cần thiết để đưa ra các quyết định kiến trúc sáng suốt.
Link to this sectionHệ thống phân loại mô hình và Metadata#
Cả hai mô hình đều được phát triển bởi Ultralytics, nhưng chúng đại diện cho các mô hình tư duy khác nhau trong dòng thời gian của các mô hình phát hiện đối tượng và thị giác đa nhiệm.
Chi tiết về YOLO26:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2026-01-14
- GitHub: Kho lưu trữ Ultralytics
- Tài liệu: Tài liệu chính thức YOLO26
Chi tiết về YOLO11:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2024-09-27
- GitHub: Kho lưu trữ Ultralytics
- Tài liệu: Tài liệu chính thức YOLO11
Link to this sectionKhác biệt kiến trúc và đổi mới#
Bước nhảy vọt từ YOLO11 lên YOLO26 liên quan đến những thay đổi cơ bản trong cả kiến trúc mô hình và quy trình huấn luyện nền tảng. Trong khi YOLO11 thiết lập một cơ sở vững chắc cho phát hiện đối tượng và học đa nhiệm, YOLO26 hoàn toàn đại tu pipeline triển khai cho điện toán biên (edge computing).
Link to this sectionThiết kế End-to-End không dùng NMS#
Một trong những nâng cấp quan trọng nhất trong YOLO26 là kiến trúc end-to-end nguyên bản của nó. Không giống như YOLO11 dựa vào Non-Maximum Suppression (NMS) hậu xử lý để lọc các khung bao (bounding box) chồng chéo, YOLO26 loại bỏ hoàn toàn bước này. Khái niệm này, lần đầu tiên được tiên phong trong YOLOv10, giúp giảm đáng kể sự biến thiên độ trễ và đơn giản hóa logic triển khai trên các thiết bị biên đa dạng.
Link to this sectionLoại bỏ DFL cho hiệu quả biên#
YOLO11 sử dụng Distribution Focal Loss (DFL) để tinh chỉnh ước tính khung bao. Tuy nhiên, DFL dựa vào các phép toán softmax phức tạp thường không được hỗ trợ tốt bởi các bộ tăng tốc biên năng lượng thấp. YOLO26 loại bỏ thành công DFL mà không làm giảm độ chính xác. Sự đơn giản hóa kiến trúc này giúp cải thiện đáng kể khả năng tương thích với các hệ thống nhúng và cho phép YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với phiên bản tiền nhiệm.
Link to this sectionTrình tối ưu hóa MuSGD#
Độ ổn định và tốc độ huấn luyện là yếu tố tối quan trọng. YOLO26 giới thiệu MuSGD Optimizer, một sự kết hợp giữa Stochastic Gradient Descent (SGD) và Muon, lấy cảm hứng mạnh mẽ từ các đổi mới huấn luyện LLM của Kimi K2 từ Moonshot AI. Trình tối ưu hóa này mang lại sự ổn định huấn luyện mô hình ngôn ngữ cho thị giác máy tính, đảm bảo hội tụ nhanh hơn và giảm dấu chân bộ nhớ trong quá trình huấn luyện so với các giải pháp thay thế Transformer nặng nề.
Link to this sectionProgLoss và STAL#
Đối với các nhà nghiên cứu làm việc với hình ảnh trên không hoặc các ứng dụng máy bay không người lái, việc phát hiện các đặc điểm nhỏ là một thách thức lịch sử. YOLO26 giới thiệu ProgLoss kết hợp với STAL (Scale-Targeted Attention Loss), mang lại những cải tiến đáng chú ý trong việc nhận diện đối tượng nhỏ so với YOLO11.
Link to this sectionSo sánh Hiệu năng và Chỉ số#
Khi so sánh trực tiếp các mô hình, YOLO26 thể hiện sự vượt trội rõ ràng về độ chính xác và hiệu quả trên thiết bị biên, trong khi vẫn duy trì các yêu cầu bộ nhớ cực thấp đặc trưng của hệ sinh thái Ultralytics.
| Mô hình | kích thước (pixel) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Lưu ý: Mô hình YOLO26 nano (YOLO26n) cho thấy sự cải thiện ~31% về tốc độ CPU so với YOLO11n (38.9ms so với 56.1ms), làm nổi bật triết lý thiết kế ưu tiên thiết bị biên.
Link to this sectionSự linh hoạt trên các tác vụ thị giác máy tính#
Cả hai mô hình đều được hưởng lợi từ hệ sinh thái Ultralytics được bảo trì cao, mang lại sự dễ sử dụng vô song thông qua một Python API thống nhất. Chúng không chỉ là các bộ phát hiện đối tượng; chúng là những cỗ máy đa nhiệm mạnh mẽ. Tuy nhiên, YOLO26 kết hợp một số tiến bộ đặc thù cho tác vụ:
- Phân đoạn đối tượng (Instance Segmentation): YOLO26 sử dụng hàm mất mát phân đoạn ngữ nghĩa đã tinh chỉnh và tạo nguyên mẫu đa quy mô, tạo ra các ranh giới mặt nạ sắc nét hơn so với YOLO11. Tìm hiểu thêm về quy trình phân đoạn.
- Ước tính tư thế (Pose Estimation): Bằng cách tích hợp Residual Log-Likelihood Estimation (RLE), YOLO26 cải thiện đáng kể độ chính xác của điểm chính trong các tư thế con người phức tạp. Khám phá khả năng ước tính tư thế.
- Khung bao định hướng (OBB): Một hàm mất mát góc chuyên dụng giải quyết các vấn đề gián đoạn ranh giới lịch sử, làm cho YOLO26 trở nên đặc biệt tin cậy trong việc phát hiện các đối tượng xoay trong dữ liệu vệ tinh. Đọc về tác vụ OBB.
- Phân loại hình ảnh: Cả hai mô hình đều xử lý phân loại tốc độ cao một cách hiệu quả, với YOLO26 mang lại những cải tiến nhỏ về độ chính xác top-1 trên ImageNet.
Link to this sectionVí dụ mã huấn luyện và suy luận#
Ultralytics is celebrated for its developer experience. Training a SOTA model or running an inference script takes only a few lines of code, minimizing boilerplate and maximizing productivity. Furthermore, training YOLO models requires significantly less CUDA memory than large transformer networks.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()Link to this sectionCác trường hợp sử dụng lý tưởng và chiến lược triển khai#
Việc lựa chọn giữa YOLO26 và YOLO11 phụ thuộc hoàn toàn vào các ràng buộc của môi trường sản xuất của bạn.
Link to this sectionKhi nào nên triển khai YOLO26#
YOLO26 là lựa chọn dứt khoát cho các dự án hiện đại, mới bắt đầu. Nó được xây dựng đặc biệt cho:
- Điện toán biên và IoT: Hiệu suất CPU đáng kinh ngạc và khả năng loại bỏ DFL khiến nó trở thành vua của các thiết bị như Raspberry Pi, Coral NPU và bộ xử lý di động.
- Phân tích máy bay không người lái và trên không: Việc tích hợp ProgLoss + STAL khiến nó có khả năng độc đáo trong việc theo dõi các đối tượng nhỏ, di chuyển nhanh trên các cảnh quan rộng lớn.
- Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.
Link to this sectionKhi nào nên giữ lại YOLO11#
Mặc dù YOLO26 vượt trội hơn, YOLO11 vẫn là một mô hình cực kỳ mạnh mẽ. Bạn có thể gắn bó với YOLO11 nếu:
- Pipeline kế thừa: Cơ sở hạ tầng triển khai C++ hiện có của bạn được kết nối chặt chẽ với các đầu ra dựa trên anchor cụ thể và logic NMS của các kiến trúc cũ hơn.
- Cơ sở học thuật: Bạn đang xuất bản nghiên cứu và cần một tiêu chuẩn 2024 được công nhận rộng rãi để làm chuẩn so sánh với các thuật toán mới của mình.
Link to this sectionSức mạnh của hệ sinh thái Ultralytics#
Bất kể bạn triển khai YOLO11 hay YOLO26, việc sử dụng các mô hình Ultralytics có nghĩa là bạn đang khai thác một hệ sinh thái được bảo trì tốt với các bản cập nhật thường xuyên và hỗ trợ cộng đồng rộng lớn.
Đối với các nhóm doanh nghiệp, Ultralytics Platform cung cấp giải pháp end-to-end cho việc gán nhãn dữ liệu, huấn luyện mô hình và triển khai đám mây liền mạch. Từ việc xuất các trọng số đã huấn luyện sang CoreML hoặc TensorRT, cho đến cấu hình tinh chỉnh siêu tham số nâng cao, các công cụ được cung cấp đảm bảo vòng đời AI của bạn được tinh giản nhất có thể.