Link to this sectionYOLO26 so với YOLOv10#
Bối cảnh thị giác máy tính đang không ngừng phát triển, được thúc đẩy bởi nhu cầu về các model nhanh hơn, chính xác hơn và hiệu quả hơn. Hướng dẫn này cung cấp sự so sánh kỹ thuật toàn diện giữa hai kiến trúc đột phá trong lĩnh vực phát hiện đối tượng thời gian thực: YOLO26 và YOLOv10. Bằng cách phân tích kiến trúc, chỉ số hiệu năng và khả năng triển khai, chúng tôi hướng tới việc giúp các nhà phát triển và nghiên cứu lựa chọn model tối ưu cho các ứng dụng thị giác của họ.
Link to this sectionSự phát triển của các kiến trúc không dùng NMS#
Trong nhiều năm, dòng model YOLO (You Only Look Once) dựa rất nhiều vào Non-Maximum Suppression (NMS) để lọc các bounding box trùng lặp trong quá trình hậu xử lý. Mặc dù hiệu quả, NMS gây ra độ trễ suy luận (inference latency) và làm phức tạp quá trình triển khai trên các thiết bị biên như Raspberry Pi hoặc các đơn vị xử lý thần kinh (NPU) chuyên dụng.
Sự ra đời của YOLOv10 đã tạo ra một bước ngoặt về tư duy khi tiên phong trong thiết kế end-to-end không cần NMS. Dựa trên đột phá nền tảng này, Ultralytics YOLO26 đã tinh chỉnh kiến trúc cho các môi trường sản xuất, đạt được hiệu suất vượt trội và tính dễ sử dụng trên đa dạng các tác vụ hơn.
Link to this sectionYOLOv10: Tiên phong trong phát hiện không dùng NMS#
Ngày: 2024-05-23
Tác giả: Ao Wang, Hui Chen, Lihao Liu, et al.
Tổ chức: Tsinghua University
Tài nguyên: ArXiv Paper | GitHub Repository
Được phát triển bởi các nhà nghiên cứu tại Tsinghua University, YOLOv10 đã giới thiệu chiến lược gán kép nhất quán để loại bỏ nhu cầu sử dụng NMS. Bằng cách áp dụng thiết kế model theo hướng tối ưu hóa hiệu năng-độ chính xác, nó đã giảm sự dư thừa tính toán trong khi vẫn duy trì mAP (mean Average Precision) mạnh mẽ.
Điểm mạnh:
- Kiến trúc không dùng NMS: Người tiên phong ban đầu của thiết kế không dùng NMS trong dòng YOLO, giúp giảm đáng kể độ trễ cho các ứng dụng thời gian thực.
- Hiệu quả: Cung cấp sự cân bằng tốt giữa số lượng tham số và tốc độ suy luận so với các model thế hệ trước.
Điểm yếu:
- Hỗ trợ tác vụ hạn chế: Chủ yếu tập trung vào phát hiện đối tượng tiêu chuẩn, thiếu sự hỗ trợ sẵn có cho các tác vụ nâng cao như phân đoạn (segmentation) hoặc ước tính tư thế (pose estimation).
- Trọng tâm học thuật: Cơ sở mã, mặc dù mạnh mẽ, nhưng thiên về nghiên cứu hơn là triển khai sản xuất cấp doanh nghiệp đã được tinh giản.
Link to this sectionYOLO26: Tiêu chuẩn mới cho Edge và Cloud#
Ngày: 2026-01-14
Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Tài nguyên: GitHub Repository | Ultralytics Platform
Được phát hành với tư cách là người kế nhiệm YOLO11, YOLO26 đưa khái niệm không dùng NMS đến sự hiện thực hóa tối ưu. Nó tích hợp sẵn khả năng phát hiện end-to-end vào Ultralytics Platform được tối ưu hóa cao, cung cấp một bộ công cụ hoàn chỉnh cho quy trình machine learning hiện đại.
YOLO26 giới thiệu một số đột phá về kiến trúc:
- Loại bỏ DFL: Distribution Focal Loss đã bị loại bỏ hoàn toàn. Điều này giúp đơn giản hóa đáng kể quy trình xuất model và cải thiện khả năng tương thích với các thiết bị biên và thiết bị năng lượng thấp.
- Suy luận trên CPU nhanh hơn tới 43%: Nhờ việc loại bỏ DFL và các tối ưu hóa cấu trúc, YOLO26 nhanh hơn đáng kể trên CPU, khiến nó trở nên lý tưởng cho các triển khai IoT và di động.
- Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Large Language Model (LLM) (chẳng hạn như Kimi K2 của Moonshot AI), YOLO26 sử dụng sự kết hợp giữa SGD và Muon. Điều này mang lại sự ổn định khi huấn luyện chưa từng có và khả năng hội tụ nhanh hơn cho thị giác máy tính.
- ProgLoss + STAL: Các hàm mất mát (loss function) tiên tiến này mang lại những cải thiện đáng chú ý trong việc nhận diện đối tượng nhỏ, vốn rất quan trọng đối với hình ảnh từ trên không và giám sát an ninh dựa trên drone.
- Cải tiến theo tác vụ: YOLO26 không chỉ là một detector. Nó có tính năng mất mát Semantic Segmentation và proto đa tỷ lệ cho Segmentation, Residual Log-Likelihood Estimation (RLE) cho Pose Estimation và mất mát góc chuyên dụng cho Oriented Bounding Boxes (OBB).
Link to this sectionPhân tích hiệu năng và các chỉ số#
Bảng sau đây so sánh hiệu năng phát hiện trên COCO của các model YOLO26 và YOLOv10. Hãy chú ý cách YOLO26 đạt được độ chính xác vượt trội trong khi vẫn duy trì hiệu quả tham số đặc biệt.
| Mô hình | kích thước (pixel) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Link to this sectionLợi thế của Ultralytics: Hiệu quả huấn luyện và bộ nhớ#
Khi triển khai model vào sản xuất, yêu cầu về bộ nhớ và hiệu quả huấn luyện cũng quan trọng không kém tốc độ suy luận. Các model Ultralytics, đặc biệt là YOLO26, được tối ưu hóa cao để giảm mức sử dụng bộ nhớ CUDA trong quá trình huấn luyện. Điều này cho phép các nhà phát triển sử dụng batch sizes lớn hơn trên các GPU tiêu dùng, cắt giảm đáng kể thời gian huấn luyện và chi phí tính toán. Ngược lại, các kiến trúc phức tạp hoặc các model transformer nặng như RT-DETR thường yêu cầu phần cứng cao cấp, đắt tiền để huấn luyện hiệu quả.
Một trong những lợi ích lớn nhất của việc chọn YOLO26 là khả năng tích hợp với hệ sinh thái Ultralytics được bảo trì tốt. Từ gán nhãn dữ liệu đến theo dõi thử nghiệm, nền tảng này cung cấp mọi thứ mà một kỹ sư machine learning cần dưới một mái nhà thống nhất.
Link to this sectionTriển khai thực tế: Ví dụ về mã#
Dấu ấn của Ultralytics là Tính dễ sử dụng hàng đầu trong ngành. Với Python API trực quan, việc chuyển đổi từ một model cũ như YOLOv8 sang YOLO26 tiên tiến chỉ yêu cầu cập nhật một dòng code duy nhất.
Đây là một ví dụ có thể chạy 100% minh họa cách huấn luyện và suy luận bằng YOLO26:
from ultralytics import YOLO
# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="cpu", # Easily switch to 0 for GPU
)
# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# 4. Display the results to screen
predictions[0].show()
# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")Link to this sectionCác trường hợp sử dụng và Khuyến nghị#
Việc lựa chọn giữa YOLO26 và YOLOv10 phụ thuộc vào các yêu cầu dự án cụ thể, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.
Link to this sectionKhi nào nên chọn YOLO26#
YOLO26 là lựa chọn mạnh mẽ cho:
- Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
- Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
- Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.
Link to this sectionKhi nào nên chọn YOLOv10#
YOLOv10 được khuyến nghị cho:
- Phát hiện thời gian thực không cần NMS: Các ứng dụng hưởng lợi từ việc phát hiện đầu cuối (end-to-end) mà không cần NMS, giúp giảm độ phức tạp khi triển khai.
- Sự cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng mạnh mẽ giữa tốc độ suy luận và độ chính xác của phát hiện trên nhiều quy mô model khác nhau.
- Các ứng dụng có độ trễ nhất quán: Các kịch bản triển khai nơi thời gian suy luận có thể dự đoán được là yếu tố quan trọng, chẳng hạn như robotics hoặc các hệ thống tự hành.
Link to this sectionKết luận#
Mặc dù YOLOv10 đã có những đóng góp đáng kể cho cộng đồng học thuật bằng việc giới thiệu mô hình không dùng NMS, YOLO26 nâng tầm công nghệ này lên mức độ sẵn sàng cho doanh nghiệp. Với mức tăng 43% tốc độ CPU đáng kinh ngạc, trình tối ưu hóa MuSGD sáng tạo và sự linh hoạt vô song trên các tác vụ thị giác, YOLO26 nổi bật như là lựa chọn tối ưu cho cả điện toán biên và triển khai cloud quy mô lớn.
Đối với các đội ngũ ưu tiên một cộng đồng năng động, tài liệu toàn diện và trải nghiệm nhà phát triển không ma sát, hệ sinh thái Ultralytics là vô song. Nếu bạn đang khám phá các model cho các kịch bản chuyên biệt, bạn cũng có thể muốn tìm hiểu YOLO-World cho khả năng phát hiện zero-shot open-vocabulary. Tuy nhiên, đối với đại đa số các trường hợp sử dụng thực tế, YOLO26 là đề xuất dứt khoát.