Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 so với YOLOv6-3.0#

Trong bối cảnh computer vision đang phát triển nhanh chóng, việc lựa chọn kiến trúc object detection tối ưu là yếu tố then chốt để cân bằng giữa tốc độ suy luận (inference speed), độ chính xác của model và tính khả thi khi triển khai. Hướng dẫn này cung cấp sự so sánh kỹ thuật chuyên sâu giữa hai model mạnh mẽ: YOLOv10 - một

Link to this sectionTổng quan về YOLOv10: Người tiên phong trong thiết kế End-to-End#

Được phát hành vào giữa năm 2024, YOLOv10 đã tạo ra một sự thay đổi mô hình trong dòng họ YOLO bằng cách loại bỏ hoàn toàn nhu cầu sử dụng Non-Maximum Suppression (NMS) trong quá trình hậu xử lý. Thiết kế end-to-end nguyên bản này giúp giảm thiểu các điểm nghẽn về độ trễ suy luận, khiến nó trở thành một lựa chọn cực kỳ hấp dẫn cho edge AI và các triển khai trên thiết bị nhúng.

Link to this sectionCải tiến kiến trúc#

YOLOv10 đạt được khả năng không cần NMS thông qua chiến lược Consistent Dual Assignment. Trong quá trình huấn luyện, model tận dụng cả gán nhãn one-to-many và one-to-one, giúp làm phong phú các tín hiệu giám sát. Đối với suy luận, nó chỉ dựa hoàn toàn vào đầu one-to-one, loại bỏ chi phí tính toán liên quan đến việc lọc BBox truyền thống. Hơn nữa, YOLOv10 tích hợp một thiết kế tổng thể, tập trung vào hiệu suất, tối ưu hóa triệt để các thành phần nội bộ như các lớp convolutional neural network để giảm đáng kể sự dư thừa tính toán và parameter count tổng thể.

Tìm hiểu thêm về YOLOv10

Link to this sectionTổng quan về YOLOv6-3.0: Cỗ máy công nghiệp bền bỉ#

Được phát triển đặc biệt cho các ứng dụng công nghiệp, YOLOv6-3.0 ưu tiên thông lượng (throughput) GPU cao. Nó tỏa sáng trong các môi trường nơi các hệ thống cũ và xử lý lô nặng trên phần cứng chuyên dụng cấp máy chủ là tiêu chuẩn.

Link to this sectionCải tiến kiến trúc#

YOLOv6-3.0 tạo sự khác biệt với backbone EfficientRep được tối ưu hóa mạnh mẽ, cấu trúc để tối đa hóa tốc độ suy luận trên các trình tăng tốc phần cứng như NVIDIA GPUs. Phiên bản 3.0 đã giới thiệu module Bi-directional Concatenation (BiC) để tăng cường hợp nhất tính năng đa quy mô. Ngoài ra, nó thực hiện chiến lược Anchor-Aided Training (AAT) kết hợp sự hội tụ nhanh chóng của các anchor-based detectors với khả năng tổng quát hóa của các mô hình không sử dụng anchor.

Tìm hiểu thêm về YOLOv6

Link to this sectionSo sánh Hiệu năng và Chỉ số#

Khi phân tích hiệu suất thực tế, các thế hệ cải tiến kiến trúc trong YOLOv10 trở nên rõ ràng. YOLOv10 liên tục mang lại mean Average Precision (mAP) cao hơn trong khi yêu cầu ít tham số và FLOPs hơn đáng kể.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Trong khi YOLOv6-3.0 giữ được lợi thế tốc độ nhỏ ở các biến thể Nano và Medium khi thực thi bằng TensorRT trên GPU T4, YOLOv10 yêu cầu dung lượng bộ nhớ gần bằng một nửa để đạt được độ chính xác vượt trội, khiến cán cân hiệu suất nghiêng hẳn về phía các kiến trúc end-to-end hiện đại.

Hiệu quả Bộ nhớ

Các model Ultralytics YOLO tự hào có yêu cầu bộ nhớ thấp hơn trong quá trình huấn luyện và suy luận so với các model transformer phức tạp, giúp chúng dễ dàng mở rộng và triển khai trên các thiết bị bị hạn chế về tài nguyên.

Link to this sectionLợi thế từ hệ sinh thái Ultralytics#

Lựa chọn một model Ultralytics như YOLOv10 không chỉ dừng lại ở kiến trúc thuần túy—nó cung cấp quyền truy cập vào một hệ sinh thái được duy trì tỉ mỉ, giúp đơn giản hóa toàn bộ vòng đời machine learning. YOLOv6, vốn nằm trong một repository nghiên cứu tĩnh, thiếu đi các công cụ mạnh mẽ và sự linh hoạt đa tác vụ mà framework Ultralytics cung cấp sẵn.

  • Dễ sử dụng: Python API của Ultralytics cung cấp trải nghiệm người dùng tinh gọn, cho phép các lập trình viên huấn luyện và xuất model chỉ với vài dòng code.
  • Tính linh hoạt: Không giống như YOLOv6, chỉ chuyên biệt về detection, hệ sinh thái Ultralytics cho phép bạn thực hiện Instance Segmentation, Pose Estimation, Image Classification và theo dõi Oriented Bounding Box (OBB) bằng một giao diện hợp nhất.
  • Hệ sinh thái được duy trì tốt: Tận hưởng các bản cập nhật thường xuyên, sự hỗ trợ mạnh mẽ từ cộng đồng và tích hợp liền mạch với các tiêu chuẩn ngành như OpenVINOONNX.

Link to this sectionVí dụ mã: Quy trình huấn luyện nhất quán#

Với Ultralytics SDK, việc huấn luyện model trở nên đặc biệt đơn giản. Hệ thống tự động xử lý các data augmentations phức tạp và khả năng mở rộng thiết bị.

from ultralytics import YOLO

# Load an efficient, NMS-free YOLOv10 model
model = YOLO("yolov10n.pt")

# Train the model effortlessly using the Ultralytics pipeline
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0, batch=16)

# Run robust object detection inference
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa YOLOv10 và YOLOv6 phụ thuộc vào các yêu cầu dự án cụ thể, các hạn chế khi triển khai và ưu tiên về hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn YOLOv10#

YOLOv10 là một lựa chọn mạnh mẽ cho:

  • Phát hiện thời gian thực không cần NMS: Các ứng dụng hưởng lợi từ việc phát hiện đầu cuối (end-to-end) mà không cần NMS, giúp giảm độ phức tạp khi triển khai.
  • Sự cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng mạnh mẽ giữa tốc độ suy luận và độ chính xác của phát hiện trên nhiều quy mô model khác nhau.
  • Các ứng dụng có độ trễ nhất quán: Các kịch bản triển khai nơi thời gian suy luận có thể dự đoán được là yếu tố quan trọng, chẳng hạn như robotics hoặc các hệ thống tự hành.

Link to this sectionKhi nào nên chọn YOLOv6#

YOLOv6 được khuyến nghị cho:

  • Triển khai chú trọng phần cứng công nghiệp: Các kịch bản mà thiết kế chú trọng phần cứng của mô hình và khả năng tái tham số hóa hiệu quả mang lại hiệu năng tối ưu trên phần cứng mục tiêu cụ thể.
  • Phát hiện single-stage nhanh: Các ứng dụng ưu tiên tốc độ inference thô trên GPU để xử lý video thời gian thực trong các môi trường được kiểm soát.
  • Tích hợp hệ sinh thái Meituan: Các đội ngũ đã và đang làm việc trong hệ sinh thái công nghệ và hạ tầng triển khai của Meituan.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionKhuyến nghị cuối cùng: Ultralytics YOLO26#

Trong khi YOLOv10 giới thiệu khái niệm không cần NMS mang tính cách mạng, và YOLOv6-3.0 tối ưu hóa thông lượng GPU, thì giải pháp state-of-the-art thực sự cho môi trường sản xuất chính là Ultralytics YOLO26.

Được phát hành vào tháng 1 năm 2026, YOLO26 lấy các ý tưởng nền tảng từ những người tiền nhiệm và tinh chỉnh chúng thành model thị giác máy tính ưu tiên edge tối thượng.

  • Thiết kế End-to-End không NMS: Xây dựng trên nền tảng của YOLOv10, YOLO26 loại bỏ hoàn toàn quá trình hậu xử lý, tiêu chuẩn hóa pipeline triển khai và giúp cho suy luận trở nên rất dễ dự đoán.
  • Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss (DFL), kiến trúc này đơn giản hóa đáng kể việc xuất model, cải thiện mạnh mẽ khả năng tương thích và tốc độ trên các kiến trúc IoT công suất thấp.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ những đổi mới trong các model ngôn ngữ lớn, YOLO26 sử dụng trình tối ưu hóa MuSGD (một sự kết hợp giữa SGD và Muon), đạt được sự ổn định khi huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn đáng kể.
  • Tốc độ CPU vượt trội: Với các tối ưu hóa dành riêng cho các thiết bị edge, YOLO26 đạt tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước, vượt qua cả thiết kế tập trung vào GPU của YOLOv6-3.0.
  • ProgLoss + STAL: Các hàm loss tiên tiến giải quyết những khó khăn lịch sử với small object detection, khiến YOLO26 trở nên không thể thiếu đối với hình ảnh trên không và phân tích drone.

Tìm hiểu thêm về YOLO26

Đối với người dùng đang tìm cách nâng cấp hệ thống computer vision của họ, quá trình chuyển đổi rất đơn giản. Các model như YOLO11 vẫn rất mạnh mẽ, nhưng YOLO26 kết hợp với Ultralytics Platform được tích hợp chính là tương lai xác định của trí tuệ nhân tạo hiệu suất cao và dễ tiếp cận.

Những người đóng góp

Bình luận