Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 và YOLOv10#

Lĩnh vực thị giác máy tính thời gian thực đã chứng kiến sự tăng trưởng vượt bậc trong vài năm qua, với nhiều kiến trúc khác nhau liên tục đẩy mạnh giới hạn của những gì có thể thực hiện trên phần cứng hiện đại. Khi đánh giá các kiến trúc tiên tiến nhất, việc so sánh giữa YOLOv5YOLOv10 cho thấy một bước tiến hóa quan trọng trong lĩnh vực phát hiện đối tượng. Bài phân tích kỹ thuật chuyên sâu này khám phá các mô hình kiến trúc, sự đánh đổi về hiệu năng và cách các nhà phát triển có thể tận dụng những công cụ này trong môi trường sản xuất.

Link to this sectionPhân tích chuyên sâu về kiến trúc#

Việc hiểu rõ sự khác biệt về cấu trúc giữa các model này là yếu tố then chốt để triển khai chúng một cách hiệu quả trong thực tế.

Link to this sectionUltralytics YOLOv5: Tiêu chuẩn công nghiệp#

Được giới thiệu bởi Ultralytics, YOLOv5 từ lâu đã được công nhận nhờ sự cân bằng tuyệt vời giữa tốc độ, độ chính xác và tính dễ tiếp cận.

Tìm hiểu thêm về YOLOv5

YOLOv5 dựa trên cơ chế phát hiện anchor-based kết hợp với xương sống CSPDarknet được tối ưu hóa sâu. Kiến trúc này dựa nhiều vào các thao tác tiêu chuẩn được hỗ trợ trên hầu hết các công cụ suy luận (inference engine), khiến nó trở nên vô cùng linh hoạt. Điểm mạnh chính nằm ở Ultralytics Python SDK, cung cấp trải nghiệm người dùng tối ưu, API đơn giản và tài liệu mở rộng. Ngoài ra, yêu cầu bộ nhớ thấp hơn của YOLOv5 so với các model dựa trên Transformer giúp nó huấn luyện nhanh chóng trên các GPU tiêu dùng mà không bị gánh nặng VRAM lớn.

Link to this sectionYOLOv10: Tiến hóa mô hình#

Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 hướng tới việc giải quyết các nút thắt độ trễ cụ thể được tìm thấy trong các kiến trúc trước đó.

Tìm hiểu thêm về YOLOv10

Đặc điểm nổi bật của YOLOv10 là thiết kế không cần NMS (Non-Maximum Suppression). Bằng cách sử dụng nhất quán dual assignments trong quá trình huấn luyện, model loại bỏ nhu cầu hậu xử lý NMS trong quá trình suy luận. Việc giảm độ trễ về mặt lý thuyết này rất có lợi cho các bản triển khai chạy trên phần cứng cao cấp với khả năng tăng tốc NVIDIA TensorRT mạnh mẽ, mặc dù nó có thể tạo ra các phức tạp về cấu trúc cho các thiết bị cạnh (edge devices).

Lợi thế về hệ sinh thái

Trong khi YOLOv10 cung cấp những điểm mới lạ về kiến trúc, các model Ultralytics như YOLOv5 và YOLO26 mới hơn đều được hỗ trợ nguyên bản trong Ultralytics Platform, mang lại hiệu quả huấn luyện vượt trội, tự động tối ưu hóa siêu tham số và cung cấp sẵn nhiều tùy chọn xuất dữ liệu.

Link to this sectionPhân tích Hiệu suất#

Khi so sánh các model này, sự cân bằng giữa độ chính xác (mAP) và chi phí tính toán (độ trễ và tham số) sẽ quyết định trường hợp sử dụng tốt nhất. Dưới đây là so sánh hiệu năng kỹ thuật trên tập dữ liệu COCO.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 rõ ràng đạt được mAP50-95 cao hơn ở các quy mô kích thước tương đương nhờ tận dụng thiết kế model hiện đại dựa trên sự cân bằng giữa hiệu suất và độ chính xác. Tuy nhiên, YOLOv5 vẫn duy trì độ trễ cực kỳ cạnh tranh, đặc biệt là ở các phiên bản Nano và Small, khiến nó trở nên rất đáng tin cậy cho các môi trường nhúng bị hạn chế như dòng NVIDIA Jetson hoặc các CPU tiêu chuẩn thông qua OpenVINO.

Link to this sectionPhương pháp huấn luyện và Hệ sinh thái#

Giá trị của một model gắn liền mật thiết với hệ sinh thái bao quanh nó. Ultralytics duy trì một hệ sinh thái được chăm sóc đặc biệt tốt, hỗ trợ một loạt các tác vụ cực kỳ rộng rãi. Trong khi YOLOv10 chỉ tập trung nghiêm ngặt vào phát hiện đối tượng 2D, Ultralytics hỗ trợ nguyên bản các tác vụ phân đoạn cá thể, phân loại hình ảnh, ước tính tư thếhộp bao định hướng (OBB).

Hơn nữa, việc huấn luyện một model Ultralytics đòi hỏi gánh nặng bộ nhớ thấp hơn đáng kể so với các phương pháp dựa trên Transformer cạnh tranh, giúp chu trình phát triển nhanh chóng và tiết kiệm chi phí.

Link to this sectionThực thi code liền mạch#

Việc huấn luyện, xác thực và xuất model được hợp nhất dưới một API duy nhất. Bạn có thể chuyển đổi giữa các model chỉ bằng cách thay đổi một chuỗi văn bản.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")

# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")

# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes PyTorch CUDA acceleration
    batch=16,
)

# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa YOLOv5 và YOLOv10 phụ thuộc vào yêu cầu dự án cụ thể, hạn chế triển khai và tùy chọn hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn YOLOv5#

YOLOv5 là lựa chọn mạnh mẽ cho:

  • Hệ thống sản xuất đã được kiểm chứng: Các hệ thống triển khai hiện có, nơi mà lịch sử lâu dài về tính ổn định, tài liệu đầy đủ và sự hỗ trợ cộng đồng khổng lồ của YOLOv5 được đánh giá cao.
  • Huấn luyện hạn chế tài nguyên: Các môi trường có tài nguyên GPU hạn chế, nơi đường ống huấn luyện hiệu quả và yêu cầu bộ nhớ thấp hơn của YOLOv5 mang lại nhiều lợi thế.
  • Hỗ trợ định dạng xuất mở rộng: Các dự án yêu cầu triển khai trên nhiều định dạng bao gồm ONNX, TensorRT, CoreMLTFLite.

Link to this sectionKhi nào nên chọn YOLOv10#

YOLOv10 được khuyến nghị cho:

  • Phát hiện thời gian thực không cần NMS: Các ứng dụng hưởng lợi từ việc phát hiện đầu cuối (end-to-end) mà không cần NMS, giúp giảm độ phức tạp khi triển khai.
  • Sự cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng mạnh mẽ giữa tốc độ suy luận và độ chính xác của phát hiện trên nhiều quy mô model khác nhau.
  • Các ứng dụng có độ trễ nhất quán: Các kịch bản triển khai nơi thời gian suy luận có thể dự đoán được là yếu tố quan trọng, chẳng hạn như robotics hoặc các hệ thống tự hành.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionTương lai: Ultralytics YOLO26#

Mặc dù YOLOv5 đã cách mạng hóa khả năng tiếp cận và YOLOv10 đẩy mạnh giới hạn của kiến trúc không cần NMS, trạng thái công nghệ tiên tiến vẫn liên tục phát triển. Đối với các dự án mới, chúng tôi đặc biệt khuyến nghị sử dụng Ultralytics YOLO26 tiên phong, được ra mắt vào tháng 1 năm 2026.

YOLO26 hợp nhất độ tin cậy của hệ sinh thái Ultralytics với những tiến bộ mang tính đột phá:

  • Thiết kế NMS-Free End-to-End: Kết hợp mô hình không cần NMS trực tiếp vào framework Ultralytics, YOLO26 đơn giản hóa việc triển khai và đảm bảo độ trễ thấp hơn.
  • Suy luận CPU nhanh hơn tới 43%: Với việc loại bỏ Distribution Focal Loss (DFL), YOLO26 nhanh hơn rõ rệt trên các thiết bị cạnh không có GPU.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các cải tiến huấn luyện LLM từ Moonshot AI, trình tối ưu hóa MuSGD cung cấp sự ổn định chưa từng có và hội tụ nhanh chóng.
  • ProgLoss + STAL: Những hàm loss mới lạ này cải thiện đáng kể khả năng nhận diện đối tượng nhỏ, rất quan trọng cho các lĩnh vực như hình ảnh drone và robotics.

Bạn có thể quản lý, huấn luyện và triển khai YOLO26 trực tiếp thông qua Ultralytics Platform.

Link to this sectionKết luận#

Việc lựa chọn giữa YOLOv5 và YOLOv10 thường phụ thuộc vào các hạn chế cụ thể của dự án. YOLOv10 cung cấp mAP tuyệt vời cho các nhà nghiên cứu và các ứng dụng tận dụng thông lượng GPU thô. Ngược lại, YOLOv5 vẫn là một

Tuy nhiên, lĩnh vực thị giác máy tính rất năng động. Để tận dụng sự cân bằng hiệu năng tuyệt đối, tính linh hoạt và sự dễ sử dụng, các nhà phát triển nên hướng tới Ultralytics YOLO26. Nó gói gọn tốc độ của suy luận không cần NMS với hệ sinh thái Ultralytics mạnh mẽ, được ghi tài liệu đầy đủ, đảm bảo các giải pháp AI thị giác của bạn sẵn sàng cho tương lai. Đối với các trường hợp sử dụng chuyên biệt, các nhà phát triển cũng có thể khám phá YOLO11 để có độ bền bỉ chung, hoặc RT-DETR để đạt độ chính xác dựa trên Transformer.

Người đóng góp

Bình luận