Meet YOLO26: next-gen vision AI.

Link to this sectionSo sánh YOLOv10 và YOLOv5#

Việc lựa chọn kiến trúc mạng nơ-ron phù hợp là yếu tố sống còn để triển khai thành công các quy trình computer vision trong môi trường production. Trang này cung cấp phân tích kỹ thuật chuyên sâu so sánh YOLOv10YOLOv5, hai model có tầm ảnh hưởng lớn trong quá trình phát triển của công nghệ phát hiện đối tượng thời gian thực. Mặc dù cả hai model đều tạo ra những tác động đáng kể đến cộng đồng AI, chúng đại diện cho các kỷ nguyên và triết lý thiết kế kiến trúc học sâu khác nhau.

Hướng dẫn này đánh giá các kiến trúc dựa trên mean Average Precision (mAP), độ trễ suy luận, hiệu suất tham số và sự hỗ trợ từ hệ sinh thái, giúp bạn chọn model tốt nhất cho nhu cầu triển khai của mình.

Link to this sectionTổng quan về mô hình#

Link to this sectionYOLOv10: Phát hiện vật thể End-to-End thời gian thực#

Được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, YOLOv10 giới thiệu một phương pháp mới để phát hiện đối tượng bằng cách loại bỏ nhu cầu xử lý hậu kỳ (post-processing).

Bước đột phá mang tính định hình của YOLOv10 là Thiết kế End-to-End NMS-Free. Trước đây, các model YOLO dựa vào Non-Maximum Suppression (NMS) để lọc các bounding box dư thừa. YOLOv10 sử dụng cơ chế gán kép nhất quán cho quá trình đào tạo không cần NMS, giúp giảm đáng kể sự thay đổi về độ trễ suy luận và đơn giản hóa logic triển khai. Ngoài ra, kiến trúc này có thiết kế toàn diện hướng tới hiệu suất và độ chính xác, giúp tối ưu hóa triệt để các thành phần nhằm giảm thiểu tính dư thừa trong tính toán.

Tìm hiểu thêm về YOLOv10

Link to this sectionYOLOv5: Tiêu chuẩn công nghiệp về khả năng sử dụng#

Ra mắt ngay sau khi kho lưu trữ PyTorch của Ultralytics được thành lập, YOLOv5 đã định nghĩa lại kỳ vọng của các nhà phát triển đối với một framework AI thị giác nguồn mở. Đây vẫn là một trong những kiến trúc được triển khai rộng rãi nhất trên toàn cầu.

YOLOv5 nổi tiếng nhờ Khả năng dễ sử dụngHệ sinh thái được duy trì tốt. Được viết hoàn toàn bằng PyTorch, framework này cung cấp trải nghiệm "zero-to-hero" mượt mà với khả năng hỗ trợ sẵn có cho việc đào tạo, xác thực và xuất sang các định dạng như ONNXTensorRT. Khác với YOLOv10, vốn tập trung chủ yếu vào phát hiện đối tượng thuần túy, YOLOv5 thể hiện sự Đa năng vượt trội, hỗ trợ instance segmentationimage classification trong cùng một Python API thống nhất.

Tìm hiểu thêm về YOLOv5

Link to this sectionSo sánh Hiệu năng và Chỉ số#

Việc hình dung mối quan hệ giữa tốc độ và độ chính xác là rất cần thiết để xác định các model cung cấp độ chính xác tốt nhất cho một giới hạn tốc độ nhất định. Hiểu rõ các performance metrics này là nền tảng để lựa chọn model phù hợp với các ràng buộc phần cứng cụ thể của bạn.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionPhân tích kỹ thuật#

  1. Độ chính xác (mAP): YOLOv10 cho thấy lợi thế thế hệ rõ rệt về độ chính xác. Ví dụ, model YOLOv10-X đạt 54.4% mAPval, vượt trội hơn YOLOv5x (50.7% mAP). Bước tiến này phần lớn nhờ vào chiến lược đào tạo không cần NMS và các cải tiến kiến trúc được giới thiệu vào năm 2024.
  2. Độ trễ suy luận: Trong khi các model YOLOv5 cực kỳ nhanh trên các benchmark T4 TensorRT thô (ví dụ: YOLOv5n ở mức 1.12ms), YOLOv10 loại bỏ hoàn toàn bước NMS xử lý hậu kỳ. Trong các triển khai thực tế end-to-end, thiết kế NMS-free của YOLOv10 mang lại độ trễ ổn định và mang tính xác định hơn, điều này rất quan trọng cho các ứng dụng thời gian thực như autonomous vehicles và robot.
  3. Hiệu suất tham số: Các model YOLOv10 duy trì Sự cân bằng hiệu suất mang tính cạnh tranh cao. YOLOv10-S đạt 46.7% mAP với chỉ 7.2M tham số, trong khi YOLOv5s đạt 37.4% mAP với 9.1M tham số.
Mẹo triển khai

Khi triển khai trên các thiết bị edge AI như NVIDIA Jetson, các model không có logic NMS (như YOLOv10 và YOLO26) thường biên dịch sạch hơn sang TensorRT, tránh được các thao tác fallback về CPU.

Link to this sectionCác trường hợp sử dụng và Khuyến nghị#

Việc lựa chọn giữa YOLOv10 và YOLOv5 phụ thuộc vào yêu cầu dự án cụ thể, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Link to this sectionKhi nào nên chọn YOLOv10#

YOLOv10 là một lựa chọn mạnh mẽ cho:

  • Phát hiện thời gian thực không cần NMS: Các ứng dụng hưởng lợi từ việc phát hiện đầu cuối (end-to-end) mà không cần NMS, giúp giảm độ phức tạp khi triển khai.
  • Sự cân bằng giữa tốc độ và độ chính xác: Các dự án yêu cầu sự cân bằng mạnh mẽ giữa tốc độ suy luận và độ chính xác của phát hiện trên nhiều quy mô model khác nhau.
  • Các ứng dụng có độ trễ nhất quán: Các kịch bản triển khai nơi thời gian suy luận có thể dự đoán được là yếu tố quan trọng, chẳng hạn như robotics hoặc các hệ thống tự hành.

Link to this sectionKhi nào nên chọn YOLOv5#

YOLOv5 được khuyến nghị cho:

  • Hệ thống sản xuất đã được kiểm chứng: Các hệ thống triển khai hiện có, nơi mà lịch sử lâu dài về tính ổn định, tài liệu đầy đủ và sự hỗ trợ cộng đồng khổng lồ của YOLOv5 được đánh giá cao.
  • Huấn luyện hạn chế tài nguyên: Các môi trường có tài nguyên GPU hạn chế, nơi đường ống huấn luyện hiệu quả và yêu cầu bộ nhớ thấp hơn của YOLOv5 mang lại nhiều lợi thế.
  • Hỗ trợ định dạng xuất mở rộng: Các dự án yêu cầu triển khai trên nhiều định dạng bao gồm ONNX, TensorRT, CoreMLTFLite.

Link to this sectionKhi nào nên chọn Ultralytics (YOLO26)#

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm nhà phát triển:

  • Triển khai Edge không cần NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không có sự phức tạp của hậu xử lý Non-Maximum Suppression.
  • Môi trường chỉ dùng CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các kịch bản đầy thách thức như hình ảnh máy bay không người lái trên không hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các vật thể cực nhỏ.

Link to this sectionLợi thế từ Ultralytics#

Mặc dù YOLOv10 cung cấp khả năng phát hiện tuyệt vời, việc dựa vào các kho lưu trữ học thuật đôi khi có thể làm phức tạp hóa các quy trình production. Bằng cách sử dụng Ultralytics Python package chính thức, bạn có quyền truy cập vào một hệ sinh thái thống nhất hỗ trợ cả YOLOv5 và YOLOv10, cùng với các tính năng nâng cao.

  • Hiệu suất đào tạo: Các kiến trúc Ultralytics YOLO được tối ưu hóa sâu cho các memory requirements thấp hơn trong quá trình đào tạo. Không giống như các model Transformer nặng (như RT-DETR) yêu cầu bộ nhớ CUDA khổng lồ, bạn có thể đào tạo thoải mái YOLOv5 và YOLOv10 trên các GPU tiêu dùng tiêu chuẩn.
  • Tích hợp hệ sinh thái: Việc tích hợp với Ultralytics Platform cho phép các nhà phát triển quản lý trực quan dữ liệu, theo dõi các thử nghiệm bằng Weights & Biases và tự động tinh chỉnh siêu tham số.

Link to this sectionVí dụ mã: Đào tạo liền mạch#

Sử dụng thư viện Ultralytics, việc chuyển đổi giữa các kiến trúc này đơn giản như việc thay đổi chuỗi model. Quy trình đào tạo sẽ tự động xử lý việc tăng cường dữ liệu, điều chỉnh tỷ lệ và cấu hình bộ tối ưu hóa (optimizer).

from ultralytics import YOLO

# To use YOLOv5:
# model = YOLO("yolov5s.pt")

# To use YOLOv10:
model = YOLO("yolov10s.pt")

# Train the model on a custom dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device=0,  # Use GPU 0
)

# Export the trained model to ONNX format
path = model.export(format="onnx")

Link to this sectionThế hệ tiếp theo: Ultralytics YOLO26#

Nếu bạn đang bắt đầu một dự án machine learning mới ngay hôm nay, chúng tôi đặc biệt khuyến nghị đánh giá model Ultralytics YOLO26 mới nhất. Ra mắt vào tháng 1 năm 2026, đây là đại diện tiêu biểu cho trạng thái kỹ thuật tiên tiến nhất bằng cách kết hợp những đổi mới tốt nhất của năm năm qua.

YOLO26 tích hợp nguyên bản Thiết kế End-to-End NMS-Free tiên phong từ YOLOv10, đảm bảo việc triển khai nhanh chóng và mang tính xác định. Hơn nữa, YOLO26 giới thiệu một số bước đột phá quan trọng:

  • Tăng tốc suy luận CPU lên đến 43%: Bằng cách loại bỏ mô-đun Distribution Focal Loss (DFL), YOLO26 đạt được sự tăng tốc lớn trên các CPU tiêu chuẩn, khiến nó trở thành lựa chọn hàng đầu cho mobile deployment và các cảm biến IoT công suất thấp.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật đào tạo Large Language Model (LLM) như Kimi K2 của Moonshot AI, YOLO26 sử dụng sự kết hợp giữa SGD và Muon. Điều này đảm bảo quá trình đào tạo cực kỳ ổn định và tốc độ hội tụ nhanh hơn đáng kể so với các bộ tối ưu hóa AdamW được sử dụng trong YOLOv10.
  • ProgLoss + STAL: Những hàm loss nâng cao này mang lại sự cải thiện đáng kể trong nhận diện đối tượng nhỏ, yếu tố quan trọng cho các ứng dụng drone imagery và an ninh trên không.
  • Làm chủ tác vụ chuyên biệt: Trong khi YOLOv10 chỉ thuần túy là bộ phát hiện bounding box, YOLO26 cung cấp các cải tiến kiến trúc chuyên dụng cho tất cả các tác vụ, bao gồm Residual Log-Likelihood Estimation (RLE) cho Pose và các hàm loss góc chuyên biệt cho Oriented Bounding Boxes (OBB).
Khám phá thêm

Nếu bạn đang khám phá bối cảnh rộng lớn hơn của việc phát hiện đối tượng, bạn cũng có thể quan tâm đến việc so sánh các kiến trúc này với các framework khác. Hãy xem các bài phân tích sâu của chúng tôi về YOLO11 vs EfficientDet hoặc RT-DETR vs YOLOv8 để có kết quả benchmark toàn diện hơn.

Cho dù bạn dựa vào di sản mạnh mẽ của YOLOv5, sự đổi mới NMS-free của YOLOv10, hay hiệu suất cắt cạnh vô song của YOLO26, hệ sinh thái Ultralytics cung cấp các công cụ cần thiết để đưa các ứng dụng thị giác AI của bạn vào thực tế một cách nhanh chóng và hiệu quả.

Những người đóng góp

Bình luận