Meet YOLO26: next-gen vision AI.

Link to this sectionSo sánh mô hình: Chọn mô hình phát hiện đối tượng tốt nhất cho dự án của bạn#

Việc lựa chọn kiến trúc mạng thần kinh phù hợp là nền tảng của mọi dự án computer vision thành công. Chào mừng bạn đến với Ultralytics Model Comparison Hub! Trang này tập trung các phân tích kỹ thuật chi tiết và các điểm chuẩn hiệu năng, mổ xẻ những đánh đổi giữa Ultralytics YOLO26 mới nhất và các kiến trúc hàng đầu khác như YOLO11, YOLOv10, RT-DETR và EfficientDet.

Cho dù ứng dụng của bạn yêu cầu độ trễ mili giây của edge AI hay độ chính xác cao cần thiết cho hình ảnh y tế, hướng dẫn này cung cấp những thông tin dựa trên dữ liệu cần thiết để đưa ra lựa chọn sáng suốt. Chúng tôi đánh giá các mô hình dựa trên mean Average Precision (mAP), inference speed, hiệu quả tham số và sự dễ dàng trong triển khai.

Link to this sectionĐiểm chuẩn hiệu năng tương tác#

Việc trực quan hóa mối quan hệ giữa tốc độ và độ chính xác là rất cần thiết để xác định "Pareto frontier" của việc phát hiện đối tượng—những mô hình cung cấp độ chính xác tốt nhất cho một giới hạn tốc độ nhất định. Biểu đồ dưới đây so sánh các chỉ số chính trên các datasets like COCO tiêu chuẩn.

This chart visualizes key performance metrics enabling you to quickly assess the trade-offs between different models. Understanding these metrics is fundamental to selecting a model that aligns with your specific deployment constraints.

Link to this sectionHướng dẫn quyết định nhanh#

Không chắc nên bắt đầu từ đâu? Hãy sử dụng cây quyết định này để thu hẹp phạm vi kiến trúc phù hợp nhất với các yêu cầu về phần cứng và hiệu năng của bạn.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

Link to this sectionBối cảnh hiện tại: YOLO26 và hơn thế nữa#

Lĩnh vực phát hiện đối tượng đang tiến triển nhanh chóng. Trong khi các mô hình cũ vẫn phù hợp để hỗ trợ kế thừa, các kiến trúc mới đang đẩy lùi giới hạn của những gì có thể thực hiện được.

Link to this sectionUltralytics YOLO26#

Được phát hành vào tháng 1 năm 2026, YOLO26 là mô hình hiện đại (SOTA) mới nhất và là điểm khởi đầu được khuyến nghị cho tất cả các dự án mới. Nó giới thiệu những đổi mới kiến trúc mang tính đột phá, bao gồm Thiết kế End-to-End NMS-Free giúp loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression, dẫn đến thời gian suy luận nhanh hơn và dễ dự đoán hơn. YOLO26 nhanh hơn tới 43% trên CPU so với các thế hệ trước, khiến nó trở nên lý tưởng cho triển khai tại biên.

Các đổi mới chính bao gồm:

  • NMS-Free End-to-End: Triển khai đơn giản hóa mà không cần xử lý hậu kỳ
  • Loại bỏ DFL: Tối ưu hóa xuất sang ONNX, TensorRT và CoreML
  • Bộ tối ưu hóa MuSGD: Bộ tối ưu hóa kết hợp SGD/Muon được lấy cảm hứng từ đào tạo LLM cho sự hội tụ ổn định
  • ProgLoss + STAL: Hiệu suất phát hiện đối tượng nhỏ được tăng cường
Tại sao chọn YOLO26?

YOLO26 đại diện cho đỉnh cao của kỹ thuật Ultralytics, kết hợp những ưu điểm về hiệu suất của CNN với khả năng end-to-end giống như Transformer. Nó hỗ trợ tất cả các tác vụ—phát hiện, phân đoạn, ước tính tư thế, phân loại và OBB—trong khi nhỏ hơn, nhanh hơn và dễ triển khai hơn bao giờ hết.

Link to this sectionUltralytics YOLO11#

YOLO11 vẫn là một mô hình có năng lực cao, giảm 22% số lượng tham số so với YOLOv8 trong khi cải thiện độ chính xác phát hiện. Nó được hỗ trợ đầy đủ và được khuyến nghị cho người dùng cần sự ổn định đã được kiểm chứng hoặc có các quy trình YOLO11 hiện có.

Link to this sectionCác mô hình cộng đồng: Lưu ý về YOLO12 và YOLO13#

Bạn có thể bắt gặp các tham chiếu đến YOLO12 hoặc YOLO13 trong các thảo luận hoặc kho lưu trữ cộng đồng.

Cảnh báo sản xuất

Hiện tại chúng tôi không khuyến nghị YOLO12 hoặc YOLO13 cho việc sử dụng trong sản xuất.

  • YOLO12: Sử dụng các lớp chú ý (attention layers) thường gây ra sự không ổn định khi đào tạo, tiêu tốn bộ nhớ quá mức và tốc độ suy luận trên CPU chậm hơn đáng kể.
  • YOLO13: Các điểm chuẩn cho thấy chỉ đạt được mức tăng độ chính xác không đáng kể so với YOLO11 trong khi lại lớn hơn và chậm hơn. Các kết quả được báo cáo cho thấy có vấn đề về khả năng tái lập.


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

Link to this sectionSo sánh chi tiết các mô hình#

Khám phá các phân tích kỹ thuật chuyên sâu của chúng tôi để hiểu các khác biệt kiến trúc cụ thể, như lựa chọn backbone, thiết kế head và hàm mất mát. Chúng tôi đã sắp xếp chúng theo mô hình để dễ dàng truy cập:

Link to this sectionYOLO26 so với#

YOLO26 là mô hình Ultralytics mới nhất với tính năng phát hiện end-to-end không cần NMS, bộ tối ưu hóa MuSGD và suy luận trên CPU nhanh hơn tới 43%. Nó được tối ưu hóa cho triển khai tại biên trong khi đạt được độ chính xác hiện đại.

Link to this sectionYOLO11 so với#

YOLO11 xây dựng dựa trên thành công của những người tiền nhiệm với các nghiên cứu tiên tiến. Nó có kiến trúc backbone và neck cải tiến để trích xuất đặc trưng tốt hơn và hiệu quả được tối ưu hóa.

Link to this sectionYOLOv10 so với#

Được phát triển bởi Đại học Thanh Hoa, YOLOv10 tập trung vào việc loại bỏ bước Non-Maximum Suppression (NMS) để giảm biến động độ trễ, cung cấp hiệu suất hàng đầu với chi phí tính toán giảm.

Link to this sectionYOLOv9 so với#

YOLOv9 giới thiệu Programmable Gradient Information (PGI) và Generalized Efficient Layer Aggregation Network (GELAN) để giải quyết tình trạng mất thông tin trong mạng thần kinh sâu.

Link to this sectionYOLOv8 so với#

Ultralytics YOLOv8 vẫn là một lựa chọn rất phổ biến, với kiến trúc backbone và neck tiên tiến cùng split head không dùng anchor để có sự đánh đổi chính xác-tốc độ tối ưu.

Link to this sectionYOLOv7 so với#

YOLOv7 giới thiệu "túi kỹ thuật" (trainable bag-of-freebies) và kỹ thuật tái tham số hóa model (model re-parameterization), tập trung vào việc tối ưu hóa quy trình huấn luyện mà không làm tăng chi phí inference.

Link to this sectionYOLOv6 so với#

YOLOv6 của Meituan được thiết kế cho các ứng dụng công nghiệp, với các module Bi-directional Concatenation (BiC) và chiến lược huấn luyện hỗ trợ bằng anchor.

Link to this sectionYOLOv5 so với#

Ultralytics YOLOv5 nổi tiếng về tính dễ sử dụng, độ ổn định và tốc độ. Đây vẫn là lựa chọn mạnh mẽ cho các dự án yêu cầu khả năng tương thích với nhiều loại thiết bị.

Link to this sectionRT-DETR so với#

RT-DETR (Real-Time Detection Transformer) tận dụng Transformer thị giác để đạt độ chính xác cao với hiệu suất thời gian thực, vượt trội trong việc hiểu bối cảnh toàn cục.

Link to this sectionPP-YOLOE+ so với#

PP-YOLOE+, được phát triển bởi Baidu, sử dụng Task Alignment Learning (TAL) và phần đầu (head) tách rời để cân bằng giữa hiệu suất và độ chính xác.

Link to this sectionDAMO-YOLO so với#

Từ Alibaba Group, DAMO-YOLO sử dụng Neural Architecture Search (NAS) và RepGFPN hiệu quả để tối đa hóa độ chính xác trên các tập benchmark tĩnh.

Link to this sectionYOLOX so với#

YOLOX, được phát triển bởi Megvii, là một sự tiến hóa không dùng anchor (anchor-free), nổi tiếng với phần đầu tách rời và chiến lược gán nhãn SimOTA.

Link to this sectionEfficientDet so với#

EfficientDet của Google Brain sử dụng kỹ thuật compound scaling và BiFPN để tối ưu hóa hiệu quả tham số, cung cấp một loạt các model (D0-D7) cho các giới hạn khác nhau.

Chỉ mục này được cập nhật liên tục khi các model mới được phát hành và các benchmark được tinh chỉnh. Chúng tôi khuyến khích bạn khám phá các tài nguyên này để tìm ra lựa chọn phù hợp nhất cho dự án computer vision tiếp theo của mình. Nếu bạn đang tìm kiếm các giải pháp cấp doanh nghiệp với cấp phép riêng, vui lòng truy cập Trang cấp phép của chúng tôi. Chúc bạn so sánh thành công!

Bình luận