Chuyển đến nội dung

YOLO26 so với YOLOv8: So sánh kỹ thuật các mô hình detect đối tượng SOTA

Trong bối cảnh thị giác máy tính phát triển nhanh chóng, việc cập nhật các kiến trúc SOTA (state-of-the-art) mới nhất là rất quan trọng đối với các kỹ sư và nhà nghiên cứu. Ultralytics đã liên tục vượt qua các giới hạn của detect đối tượng thời gian thực, và việc phát hành YOLO26 đánh dấu một bước tiến đáng kể so với phiên bản tiền nhiệm rất thành công của nó, YOLOv8.

Phân tích toàn diện này đi sâu vào những khác biệt kỹ thuật, các chỉ số hiệu suất và đổi mới kiến trúc giúp phân biệt hai mô hình mạnh mẽ này, giúp bạn quyết định mô hình nào phù hợp nhất với nhu cầu triển khai cụ thể của mình.

Tóm tắt điều hành

Trong khi YOLOv8 vẫn là một tiêu chuẩn mạnh mẽ và được áp dụng rộng rãi, nổi tiếng về tính linh hoạt và hệ sinh thái mạnh mẽ của nó, YOLO26 giới thiệu những thay đổi kiến trúc đột phá—đáng chú ý nhất là thiết kế end-to-end nguyên bản—mang lại tốc độ suy luận nhanh hơn trên CPU và độ chính xác được cải thiện cho các đối tượng nhỏ.

Đánh giá nhanh

Chọn YOLOv8 nếu bạn cần một mô hình đã được thử nghiệm kỹ lưỡng với sự hỗ trợ cộng đồng lớn và các tích hợp kế thừa hiện có.

Chọn YOLO26 cho các dự án mới yêu cầu hiệu quả tối đa, triển khai không NMS và hiệu suất vượt trội trên các thiết bị biên.

Sự tiến hóa kiến trúc

Quá trình chuyển đổi từ YOLOv8 sang YOLO26 liên quan đến những thay đổi cơ bản trong cách mạng lưới xử lý hình ảnh và dự đoán bounding box.

Kiến trúc YOLOv8

Được phát hành vào đầu năm 2023, YOLOv8 đã giới thiệu cơ chế detect không anchor với một decoupled head, xử lý các tác vụ objectness, phân loại và hồi quy một cách độc lập. Nó sử dụng một backbone CSPDarknet53 đã được sửa đổi với các module C2f để tăng cường trích xuất đặc trưng. Mặc dù rất hiệu quả, YOLOv8 vẫn dựa vào Non-Maximum Suppression (NMS) trong quá trình hậu xử lý để lọc các bounding box chồng chéo, điều này có thể gây ra độ trễ và sự phức tạp trong quá trình triển khai.

Những đổi mới của YOLO26

YOLO26 được xây dựng dựa trên nền tảng này nhưng đơn giản hóa triệt để quy trình suy luận.

  • Thiết kế End-to-End không NMS: Bằng cách loại bỏ NMS, YOLO26 hợp lý hóa việc triển khai. Đầu ra của mô hình là kết quả detect cuối cùng, loại bỏ nhu cầu về logic hậu xử lý phức tạp trong các wrapper C++ hoặc python.
  • Loại bỏ DFL: Việc loại bỏ Distribution Focal Loss (DFL) đơn giản hóa quá trình xuất sang các định dạng như ONNXTensorRT, tăng cường khả năng tương thích với các thiết bị biên công suất thấp.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ những đổi mới trong huấn luyện LLM từ Kimi K2 của Moonshot AI, YOLO26 sử dụng kết hợp giữa SGD và Muon. Điều này mang lại động lực huấn luyện ổn định hơn và hội tụ nhanh hơn so với các bộ tối ưu hóa tiêu chuẩn.
  • ProgLoss + STAL: Việc giới thiệu Progressive Loss Balancing và Small-Target-Aware Label Assignment giúp tăng cường đáng kể hiệu suất trên các đối tượng nhỏ, một điểm yếu truyền thống trong detect đối tượng.

Tìm hiểu thêm về YOLO26

Điểm chuẩn hiệu suất

Bảng sau đây so sánh hiệu suất của YOLO26 với YOLOv8 trên tập dữ liệu COCO. YOLO26 thể hiện sự đánh đổi tốc độ-độ chính xác vượt trội, đặc biệt trong môi trường CPU, nơi nó đạt được tốc độ suy luận nhanh hơn tới 43%.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Các chỉ số dựa trên môi trường thử nghiệm tiêu chuẩn. Tốc độ thường ưu tiên YOLO26 trên CPU nhờ các tối ưu hóa kiến trúc.

Tính linh hoạt của tác vụ

Cả hai mô hình đều không giới hạn ở bounding box. Chúng hỗ trợ một loạt các tác vụ thị giác máy tính, đảm bảo các nhà phát triển có thể gắn bó với một framework duy nhất cho các nhu cầu khác nhau.

  • Phân đoạn đối tượng (Instance Segmentation): YOLO26 giới thiệu những cải tiến cụ thể về hàm mất mát phân đoạn ngữ nghĩa.
  • Ước tính tư thế (Pose Estimation): Sử dụng Residual Log-Likelihood Estimation (RLE) trong YOLO26 để có các keypoint chính xác hơn.
  • OBB: Hàm mất mát góc chuyên biệt trong YOLO26 giải quyết các vấn đề về ranh giới thường gặp trong ảnh chụp từ trên không.

Huấn luyện và Dễ sử dụng

Một trong những đặc trưng của hệ sinh thái Ultralytics là tính dễ sử dụng. Cả YOLOv8 và YOLO26 đều chia sẻ cùng một API Python trực quan và giao diện CLI.

Ví dụ API python

Việc chuyển đổi từ YOLOv8 sang YOLO26 đơn giản như việc thay đổi tên tệp trọng số mô hình. Mã nguồn vẫn giữ nguyên, bảo toàn khoản đầu tư của bạn vào quy trình làm việc của Ultralytics.

from ultralytics import YOLO

# Load a pretrained YOLO26 model (previously "yolov8n.pt")
model = YOLO("yolo26n.pt")

# Train the model on a custom dataset
# Efficient training with lower memory overhead than transformers
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with NMS-free output
results = model("https://ultralytics.com/images/bus.jpg")

Lợi ích của Hệ sinh thái

Dù bạn chọn YOLOv8 hay YOLO26, bạn đều được hưởng lợi từ hệ sinh thái Ultralytics mạnh mẽ. Điều này bao gồm khả năng tích hợp liền mạch với các công cụ như Roboflow để quản lý tập dữ liệu, Weights & Biases để theo dõi thử nghiệm và dễ dàng xuất sang các định dạng như CoreML, TFLite và OpenVINO.

Tìm hiểu thêm về YOLOv8

Các trường hợp sử dụng lý tưởng

Khi nào nên sử dụng YOLO26

  • Điện toán biên (Edge Computing): Nếu bạn triển khai trên Raspberry Pi, thiết bị di động hoặc Jetson Nano, việc tăng tốc độ CPU 43% và giảm FLOPs khiến YOLO26 trở thành lựa chọn vượt trội.
  • Phát hiện vật thể nhỏ: Các ứng dụng trong nông nghiệp (phát hiện sâu bệnh) hoặc giám sát trên không được hưởng lợi đáng kể từ các hàm STAL và ProgLoss.
  • Hệ thống thời gian thực yêu cầu độ trễ thấp: Việc loại bỏ NMS đảm bảo thời gian suy luận xác định, rất quan trọng đối với robot và xe tự hành.

Khi nào nên sử dụng YOLOv8

  • Hệ thống kế thừa: Nếu quy trình sản xuất của bạn đã được tối ưu hóa cao cho logic xử lý của YOLOv8 và bạn không thể ngay lập tức tái cấu trúc các bước hậu xử lý.
  • Khả năng tương thích rộng nhất: Mặc dù YOLO26 có khả năng tương thích cao, YOLOv8 đã ra mắt lâu hơn và có sự hỗ trợ rộng rãi từ cộng đồng trên các diễn đàn cho các trường hợp biên đặc thù.

Kết luận

Cả YOLO26 và YOLOv8 đều đại diện cho đỉnh cao của công nghệ phát hiện vật thể. YOLOv8 vẫn là một công cụ đáng tin cậy với lượng người dùng khổng lồ. Tuy nhiên, YOLO26 tiến xa hơn, mang đến một giải pháp nhẹ hơn, nhanh hơn và chính xác hơn, giải quyết triệt để nút thắt cổ chai NMS. Đối với các nhà phát triển muốn bảo vệ ứng dụng của mình trong tương lai bằng AI hiệu quả nhất hiện có, YOLO26 là con đường được khuyến nghị.

Đọc thêm

Đối với những ai quan tâm đến việc khám phá các tùy chọn khác trong gia đình Ultralytics, hãy xem xét YOLO11, một cầu nối giữa v8 và 26, hoặc các mô hình chuyên biệt như YOLO-World để phát hiện từ vựng mở.

Chi tiết mô hình

YOLO26 Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2026-01-14
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolo26/

YOLOv8 Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolov8/


Bình luận