YOLOv8 so với YOLO26: Sự tiến hóa của công nghệ phát hiện đối tượng thời gian thực từ Ultralytics

Lĩnh vực thị giác máy tính (computer vision) đã chứng kiến những tiến bộ vượt bậc trong vài năm qua. Một trong những kiến trúc phổ biến nhất cho các ứng dụng thời gian thực là các model được phát triển bởi Ultralytics. Hướng dẫn toàn diện này cung cấp so sánh kỹ thuật chi tiết giữa Ultralytics YOLOv8 mang tính đột phá và Ultralytics YOLO26 mới nhất hiện nay. Chúng tôi sẽ phân tích kiến trúc, các chỉ số hiệu năng và các trường hợp sử dụng lý tưởng để giúp bạn chọn model phù hợp nhất cho quá trình triển khai của mình.

Tổng quan về các model

Cả YOLOv8 và YOLO26 đều đại diện cho những cột mốc quan trọng trong họ model YOLO. Chúng có chung triết lý cốt lõi của Ultralytics: cung cấp các model nhanh, chính xác và cực kỳ dễ sử dụng thông qua môi trường Python và API thống nhất.

YOLOv8: Tiêu chuẩn đa năng

Được ra mắt vào đầu năm 2023, YOLOv8 mang đến một cuộc đại tu lớn cho framework YOLO, với thiết kế không sử dụng anchor (anchor-free) và hỗ trợ mạnh mẽ cho nhiều tác vụ thị giác máy tính.

YOLOv8 nhanh chóng trở thành tiêu chuẩn ngành nhờ sự cân bằng về hiệu năng vượt trội và khả năng tích hợp sâu vào hệ sinh thái Ultralytics. Model này hỗ trợ nguyên bản các tác vụ phát hiện đối tượng, phân đoạn cá thể, ước tính tư thếphân loại hình ảnh. Tuy nhiên, nó vẫn dựa vào Non-Maximum Suppression (NMS) tiêu chuẩn cho quá trình xử lý hậu kỳ, điều này có thể gây ra hiện tượng nghẽn độ trễ trong các môi trường edge bị giới hạn cao.

Tìm hiểu thêm về YOLOv8

YOLO26: Sức mạnh thế hệ mới cho Edge AI

Được ra mắt vào tháng 1 năm 2026, YOLO26 kế thừa nền tảng từ các phiên bản tiền nhiệm và tối ưu hóa mạnh mẽ cho các kịch bản triển khai hiện đại, đặc biệt là trong các thiết bị Edge AI và thiết bị công suất thấp.

YOLO26 giới thiệu một số cải tiến kỹ thuật mang tính thay đổi mô hình. Đáng chú ý nhất là Thiết kế NMS-Free End-to-End. Được tiên phong bởi YOLOv10, kiến trúc này loại bỏ hoàn toàn nhu cầu về xử lý hậu kỳ NMS, giúp đơn giản hóa đáng kể quy trình xuất (export) và giảm độ trễ. Hơn nữa, việc loại bỏ Distribution Focal Loss (DFL) giúp tinh gọn head phát hiện, giúp model trở nên cực kỳ thân thiện khi triển khai trên phần cứng Edge AI.

Tìm hiểu thêm về YOLO26

Các mô hình Ultralytics khác

Mặc dù YOLOv8 và YOLO26 cực kỳ mạnh mẽ, bạn cũng có thể cân nhắc YOLO11 – cầu nối giữa hai thế hệ với kiến trúc tinh chỉnh, hoặc YOLOv5 cho các tích hợp legacy đặc thù.

Các đổi mới về kiến trúc và huấn luyện

YOLO26 mang đến một số tiến bộ chuyên sâu giúp cải thiện đáng kể so với nền tảng của YOLOv8.

Huấn luyện tối ưu với MuSGD

Hiệu quả huấn luyện là dấu ấn của các model Ultralytics, vốn thường yêu cầu bộ nhớ thấp hơn nhiều so với các kiến trúc dựa trên Transformer cồng kềnh như RT-DETR. YOLO26 tăng cường điều này hơn nữa với việc giới thiệu Bộ tối ưu hóa MuSGD. Lấy cảm hứng từ các kỹ thuật huấn luyện Large Language Model (LLM) (cụ thể là Kimi K2 của Moonshot AI), sự kết hợp giữa Stochastic Gradient Descent (SGD) và Muon này đảm bảo sự hội tụ nhanh hơn và động lực học huấn luyện ổn định trên các tập dữ liệu phức tạp.

Các hàm Loss nâng cao

Đối với các tác vụ yêu cầu độ chính xác cao như hình ảnh từ máy bay không người lái hoặc cảm biến IoT, YOLO26 giới thiệu ProgLoss + STAL. Những hàm mất mát (loss function) cải tiến này mang lại sự nâng cấp đáng kể trong việc nhận diện các đối tượng nhỏ. Ngoài ra, YOLO26 còn có những cải tiến theo tác vụ: multi-scale proto cho việc tạo mask vượt trội trong phân đoạn, Residual Log-Likelihood Estimation (RLE) để ước tính tư thế chính xác hơn, và angle loss chuyên biệt để giải quyết các vấn đề biên trong phát hiện Oriented Bounding Box (OBB).

Phân tích và so sánh hiệu năng

Bảng dưới đây làm nổi bật sự khác biệt về hiệu năng giữa hai model khi sử dụng tập dữ liệu COCO. Các giá trị có hiệu năng tốt nhất trong từng hạng mục kích thước được in đậm.

Modelkích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
tham số
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLO26n64040.938.91.72.45.4
YOLOv8s64044.9128.42.6611.228.6
YOLO26s64048.687.22.59.520.7
YOLOv8m64050.2234.75.8625.978.9
YOLO26m64053.1220.04.720.468.2
YOLOv8l64052.9375.29.0643.7165.2
YOLO26l64055.0286.26.224.886.4
YOLOv8x64053.9479.114.3768.2257.8
YOLO26x64057.5525.811.855.7193.9

Phân tích các chỉ số

Dữ liệu cho thấy một bước nhảy vọt thế hệ. YOLO26 vượt trội hơn hẳn YOLOv8 trên tất cả các chỉ số. Model YOLO26 Nano (YOLO26n) đạt mức mAP ấn tượng 40.9, cao hơn đáng kể so với 37.3 của YOLOv8n, đồng thời sử dụng ít tham số và FLOP hơn.

Một trong những cải tiến nổi bật nhất là tốc độ suy luận (inference) trên CPU. Nhờ kiến trúc được tối ưu hóa và việc loại bỏ DFL, YOLO26 mang lại tốc độ suy luận CPU nhanh hơn tới 43% thông qua ONNX. Điều này khiến YOLO26 trở thành lựa chọn vô đối cho Raspberry Pi và các thiết bị edge tài nguyên thấp. Trong khi tốc độ GPU khi sử dụng TensorRT là tương đương ở cả hai model, hiệu quả về tham số của YOLO26 giúp giảm dấu chân bộ nhớ (memory footprint) trong cả quá trình huấn luyện và suy luận.

Dễ sử dụng và Hệ sinh thái

Cả hai model đều hưởng lợi rất lớn từ hệ sinh thái Ultralytics được duy trì tốt. Các nhà phát triển đánh giá cao tính dễ sử dụng nhờ API thống nhất, cho phép chuyển đổi giữa YOLOv8 và YOLO26 chỉ bằng cách thay đổi chuỗi tên model.

Cho dù bạn đang thực hiện tinh chỉnh siêu tham số, theo dõi thử nghiệm hay khám phá các tập dữ liệu mới, tài liệu của Ultralytics đều cung cấp tài nguyên phong phú. Ngoài ra, Nền tảng Ultralytics cung cấp cách thức hợp lý hóa để gán nhãn, huấn luyện và triển khai các model này một cách liền mạch lên đám mây hoặc tại chỗ (locally).

Ví dụ về mã

Bắt đầu huấn luyện và suy luận rất đơn giản. Dưới đây là ví dụ hoàn chỉnh, có thể chạy được bằng cách sử dụng Python API của Ultralytics:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=50,
    imgsz=640,
    device="cpu",  # Use '0' for GPU training
)

# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
results[0].show()

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
Sự đơn giản trong triển khai

Việc xuất YOLO26 sang các định dạng như CoreML hoặc OpenVINO mượt mà hơn đáng kể so với các model cũ nhờ kiến trúc không cần NMS, giúp loại bỏ các thao tác tùy chỉnh phức tạp khỏi đồ thị đã xuất.

Các trường hợp sử dụng lý tưởng

Việc chọn đúng model sẽ quyết định thành công cho dự án của bạn.

Khi nào nên chọn YOLO26:

  • Edge Computing & Robotics: Tốc độ CPU nhanh hơn 43% và không sử dụng NMS biến nó thành lựa chọn tốt nhất cho các hệ thống nhúng, thiết bị di động và robot tự hành.
  • Hình ảnh trên không và vệ tinh: Việc triển khai ProgLoss + STAL mang lại cho YOLO26 ưu thế rõ rệt trong việc phát hiện các đối tượng siêu nhỏ trong những bối cảnh độ phân giải cao và phức tạp.
  • Các dự án mới: Là bản phát hành ổn định mới nhất, YOLO26 là model được khuyến nghị cho bất kỳ pipeline machine learning nào, mang lại khả năng linh hoạt vượt trội cho mọi tác vụ.

Khi nào nên giữ lại YOLOv8:

  • Hạ tầng Legacy: Nếu pipeline sản xuất hiện tại của bạn đang phụ thuộc chặt chẽ vào các tensor đầu ra và cơ chế anchor cụ thể của YOLOv8, việc di chuyển (migration) có thể cần một số điều chỉnh nhỏ.
  • Tham chiếu học thuật: YOLOv8 vẫn là một baseline ổn định và được trích dẫn nhiều trong nghiên cứu thị giác máy tính học thuật khi so sánh với các kiến trúc cũ.

Tóm lại, trong khi YOLOv8 thiết lập một tiêu chuẩn phi thường cho các tác vụ thị giác thời gian thực, YOLO26 định nghĩa lại những gì có thể đạt được. Bằng cách kết hợp hiệu suất cực cao trên CPU với các bộ tối ưu hóa huấn luyện lấy cảm hứng từ LLM, YOLO26 đảm bảo các nhà phát triển có thể triển khai AI chính xác cao trên hầu hết mọi môi trường phần cứng.

Bình luận