Link to this sectionYOLOv8 so với YOLO26#
Lĩnh vực thị giác máy tính đã chứng kiến những tiến bộ đáng kinh ngạc trong vài năm qua. Một trong những kiến trúc phổ biến nhất cho các ứng dụng thời gian thực là các model được phát triển bởi Ultralytics. Hướng dẫn toàn diện này cung cấp so sánh kỹ thuật chi tiết giữa Ultralytics YOLOv8 mang tính đột phá và Ultralytics YOLO26 hiện đại nhất. Chúng tôi sẽ phân tích kiến trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng để giúp bạn chọn model phù hợp cho quá trình triển khai của mình.
Link to this sectionTổng quan về mô hình#
Cả YOLOv8 và YOLO26 đều đại diện cho các cột mốc quan trọng trong hệ sinh thái model YOLO. Chúng chia sẻ triết lý cốt lõi của Ultralytics: cung cấp các model nhanh, chính xác và cực kỳ dễ sử dụng thông qua môi trường Python và API thống nhất.
Link to this sectionYOLOv8: Tiêu chuẩn đa năng#
Được phát hành vào đầu năm 2023, YOLOv8 đã giới thiệu một cuộc đại tu lớn đối với framework YOLO, mang đến thiết kế không neo (anchor-free) và hỗ trợ mạnh mẽ cho nhiều tác vụ thị giác máy tính.
- Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2023-01-10
- GitHub: Kho lưu trữ Ultralytics
- Tài liệu: Tài liệu YOLOv8
YOLOv8 nhanh chóng trở thành tiêu chuẩn công nghiệp nhờ sự cân bằng hiệu suất tuyệt vời và khả năng tích hợp sâu vào hệ sinh thái Ultralytics. Model này hỗ trợ nguyên bản phát hiện đối tượng, phân đoạn đối tượng, ước tính tư thế và phân loại hình ảnh. Tuy nhiên, nó vẫn dựa vào Non-Maximum Suppression (NMS) tiêu chuẩn để hậu xử lý, điều này có thể gây ra hiện tượng nghẽn độ trễ trong các môi trường biên bị hạn chế tài nguyên nghiêm ngặt.
Link to this sectionYOLO26: Cỗ máy sức mạnh thế hệ mới cho thiết bị biên#
Được phát hành vào tháng 1 năm 2026, YOLO26 tận dụng nền tảng được xây dựng bởi những người tiền nhiệm và tối ưu hóa mạnh mẽ cho các kịch bản triển khai hiện đại, đặc biệt là trong AI biên và các thiết bị tiêu thụ năng lượng thấp.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2026-01-14
- GitHub: Kho lưu trữ Ultralytics
- Docs: Tài liệu YOLO26
YOLO26 giới thiệu một số cải tiến kỹ thuật mang tính thay đổi tư duy. Đáng chú ý nhất, nó có Thiết kế NMS-Free End-to-End. Được tiên phong ban đầu bởi YOLOv10, kiến trúc này loại bỏ sự cần thiết của hậu xử lý NMS, đơn giản hóa đáng kể các pipeline xuất dữ liệu và giảm sự biến thiên độ trễ. Hơn nữa, việc loại bỏ Distribution Focal Loss (DFL) giúp tinh giản head phát hiện, khiến nó trở nên cực kỳ thân thiện để triển khai trên phần cứng AI biên.
Link to this sectionĐổi mới về kiến trúc và đào tạo#
YOLO26 mang đến một số tiến bộ chuyên sâu giúp cải thiện đáng kể so với nền tảng của YOLOv8.
Link to this sectionĐào tạo tối ưu với MuSGD#
Hiệu suất đào tạo là đặc điểm nổi bật của các model Ultralytics, vốn thường yêu cầu bộ nhớ thấp hơn nhiều so với các kiến trúc dựa trên Transformer cồng kềnh như RT-DETR. YOLO26 nâng cao điều này hơn nữa với sự ra đời của MuSGD Optimizer. Lấy cảm hứng từ các kỹ thuật đào tạo Large Language Model (LLM) (cụ thể là Kimi K2 của Moonshot AI), sự kết hợp giữa Stochastic Gradient Descent (SGD) và Muon này đảm bảo sự hội tụ nhanh hơn và động lực đào tạo ổn định cao trên các tập dữ liệu phức tạp.
Link to this sectionCác hàm mất mát (Loss Function) nâng cao#
Đối với các tác vụ yêu cầu độ chính xác cao, chẳng hạn như hình ảnh máy bay không người lái hoặc cảm biến IoT, YOLO26 giới thiệu ProgLoss + STAL. Các hàm loss cải tiến này mang lại những nâng cao đáng chú ý trong việc nhận dạng vật thể nhỏ. Ngoài ra, YOLO26 mang đến những cải tiến cụ thể theo tác vụ trên diện rộng: multi-scale proto để tạo mask vượt trội trong phân đoạn, Residual Log-Likelihood Estimation (RLE) để ước tính tư thế chính xác hơn và angle loss chuyên dụng để giải quyết các vấn đề biên trong phát hiện Oriented Bounding Box (OBB).
Link to this sectionPhân tích và so sánh hiệu suất#
Bảng sau đây nêu bật những khác biệt về hiệu suất giữa hai model sử dụng tập dữ liệu COCO. Các giá trị hiệu suất tốt nhất trong mỗi danh mục kích thước được làm nổi bật bằng chữ in đậm.
| Mô hình | kích thước (pixel) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Link to this sectionPhân tích các chỉ số#
Dữ liệu cho thấy một bước nhảy vọt giữa các thế hệ. YOLO26 vượt trội đáng kể so với YOLOv8 trên tất cả các chỉ số. Model YOLO26 Nano (YOLO26n) đạt mAP 40.9 ấn tượng, cao hơn đáng kể so với 37.3 của YOLOv8n, trong khi sử dụng ít tham số và FLOPs hơn.
Một trong những cải tiến nổi bật nhất là tốc độ suy luận trên CPU. Nhờ kiến trúc được tối ưu hóa và việc loại bỏ DFL, YOLO26 mang lại tốc độ suy luận CPU nhanh hơn tới 43% thông qua ONNX. Điều này làm cho YOLO26 trở nên vô song cho Raspberry Pi và các thiết bị biên có tài nguyên thấp khác. Mặc dù tốc độ GPU sử dụng TensorRT mang tính cạnh tranh ở cả hai model, hiệu suất tham số tổng thể của YOLO26 giúp giảm dấu chân bộ nhớ trong cả quá trình đào tạo và suy luận.
Link to this sectionDễ sử dụng và Hệ sinh thái#
Cả hai model đều được hưởng lợi rất nhiều từ hệ sinh thái Ultralytics được duy trì tốt. Các nhà phát triển đánh giá cao tính dễ sử dụng do API thống nhất cung cấp, cho phép chuyển đổi giữa YOLOv8 và YOLO26 chỉ bằng cách thay đổi chuỗi tên model.
Cho dù bạn đang thực hiện tinh chỉnh siêu tham số, tiến hành theo dõi thử nghiệm hay khám phá các tập dữ liệu mới, tài liệu của Ultralytics cung cấp các tài nguyên phong phú. Hơn nữa, Nền tảng Ultralytics cung cấp một cách hợp lý để gán nhãn, đào tạo và triển khai các model này một cách liền mạch lên đám mây hoặc cục bộ.
Link to this sectionVí dụ mã#
Bắt đầu với việc đào tạo và suy luận cực kỳ đơn giản. Dưới đây là một ví dụ hoàn chỉnh, có thể chạy được sử dụng API Python của Ultralytics:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=50,
imgsz=640,
device="cpu", # Use '0' for GPU training
)
# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
results[0].show()
# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")Link to this sectionCác trường hợp sử dụng lý tưởng#
Việc chọn đúng model quyết định sự thành công của dự án của bạn.
Khi nào nên chọn YOLO26:
- Điện toán biên & Robot: Tốc độ CPU nhanh hơn 43% và việc không sử dụng NMS làm cho nó trở thành lựa chọn tốt nhất tuyệt đối cho các hệ thống nhúng, thiết bị di động và robot tự hành.
- Hình ảnh trên không và vệ tinh: Việc triển khai ProgLoss + STAL mang lại cho YOLO26 lợi thế rõ rệt trong việc phát hiện các vật thể nhỏ trong các cảnh quan phức tạp, độ phân giải cao.
- Các dự án mới: Là bản phát hành ổn định mới nhất, YOLO26 là model được đề xuất cho bất kỳ pipeline machine learning mới nào, mang lại sự linh hoạt vượt trội trên tất cả các tác vụ.
Khi nào nên giữ lại YOLOv8:
- Hạ tầng kế thừa: Nếu pipeline sản xuất hiện tại của bạn gắn chặt với các output tensor và cơ chế neo cụ thể của YOLOv8, quá trình chuyển đổi có thể cần những điều chỉnh nhỏ.
- Tiêu chuẩn học thuật: YOLOv8 vẫn là một tiêu chuẩn ổn định và được trích dẫn nhiều trong nghiên cứu thị giác máy tính học thuật khi so sánh các kiến trúc cũ hơn.
Tóm lại, trong khi YOLOv8 đã thiết lập một tiêu chuẩn phi thường cho các tác vụ thị giác thời gian thực, YOLO26 xác định lại những gì có thể đạt được. Bằng cách kết hợp những cải tiến hiệu suất lớn trên CPU với các bộ tối ưu hóa đào tạo lấy cảm hứng từ LLM, YOLO26 đảm bảo các nhà phát triển có thể triển khai AI chính xác cao trên hầu hết mọi môi trường phần cứng.