YOLOv8 vs YOLO26: Một bước tiến công nghệ cho trí tuệ nhân tạo thị giác thời gian thực

Trong thế giới phát triển nhanh chóng của thị giác máy tính, sự tiến hóa từ YOLOv8 lên YOLO26 thể hiện một bước tiến vượt bậc về hiệu quả, tốc độ và sự tinh chỉnh kiến trúc. Trong khi đó, YOLOv8 Được thiết lập tiêu chuẩn ngành về tính linh hoạt và dễ sử dụng ngay từ khi ra mắt năm 2023, phiên bản YOLO26 năm 2026 giới thiệu những thay đổi đột phá như khả năng tương thích đầu cuối. NMS - Phát hiện miễn phí và tối ưu hóa dựa trên LLM.

Hướng dẫn này cung cấp so sánh kỹ thuật chuyên sâu để giúp các nhà phát triển, nhà nghiên cứu và kỹ sư lựa chọn mô hình phù hợp với nhu cầu triển khai cụ thể của họ.

Tổng quan về mô hình

Ultralytics YOLOv8

Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 10/01/2023
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLOv8

Ra mắt vào đầu năm 2023, YOLOv8 đã định nghĩa lại trải nghiệm người dùng cho trí tuệ nhân tạo thị giác. Nó giới thiệu một khung thống nhất cho việc phát hiện đối tượng , phân đoạn thể hiện , ước tính tư thế và phân loại . Được xây dựng trên nền tảng... PyTorch Ở phần backend, nó có một đầu phát hiện không cần neo và một quy trình tăng cường dữ liệu mosaic đã trở thành chuẩn mực về tốc độ và độ chính xác cân bằng.

Tìm hiểu thêm về YOLOv8

Ultralytics YOLO26

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 14/01/2026
GitHub: ultralytics / ultralytics
Tài liệu: Tài liệu hướng dẫn sử dụng YOLO26

YOLO26 là phiên bản mới nhất từ Ultralytics Được thiết kế để đáp ứng nhu cầu ngày càng tăng về hiệu năng tối ưu hóa cho thiết bị biên. Nó tiên phong trong kiến trúc NMS Network Management System) hoàn chỉnh từ đầu đến cuối , loại bỏ nhu cầu về các bước xử lý hậu kỳ thường gây tắc nghẽn quá trình suy luận. Với các tối ưu hóa như bộ tối ưu hóa MuSGD và việc loại bỏ Distribution Focal Loss (DFL), YOLO26 mang lại tốc độ suy luận CPU nhanh hơn tới 43% so với các thế hệ trước.

Tìm hiểu thêm về YOLO26

Sự khác biệt về kiến trúc

Sự chuyển đổi từ YOLOv8 Việc chuyển sang YOLO26 đòi hỏi những thay đổi cơ bản trong cách mạng lưới xử lý hình ảnh và học hỏi từ dữ liệu.

1. Thiết kế End-to-End không NMS

Một trong những điểm khác biệt quan trọng nhất là cách xử lý các hộp giới hạn trùng lặp.

YOLOv8 : Dựa vào phương pháp loại bỏ các hộp chồng chéo (Non-Maximum Suppression - NMS ) trong quá trình xử lý hậu kỳ. Mặc dù hiệu quả, NMS Gây ra sự biến động về độ trễ và độ phức tạp trong triển khai, đặc biệt là trên phần cứng không tiêu chuẩn.
YOLO26: Áp dụng phương pháp tiếp cận từ đầu đến cuối tương tự như YOLOv10 . Bằng cách huấn luyện mô hình để xuất ra chính xác một hộp cho mỗi đối tượng, nó loại bỏ hoàn toàn... NMS bước này giúp giảm độ trễ và đơn giản hóa quy trình xuất dữ liệu sang các định dạng như TensorRT và CoreML .

Tại sao NMS-Free lại quan trọng

Loại bỏ NMS Đây là một bước đột phá trong việc triển khai trên thiết bị biên. Nó giúp giảm tải tính toán trên CPU và đảm bảo thời gian suy luận của mô hình luôn nhất quán bất kể số lượng đối tượng được phát hiện trong cảnh.

2. Hàm mất mát và Tối ưu hóa

YOLO26 tích hợp những bài học từ quá trình huấn luyện Mô hình Ngôn ngữ Lớn (LLM) để cải thiện tính ổn định và khả năng hội tụ.

ProgLoss + STAL: YOLO26 sử dụng ProgLoss và STAL (Soft Target Assignment Loss), giúp tạo ra độ dốc mượt mà hơn và xử lý tốt hơn các mẫu khó, đặc biệt là đối với việc phát hiện các vật thể nhỏ .
Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ Kimi K2 của Moonshot AI, bộ tối ưu hóa MuSGD kết hợp những ưu điểm của... SGD Với các cập nhật động lượng tương tự như trình tối ưu hóa Muon. Sự đổi mới này giúp ổn định quá trình huấn luyện ở tốc độ học cao hơn, giảm tổng thời gian huấn luyện.
Loại bỏ DFL: YOLOv8 YOLO26 sử dụng phương pháp suy hao tiêu điểm phân tán (Distribution Focal Loss - DFL) để tinh chỉnh ranh giới hộp. YOLO26 loại bỏ DFL để đơn giản hóa kiến trúc cho các thiết bị biên , giảm số lượng kênh đầu ra và dung lượng bộ nhớ mà không làm giảm độ chính xác.

3. Cải tiến dành riêng cho từng nhiệm vụ

Trong khi YOLOv8 YOLO26 hỗ trợ nhiều tác vụ một cách tổng quát, đồng thời bổ sung các cải tiến chuyên biệt:

Phân đoạn: Giới thiệu hàm mất mát phân đoạn ngữ nghĩa và các mô-đun nguyên mẫu đa tỷ lệ để tạo ra các đường viền mặt nạ sắc nét hơn.
Pose: Sử dụng ước lượng logarit xác suất dư (RLE) để nắm bắt tốt hơn sự không chắc chắn trong việc định vị điểm mấu chốt.
OBB: Giải quyết các điểm gián đoạn ranh giới trong các tác vụ Hộp giới hạn định hướng bằng cách sử dụng hàm mất góc chuyên biệt.

So sánh hiệu suất

Dưới đây là bảng so sánh chi tiết các chỉ số hiệu năng trên tập dữ liệu COCO . YOLO26 thể hiện tốc độ và hiệu quả vượt trội trên mọi quy mô mô hình.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Lưu ý: YOLO26n đạt được mức giảm độ trễ CPU đáng kể lên đến 43% so với... YOLOv8n đồng thời cải thiện độ chính xác lên 3,6%. mAP .

Huấn luyện và Khả năng sử dụng

Cả hai mô hình đều được hưởng lợi từ hệ sinh thái mạnh mẽ Ultralytics , nổi tiếng với sự đơn giản "từ con số không đến chuyên gia".

Dễ sử dụng & Hệ sinh thái

Cho dù bạn lựa chọn YOLOv8 Dù bạn sử dụng YOLO26 hay YOLO26, bạn đều có quyền truy cập vào cùng một API thống nhất. Việc chuyển đổi giữa các mô hình đơn giản chỉ bằng cách thay đổi một chuỗi trong mã của bạn.

from ultralytics import YOLO

# Load YOLOv8
model_v8 = YOLO("yolov8n.pt")

# Load YOLO26 (Recommended)
model_26 = YOLO("yolo26n.pt")

# Training is identical
model_26.train(data="coco8.yaml", epochs=100)

Cả hai mô hình đều được tích hợp hoàn toàn với Nền tảng Ultralytics (trước đây là HUB), cho phép quản lý tập dữ liệu liền mạch, đào tạo trên đám mây và triển khai chỉ với một cú nhấp chuột.

Hiệu quả huấn luyện

YOLOv8 có hiệu suất cao nhưng thường yêu cầu các tiêu chuẩn nhất định. SGD hoặc AdamW các trình tối ưu hóa. YOLO26 , với trình tối ưu hóa MuSGD của nó, thường hội tụ nhanh hơn, tiết kiệm được thời gian quý báu. GPU giờ. Ngoài ra, YOLO26 thường yêu cầu ít hơn. CUDA so sánh với các kiến trúc nặng về Transformer như RT-DETR , bộ nhớ trong quá trình huấn luyện được tiết kiệm hơn, cho phép người dùng huấn luyện các lô dữ liệu lớn hơn trên các GPU cấp độ người tiêu dùng như... NVIDIA RTX 3060 hoặc 4090.

Các trường hợp sử dụng lý tưởng

Khi nào nên gắn bó với YOLOv8

Các dự án kế thừa: Nếu bạn đã có sẵn một quy trình sản xuất ổn định được xây dựng xung quanh YOLOv8 và không đủ thời gian để xác thực quá trình nâng cấp.
Các tiêu chí nghiên cứu cơ bản: YOLOv8 Nó vẫn là một chuẩn mực học thuật thông dụng để so sánh do được sử dụng rộng rãi và có nhiều trích dẫn.

Khi nào nên nâng cấp lên YOLO26?

Triển khai tại biên: Đối với các ứng dụng chạy trên Raspberry Pi , thiết bị di động hoặc hệ thống nhúng, việc tăng tốc CPU lên 43% là rất quan trọng.
Độ trễ thời gian thực: Nếu ứng dụng của bạn (ví dụ: lái xe tự động hoặc robot) yêu cầu độ trễ xác định, thì... NMS Thiết kế không cần xử lý hậu kỳ giúp loại bỏ hiện tượng rung giật do quá trình xử lý hậu kỳ gây ra trong các cảnh quay đông đúc.
Yêu cầu độ chính xác cao: YOLO26 luôn vượt trội hơn hẳn. YOLOv8 TRONG mAP Trên mọi quy mô, nó là lựa chọn tốt hơn cho các tác vụ đòi hỏi độ chính xác cao như chụp ảnh y tế hoặc phát hiện khuyết tật.

Kết luận

Mặc dù YOLOv8 vẫn là một công cụ mạnh mẽ và đa năng, YOLO26 đại diện cho tương lai của thị giác máy tính hiệu quả. Bằng cách kết hợp tính dễ sử dụng của... Ultralytics hệ sinh thái với những đổi mới kiến trúc tiên tiến như NMS Với khả năng phát hiện lỗi và tối ưu hóa dựa trên công nghệ LLM, YOLO26 mang đến một lộ trình nâng cấp hấp dẫn.

Đối với các nhà phát triển bắt đầu các dự án mới ngày nay, YOLO26 là lựa chọn được khuyến nghị , mang lại sự cân bằng tốt nhất giữa tốc độ, độ chính xác và hiệu quả sử dụng tài nguyên hiện có trong năm 2026.

Đọc thêm

Hãy tham khảo các mẫu khác như YOLO11 để so sánh.
Tìm hiểu về cách xuất mô hình sang ONNX hoặc TensorRT .
Hãy truy cập Blog Ultralytics để xem các bài hướng dẫn và nghiên cứu trường hợp mới nhất.