YOLOv8 vs YOLO26: Sự tiến hóa của Ultralytics Phát hiện đối tượng thời gian thực
Lĩnh vực thị giác máy tính đã chứng kiến những tiến bộ vượt bậc trong vài năm qua. Trong số các kiến trúc phổ biến nhất cho các ứng dụng thời gian thực là các mô hình được phát triển bởi Ultralytics . Hướng dẫn toàn diện này cung cấp sự so sánh kỹ thuật chi tiết giữa Ultralytics YOLOv8 đột phá và Ultralytics YOLO26 hiện đại nhất. Chúng ta sẽ phân tích kiến trúc, các chỉ số hiệu suất và các trường hợp sử dụng lý tưởng của chúng để giúp bạn chọn mô hình phù hợp cho việc triển khai của mình.
Tổng quan về mô hình
Cả hai YOLOv8 và YOLO26 đại diện cho những cột mốc quan trọng trong dòng sản phẩm YOLO . Chúng đều có chung cốt lõi. Ultralytics Triết lý: Cung cấp các mô hình nhanh, chính xác và cực kỳ dễ sử dụng thông qua một môi trường Python và API thống nhất.
YOLOv8 Tiêu chuẩn đa năng
Được phát hành vào đầu năm 2023, YOLOv8 đã giới thiệu một cuộc cải tổ lớn cho YOLO Khung phần mềm này mang đến thiết kế không cần neo và hỗ trợ mạnh mẽ cho nhiều tác vụ thị giác máy tính.
- Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2023-01-10
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu YOLOv8
YOLOv8 Nó nhanh chóng trở thành tiêu chuẩn ngành nhờ sự cân bằng hiệu năng tuyệt vời và khả năng tích hợp sâu vào hệ sinh thái Ultralytics . Nó hỗ trợ natively các chức năng phát hiện đối tượng , phân đoạn thể hiện , ước tính tư thế và phân loại hình ảnh . Tuy nhiên, nó dựa trên thuật toán Non-Maximum Suppression tiêu chuẩn ( NMS ) cho quá trình xử lý hậu kỳ, điều này có thể gây ra tắc nghẽn độ trễ trong môi trường biên có tài nguyên hạn chế cao.
YOLO26: Sức mạnh vượt trội thế hệ tiếp theo
Ra mắt vào tháng 1 năm 2026, YOLO26 kế thừa nền tảng được xây dựng bởi các phiên bản tiền nhiệm và tối ưu hóa mạnh mẽ cho các kịch bản triển khai hiện đại, đặc biệt là trong lĩnh vực AI biên và các thiết bị tiêu thụ điện năng thấp.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2026-01-14
- GitHub:Kho lưu trữ Ultralytics
- Tài liệu:Tài liệu YOLO26
YOLO26 giới thiệu một số cải tiến kỹ thuật mang tính đột phá. Đáng chú ý nhất, nó có thiết kế hoàn toàn không cần hệ quản lý mạng NMS . Được tiên phong bởi YOLOv10 , kiến trúc này loại bỏ nhu cầu về... NMS Quá trình xử lý hậu kỳ giúp đơn giản hóa đáng kể các quy trình xuất dữ liệu và giảm thiểu sự biến đổi độ trễ. Hơn nữa, việc loại bỏ hiện tượng mất tiêu điểm phân tán (DFL) giúp tinh gọn đầu phát hiện, làm cho nó cực kỳ thân thiện với việc triển khai trên phần cứng AI biên.
Khác Ultralytics Mô hình
Trong khi YOLOv8 YOLO26 vô cùng mạnh mẽ, bạn cũng có thể cân nhắc YOLO11 , phiên bản thu hẹp khoảng cách giữa hai thế hệ này với kiến trúc được cải tiến, hoặc YOLOv5 cho các tích hợp hệ thống cũ chuyên biệt.
Đổi mới trong kiến trúc và đào tạo
YOLO26 mang đến một số cải tiến bên trong giúp cải thiện đáng kể hiệu năng. YOLOv8 mức cơ sở của 's.
Huấn luyện tối ưu với MuSGD
Hiệu quả đào tạo là một đặc điểm nổi bật của Ultralytics các mô hình, thường có yêu cầu bộ nhớ thấp hơn nhiều so với các kiến trúc dựa trên transformer cồng kềnh như RT-DETR . YOLO26 còn nâng cao điều này hơn nữa với sự ra mắt của Trình tối ưu hóa MuSGD . Lấy cảm hứng từ các kỹ thuật huấn luyện Mô hình Ngôn ngữ Lớn (LLM) (cụ thể là Kimi K2 của Moonshot AI), sự kết hợp giữa Thuật toán Giảm độ dốc Ngẫu nhiên (Stochastic Gradient Descent) này ( SGD ) và Muon đảm bảo sự hội tụ nhanh hơn và động lực huấn luyện cực kỳ ổn định trên các tập dữ liệu phức tạp.
Các hàm tổn thất nâng cao
Đối với các tác vụ yêu cầu độ chính xác cao, chẳng hạn như ảnh chụp từ máy bay không người lái hoặc cảm biến IoT, YOLO26 giới thiệu ProgLoss + STAL . Các hàm mất mát được cải tiến này mang lại những nâng cấp đáng kể trong nhận dạng đối tượng nhỏ. Ngoài ra, YOLO26 còn mang đến những cải tiến cụ thể cho từng tác vụ: một nguyên mẫu đa tỷ lệ để tạo mặt nạ tốt hơn trong phân đoạn, ước lượng logarit khả năng dư (RLE) để ước lượng tư thế chính xác hơn và hàm mất mát góc chuyên dụng để giải quyết các vấn đề về ranh giới trong phát hiện hộp giới hạn định hướng (OBB) .
Phân tích và so sánh hiệu năng
Bảng sau đây nêu bật sự khác biệt về hiệu suất giữa hai mô hình sử dụng tập dữ liệu COCO . Các giá trị có hiệu suất tốt nhất trong mỗi nhóm kích thước được in đậm .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Phân tích các chỉ số
Dữ liệu cho thấy một bước nhảy vọt về thế hệ. YOLO26 có hiệu suất vượt trội hơn hẳn. YOLOv8 trên tất cả các chỉ số. Mẫu YOLO26 Nano (YOLO26n) đạt được điểm số ấn tượng 40,9. mAP cao hơn đáng kể so với YOLOv8n 's 37.3, trong khi sử dụng ít tham số và FLOP hơn.
Một trong những cải tiến nổi bật nhất là CPU Tốc độ suy luận. Nhờ kiến trúc được tối ưu hóa và việc loại bỏ DFL, YOLO26 mang lại tốc độ suy luận CPU nhanh hơn tới 43% thông qua ONNX . Điều này làm cho YOLO26 trở nên vô song đối với Raspberry Pi và các thiết bị biên có tài nguyên thấp khác. Trong khi đó, GPU Tốc độ khi sử dụng TensorRT khá cạnh tranh ở cả hai mô hình, hiệu quả tham số tổng thể của YOLO26 giúp giảm thiểu lượng bộ nhớ sử dụng trong cả quá trình huấn luyện và suy luận.
Dễ sử dụng và hệ sinh thái
Cả hai mô hình đều được hưởng lợi rất nhiều từ hệ sinh thái Ultralytics được duy trì tốt. Các nhà phát triển đánh giá cao tính dễ sử dụng do API thống nhất cung cấp, cho phép chuyển đổi giữa các mô hình. YOLOv8 và YOLO26 bằng cách đơn giản thay đổi chuỗi tên mô hình.
Cho dù bạn đang thực hiện tinh chỉnh siêu tham số , theo dõi thí nghiệm hay khám phá các tập dữ liệu mới, thì... Ultralytics Tài liệu hướng dẫn cung cấp nguồn tài nguyên phong phú. Hơn nữa, Nền tảng Ultralytics cung cấp một cách thức hợp lý để chú thích, huấn luyện và triển khai các mô hình này một cách liền mạch trên đám mây hoặc cục bộ.
Ví dụ mã
Việc bắt đầu với quá trình huấn luyện và suy luận vô cùng đơn giản. Dưới đây là một ví dụ hoàn chỉnh, có thể chạy được, sử dụng... Ultralytics Python API:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=50,
imgsz=640,
device="cpu", # Use '0' for GPU training
)
# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
results[0].show()
# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
Đơn giản hóa triển khai
Việc xuất YOLO26 sang các định dạng như CoreML hoặc OpenVINO diễn ra mượt mà hơn đáng kể so với các phiên bản cũ hơn nhờ vào... NMS - Kiến trúc không cần cấu trúc tùy chỉnh, loại bỏ các thao tác tùy chỉnh phức tạp khỏi đồ thị được xuất ra.
Các trường hợp sử dụng lý tưởng
Việc lựa chọn mô hình phù hợp quyết định sự thành công của dự án.
Khi nào nên chọn YOLO26:
- Điện toán biên và robot: Nhanh hơn 43% CPU tốc độ và sự thiếu hụt NMS Điều này khiến nó trở thành sự lựa chọn tốt nhất tuyệt đối cho các hệ thống nhúng, thiết bị di động và robot tự hành.
- Ảnh chụp từ trên không và vệ tinh: Việc tích hợp ProgLoss + STAL mang lại cho YOLO26 lợi thế rõ rệt trong việc phát hiện các vật thể nhỏ trong các cảnh quan phức tạp, có độ phân giải cao.
- Dự án mới: Là phiên bản ổn định mới nhất, YOLO26 là mô hình được khuyến nghị cho bất kỳ quy trình học máy mới nào, mang lại tính linh hoạt vượt trội trong mọi tác vụ.
Khi nào nên giữ lại YOLOv8 :
- Cơ sở hạ tầng cũ: Nếu quy trình sản xuất hiện tại của bạn phụ thuộc nhiều vào các tensor đầu ra cụ thể và cơ chế neo của... YOLOv8 Việc di cư có thể đòi hỏi một số điều chỉnh nhỏ.
- Tiêu chuẩn học thuật cơ bản: YOLOv8 Đây vẫn là một chuẩn mực ổn định và được trích dẫn rộng rãi trong nghiên cứu thị giác máy tính học thuật, so sánh với các kiến trúc cũ hơn.
Tóm lại, trong khi YOLOv8 Đã thiết lập một tiêu chuẩn phi thường cho các tác vụ thị giác thời gian thực, YOLO26 định nghĩa lại những gì có thể. Bằng cách kết hợp những cải tiến hiệu quả vượt trội trên CPU với các thuật toán tối ưu hóa huấn luyện lấy cảm hứng từ LLM, YOLO26 đảm bảo các nhà phát triển có thể triển khai AI có độ chính xác cao trong hầu hết mọi môi trường phần cứng.