Meet YOLO26: next-gen vision AI.

Link to this sectionSo sánh YOLO26 và YOLOX#

Sự phát triển của thị giác máy tính đã được đánh dấu bằng những bước tiến quan trọng về kiến trúc. Vào năm 2021, YOLOX đã giới thiệu một mô hình không cần anchor (anchor-free) có tầm ảnh hưởng lớn, thu hẹp khoảng cách giữa nghiên cứu học thuật và ứng dụng công nghiệp. Đến năm 2026, bối cảnh này đã được định nghĩa lại bởi Ultralytics YOLO, cụ thể là với sự ra mắt của YOLO26. Bài so sánh toàn diện này khám phá cách YOLO26 kế thừa các đổi mới lịch sử để mang lại hiệu suất, tính linh hoạt và sự dễ sử dụng vượt trội.

Link to this sectionTổng quan về mô hình#

Việc hiểu rõ nguồn gốc và triết lý cốt lõi của các mô hình này là điều cần thiết để đưa ra các quyết định triển khai sáng suốt.

Link to this sectionChi tiết về YOLO26#

Tìm hiểu thêm về YOLO26

YOLO26 đại diện cho đỉnh cao của kỹ thuật AI hiện đại, cung cấp thiết kế end-to-end nguyên bản giúp loại bỏ các nút thắt hậu xử lý (post-processing) phức tạp. Mô hình được tối ưu hóa mạnh mẽ cho cả việc triển khai trên đám mây và biên (edge), với hệ sinh thái hỗ trợ đa dạng các tác vụ một cách mượt mà.

Link to this sectionChi tiết về YOLOX#

Tìm hiểu thêm về YOLOX

YOLOX là một bước tiến lớn, giới thiệu kiến trúc đầu phân tách (decoupled head) và kiến trúc không cần anchor (anchor-free) cùng với chiến lược gán nhãn SimOTA. Tại thời điểm ra mắt, mô hình này cung cấp sự cân bằng tuyệt vời giữa tốc độ và độ chính xác, trở thành lựa chọn phổ biến cho nhiều hệ thống cũ.

Link to this sectionCải tiến kiến trúc#

Sự khác biệt giữa YOLO26 và YOLOX làm nổi bật 5 năm đổi mới không ngừng trong thiết kế học sâu (deep learning).

Trong khi YOLOX ủng hộ phương pháp không cần anchor, nó vẫn phụ thuộc nhiều vào NMS truyền thống để lọc các BBox dư thừa. YOLO26 giới thiệu thiết kế end-to-end không cần NMS. Bước đột phá này, lần đầu tiên được tiên phong trong YOLOv10, loại bỏ hoàn toàn quá trình hậu xử lý NMS, dẫn đến các pipeline triển khai nhanh hơn, đơn giản hơn và có độ trễ ổn định hơn đáng kể.

Hơn nữa, YOLO26 có tính năng loại bỏ DFL. Bằng cách loại bỏ Distribution Focal Loss, quy trình xuất mô hình được đơn giản hóa đáng kể, đảm bảo khả năng tương thích đặc biệt với các thiết bị biên và phần cứng công suất thấp. Khi kết hợp với các tối ưu hóa kiến trúc, YOLO26 đạt được tốc độ inference trên CPU nhanh hơn tới 43% so với các phiên bản tiền nhiệm, biến nó thành một thế lực mạnh mẽ cho các môi trường thiếu GPU chuyên dụng.

Sự ổn định trong huấn luyện là một yếu tố khác biệt quan trọng khác. YOLO26 sử dụng bộ tối ưu hóa MuSGD mới, một sự kết hợp giữa SGD và Muon, lấy cảm hứng từ những đổi mới trong huấn luyện LLM từ Moonshot AI. Bộ tối ưu hóa này mang lại sự ổn định trong huấn luyện mô hình ngôn ngữ lớn vào thị giác máy tính, tạo điều kiện cho quá trình hội tụ nhanh hơn.

Các hàm mất mát (Loss Function) nâng cao

YOLO26 sử dụng ProgLoss + STAL, các hàm mất mát chuyên dụng mang lại những cải tiến đáng kể trong việc nhận diện đối tượng nhỏ. Điều này rất quan trọng đối với các tác vụ phức tạp như xử lý hình ảnh từ máy bay không người lái và phân tích các môi trường dày đặc.

Link to this sectionHiệu năng và Benchmark#

Khi so sánh trực tiếp các mô hình này trên tập dữ liệu COCO, sự vượt trội của YOLO26 về cả độ chính xác và hiệu quả đều trở nên rõ ràng. Các mô hình Ultralytics liên tục cung cấp yêu cầu bộ nhớ thấp hơn trong quá trình huấn luyện và tốc độ inference nhanh hơn.

Mô hìnhkích thước
(pixel)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Lưu ý: Mô hình YOLO26x đạt được mAP ấn tượng 57,5 trong khi yêu cầu số lượng tham số ít hơn đáng kể (55,7 triệu) so với mô hình YOLOXx (99,1 triệu), làm nổi bật hiệu quả tham số đáng kinh ngạc của kiến trúc Ultralytics.

Link to this sectionHệ sinh thái và tính dễ sử dụng#

Một trong những lợi thế lớn nhất của việc chọn YOLO26 là hệ sinh thái được duy trì tốt do Ultralytics cung cấp. Trong khi YOLOX yêu cầu phải điều hướng qua các codebase nghiên cứu phức tạp và thiết lập môi trường thủ công, Ultralytics cung cấp trải nghiệm nhà phát triển "zero-to-hero" được tinh giản.

Sử dụng Python API thống nhất, các nhà phát triển có thể dễ dàng chuyển đổi giữa các tác vụ như phát hiện đối tượng, phân đoạn cá thể, phân loại hình ảnhước tính tư thế. Ngược lại, YOLOX chỉ giới hạn ở việc phát hiện khung hình chữ nhật (bounding box).

Link to this sectionVí dụ về huấn luyện#

Huấn luyện một mô hình trên tập dữ liệu tùy chỉnh với Ultralytics vô cùng hiệu quả. Pipeline huấn luyện tối thiểu hóa việc sử dụng bộ nhớ CUDA, cho phép kích thước batch lớn hơn ngay cả trên phần cứng phổ thông, một sự tương phản rõ rệt với các kiến trúc cũ hoặc các mô hình Transformer nặng nề.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Nền tảng Ultralytics tiếp tục cải thiện quy trình làm việc này, cung cấp khả năng huấn luyện trên đám mây, gắn nhãn tập dữ liệu tự động và các tùy chọn triển khai một cú nhấp chuột. Đây là công cụ không thể thiếu cho các đội ngũ đặt mục tiêu chuyển đổi từ tạo mẫu sang sản xuất một cách nhanh chóng.

Link to this sectionCác trường hợp sử dụng lý tưởng và ứng dụng thực tế#

Việc chọn đúng mô hình quyết định sự thành công cho việc triển khai thực tế của bạn.

Link to this sectionEdge AI và IoT#

Đối với các ứng dụng yêu cầu xử lý cục bộ trên phần cứng hạn chế, chẳng hạn như hệ thống báo động an ninh thông minh hoặc cảm biến môi trường từ xa, YOLO26 là sự lựa chọn dứt khoát. Kiến trúc không cần NMS và khả năng thực thi trên CPU nhanh hơn 43% của nó có nghĩa là nó chạy mượt mà trên các thiết bị như Raspberry Pi mà không cần các giải pháp thay thế lượng tử hóa phức tạp.

Link to this sectionRobot tự hành#

Robot yêu cầu độ chính xác cao và độ trễ thấp. Khả năng ước tính tư thế của YOLO26, được củng cố bởi Residual Log-Likelihood Estimation (RLE), cho phép robot hiểu động học con người theo thời gian thực. Việc YOLOX thiếu khả năng phát hiện điểm khóa (keypoint) nguyên bản khiến nó không phù hợp cho các tác vụ tương tác người-robot nâng cao như vậy.

Link to this sectionKiểm tra trên không và độ cao lớn#

Khi kiểm tra cơ sở hạ tầng thông qua máy bay không người lái, việc phát hiện các khiếm khuyết nhỏ là tối quan trọng. Các hàm ProgLoss và STAL trong YOLO26 cải thiện đáng kể độ triệu hồi (recall) trên các đối tượng nhỏ. Ngoài ra, YOLO26 hỗ trợ nguyên bản Oriented Bounding Boxes (OBB), hoàn chỉnh với hàm mất mát góc chuyên dụng để giải quyết các vấn đề về ranh giới, giúp nó trở nên hoàn hảo cho hình ảnh vệ tinh và trên không, nơi các đối tượng được xoay tùy ý.

Link to this sectionTriển khai kế thừa#

YOLOX vẫn có thể được sử dụng trong các môi trường cũ, nơi các pipeline triển khai C++ hiện có được xây dựng rõ ràng dựa trên các đầu ra phân tách cụ thể của nó vào năm 2021. Tuy nhiên, đối với bất kỳ dự án mới nào, việc chuyển sang hệ sinh thái Ultralytics được khuyến khích mạnh mẽ để tận dụng các lợi ích hiệu suất hiện đại và sự hỗ trợ cộng đồng liên tục.

Link to this sectionKhám phá các mô hình khác#

Trong khi YOLO26 đại diện cho trạng thái tiên tiến hiện tại, hệ sinh thái Ultralytics cung cấp nhiều loại mô hình được tùy chỉnh cho các nhu cầu cụ thể. Đối với các nhà phát triển quan tâm đến kiến trúc dựa trên Transformer, RT-DETR cung cấp một cách tiếp cận thay thế cho việc phát hiện end-to-end. Ngoài ra, YOLO11 vẫn là một tùy chọn mạnh mẽ, được kiểm thử kỹ lưỡng cho các môi trường sản xuất yêu cầu đo điểm chuẩn lịch sử rộng rãi.

Tóm lại, quá trình chuyển đổi từ YOLOX sang YOLO26 minh họa cho sự tiến bộ nhanh chóng của lĩnh vực này. Bằng cách kết hợp API trực quan, tập tính năng linh hoạt và hiệu quả vô song, YOLO26 đứng vững như lựa chọn hàng đầu cho các nhà nghiên cứu và nhà phát triển trên toàn thế giới.

Người đóng góp

Bình luận