Chuyển đến nội dung

YOLO26 so với YOLOX: Một kỷ nguyên mới của phát hiện đối tượng không cần neo

Sự phát triển của thị giác máy tính đã được đánh dấu bằng những bước tiến vượt bậc về kiến ​​trúc. Năm 2021, YOLOX đã giới thiệu một mô hình không cần neo (anchor-free) có tầm ảnh hưởng lớn, thu hẹp khoảng cách giữa nghiên cứu học thuật và ứng dụng công nghiệp. Đến năm 2026, cục diện đã được định hình lại bởi Ultralytics YOLO , đặc biệt là với sự ra mắt của YOLO26. Bài so sánh toàn diện này sẽ khám phá cách YOLO26 xây dựng dựa trên những đổi mới trước đây để mang lại hiệu suất, tính linh hoạt và sự dễ sử dụng vượt trội.

Tổng quan về mô hình

Hiểu rõ nguồn gốc và triết lý cốt lõi của các mô hình này là điều cần thiết để đưa ra các quyết định triển khai sáng suốt.

Chi tiết YOLO26

Tìm hiểu thêm về YOLO26

YOLO26 đại diện cho đỉnh cao của kỹ thuật trí tuệ nhân tạo hiện đại, cung cấp thiết kế tích hợp từ đầu đến cuối, loại bỏ các nút thắt cổ chai phức tạp trong quá trình xử lý hậu kỳ. Nó được tối ưu hóa mạnh mẽ cho cả triển khai trên đám mây và thiết bị biên, với hệ sinh thái hỗ trợ liền mạch nhiều tác vụ khác nhau.

Thông tin chi tiết về YOLOX

Tìm hiểu thêm về YOLOX

YOLOX là một bước tiến lớn, giới thiệu kiến ​​trúc đầu đọc/ghi tách rời và không cần neo, cùng với chiến lược gán nhãn SimOTA. Tại thời điểm ra mắt, nó mang lại sự cân bằng tuyệt vời giữa tốc độ và độ chính xác, trở thành lựa chọn phổ biến cho nhiều hệ thống cũ.

Đổi mới Kiến trúc

Những điểm khác biệt giữa YOLO26 và YOLOX làm nổi bật năm năm đổi mới không ngừng trong thiết kế học sâu.

Mặc dù YOLOX ủng hộ phương pháp không sử dụng neo, nhưng nó vẫn phụ thuộc rất nhiều vào phương pháp loại bỏ cực đại không truyền thống (Non-Maximmum Suppression). NMS ) để lọc các hộp giới hạn dư thừa. YOLO26 giới thiệu thiết kế không cần NMS từ đầu đến cuối . Bước đột phá này, lần đầu tiên được tiên phong trong YOLOv10 , loại bỏ hoàn toàn NMS xử lý hậu kỳ, giúp tạo ra các quy trình triển khai nhanh hơn và đơn giản hơn với độ lệch độ trễ thấp hơn đáng kể.

Hơn nữa, YOLO26 có tính năng Loại bỏ DFL . Bằng cách loại bỏ tổn hao tiêu điểm phân phối (Distribution Focal Loss), quy trình xuất mô hình được đơn giản hóa đáng kể, đảm bảo khả năng tương thích vượt trội với các thiết bị biên và phần cứng công suất thấp. Khi kết hợp với các tối ưu hóa kiến ​​trúc của mô hình, YOLO26 đạt được tốc độ suy luận CPU nhanh hơn tới 43% so với các phiên bản tiền nhiệm, trở thành một công cụ mạnh mẽ cho các môi trường thiếu GPU chuyên dụng.

Tính ổn định của quá trình huấn luyện là một yếu tố khác biệt quan trọng. YOLO26 sử dụng thuật toán tối ưu hóa MuSGD tiên tiến, một thuật toán lai giữa... SGD và Muon được lấy cảm hứng từ những cải tiến trong huấn luyện mô hình ngôn ngữ quy mô lớn (LLM) của Moonshot AI . Trình tối ưu hóa này mang lại sự ổn định cho việc huấn luyện mô hình ngôn ngữ quy mô lớn trong lĩnh vực thị giác máy tính, giúp quá trình hội tụ diễn ra nhanh hơn.

Các hàm tổn thất nâng cao

YOLO26 sử dụng ProgLoss + STAL , các hàm mất mát chuyên dụng mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ. Điều này rất quan trọng đối với các tác vụ phức tạp như xử lý ảnh chụp từ trên không và phân tích môi trường dày đặc.

Hiệu năng và điểm chuẩn

Khi so sánh trực tiếp các mô hình này trên tập dữ liệu COCO , sự vượt trội của YOLO26 về cả độ chính xác và hiệu quả trở nên rõ ràng. Ultralytics Các mô hình này luôn có yêu cầu bộ nhớ thấp hơn trong quá trình huấn luyện và tốc độ suy luận nhanh hơn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Lưu ý: Mẫu YOLO26x đạt được thành tích ấn tượng 57,5 mAP trong khi yêu cầu số lượng tham số ít hơn đáng kể (55,7 triệu) so với mô hình YOLOXx (99,1 triệu), điều này làm nổi bật hiệu quả tham số đáng kinh ngạc của mô hình này. Ultralytics ngành kiến ​​​​trúc.

Hệ sinh thái và Dễ sử dụng

Một trong những ưu điểm quan trọng nhất khi lựa chọn YOLO26 là hệ sinh thái được duy trì tốt do công ty cung cấp. Ultralytics Trong khi YOLOX đòi hỏi phải điều hướng qua các cơ sở mã nghiên cứu phức tạp và thiết lập môi trường thủ công, Ultralytics Cung cấp trải nghiệm phát triển đơn giản, từ "không biết gì đến chuyên gia".

Sử dụng phương pháp thống nhất Python Với API này, các nhà phát triển có thể dễ dàng chuyển đổi giữa các tác vụ như phát hiện đối tượng , phân đoạn thể hiện , phân loại hình ảnhước tính tư thế . Ngược lại, YOLOX chỉ giới hạn ở việc phát hiện hộp giới hạn.

Ví dụ huấn luyện

Huấn luyện mô hình trên tập dữ liệu tùy chỉnh với Ultralytics có hiệu quả đáng kể. Quy trình đào tạo giúp giảm thiểu tối đa... CUDA Việc sử dụng bộ nhớ cho phép xử lý các lô dữ liệu lớn hơn ngay cả trên phần cứng dành cho người tiêu dùng, một sự khác biệt rõ rệt so với các kiến ​​trúc cũ hơn hoặc các mô hình máy biến áp nặng nề.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Nền tảng Ultralytics giúp nâng cao hơn nữa quy trình làm việc này, cung cấp khả năng đào tạo trên đám mây, chú thích dữ liệu tự động và các tùy chọn triển khai chỉ với một cú nhấp chuột. Đây là công cụ không thể thiếu đối với các nhóm muốn chuyển đổi nhanh chóng từ giai đoạn nguyên mẫu sang sản xuất.

Các trường hợp sử dụng lý tưởng và ứng dụng thực tế

Việc lựa chọn mô hình phù hợp quyết định sự thành công của việc triển khai thực tế.

AI biên và IoT

Đối với các ứng dụng yêu cầu xử lý cục bộ trên phần cứng hạn chế, chẳng hạn như hệ thống báo động an ninh thông minh hoặc cảm biến môi trường từ xa, YOLO26 là sự lựa chọn tối ưu. NMS - Kiến trúc miễn phí và nhanh hơn 43% CPU Điều này có nghĩa là chương trình chạy mượt mà trên các thiết bị như Raspberry Pi mà không cần các thủ thuật lượng tử hóa phức tạp.

Robot tự hành

Công nghệ robot đòi hỏi độ chính xác cao và độ trễ thấp. Khả năng ước lượng tư thế của YOLO26, được hỗ trợ bởi phương pháp ước lượng logarit xác suất dư (RLE), cho phép robot hiểu được động học của con người trong thời gian thực. Việc thiếu khả năng phát hiện điểm mấu chốt tích hợp sẵn khiến YOLOX không phù hợp với các nhiệm vụ tương tác người-robot tiên tiến như vậy.

Kiểm tra trên cao và trên không

Khi kiểm tra cơ sở hạ tầng bằng máy bay không người lái, việc phát hiện các khuyết tật nhỏ nhất là vô cùng quan trọng. Các chức năng ProgLoss và STAL trong YOLO26 cải thiện đáng kể khả năng nhận diện các vật thể nhỏ. Ngoài ra, YOLO26 hỗ trợ hộp giới hạn định hướng (OBB) một cách tự nhiên, hoàn chỉnh với một hàm mất góc chuyên dụng để giải quyết các vấn đề về ranh giới, làm cho nó trở nên hoàn hảo cho ảnh vệ tinh và ảnh chụp từ trên không, nơi các vật thể được xoay tùy ý.

Triển khai hệ thống cũ

YOLOX vẫn có thể được sử dụng trong các môi trường cũ, nơi các quy trình triển khai C++ hiện có được xây dựng dựa trên các đầu ra tách rời đặc thù của nó vào năm 2021. Tuy nhiên, đối với bất kỳ dự án mới nào, việc chuyển đổi sang YOLOX là không khả thi. Ultralytics Hệ sinh thái được khuyến nghị mạnh mẽ để tận dụng những cải tiến hiệu năng hiện đại và sự hỗ trợ liên tục từ cộng đồng.

Khám phá các mô hình khác

Mặc dù YOLO26 đại diện cho công nghệ tiên tiến nhất hiện nay, nhưng Ultralytics Hệ sinh thái này cung cấp nhiều mô hình được thiết kế riêng cho các nhu cầu cụ thể. Đối với các nhà phát triển quan tâm đến kiến ​​trúc dựa trên Transformer, RT-DETR cung cấp một phương pháp thay thế cho việc phát hiện từ đầu đến cuối. Ngoài ra, YOLO11 vẫn là một lựa chọn mạnh mẽ, được kiểm thử kỹ lưỡng cho các môi trường sản xuất yêu cầu đánh giá hiệu năng lịch sử rộng rãi.

Tóm lại, sự chuyển đổi từ YOLOX sang YOLO26 minh họa cho sự tiến bộ nhanh chóng của lĩnh vực này. Bằng cách kết hợp API trực quan, bộ tính năng đa dạng và hiệu quả vượt trội, YOLO26 trở thành lựa chọn hàng đầu cho các nhà nghiên cứu và nhà phát triển trên toàn thế giới.


Bình luận