Chuyển đến nội dung

YOLO11 So sánh với YOLOX: Sự tiến hóa của công nghệ phát hiện đối tượng hiệu năng cao

Lĩnh vực thị giác máy tính đã chứng kiến ​​những bước tiến nhanh chóng trong vài năm qua, với các mô hình phát hiện đối tượng thời gian thực ngày càng trở nên tinh vi. Khi lựa chọn kiến ​​trúc cho môi trường sản xuất hoặc nghiên cứu học thuật, các nhà phát triển thường cân nhắc giữa các công nghệ cũ và những đổi mới tiên tiến. Bài so sánh toàn diện này khám phá sự khác biệt giữa Ultralytics YOLO11 và Megvii YOLOX, cung cấp những hiểu biết sâu sắc về kiến ​​trúc, số liệu hiệu năng và các kịch bản triển khai lý tưởng của chúng.

Tổng quan kiến trúc

Cả hai mô hình đều thể hiện những bước tiến đáng kể trong việc phát hiện đối tượng, nhưng chúng xuất phát từ những triết lý thiết kế khác nhau và nhắm đến những trải nghiệm khác nhau của nhà phát triển.

YOLO11 : Công cụ đa nhiệm linh hoạt

Được Glenn Jocher và Jing Qiu tại Ultralytics phát hành vào tháng 9 năm 2024, YOLO11 được thiết kế như một khung thống nhất, cân bằng giữa độ chính xác cao và hiệu quả tối ưu.

YOLO11 Nó vượt xa các hộp giới hạn tiêu chuẩn, hỗ trợ nguyên bản phân đoạn đối tượng , phân loại hình ảnh , ước tính tư thế và phát hiện hộp giới hạn định hướng (OBB) . Kiến trúc được tinh chỉnh của nó tối ưu hóa việc trích xuất đặc trưng để đảm bảo khả năng giữ lại đặc trưng tốt hơn trên các hệ thống phân cấp không gian phức tạp.

Tìm hiểu thêm về YOLO11

YOLOX: Người tiên phong không neo

Được phát triển bởi các nhà nghiên cứu tại Megvii, YOLOX đã thu hút sự chú ý đáng kể vào năm 2021 bằng cách thu hẹp khoảng cách giữa nghiên cứu và ứng dụng công nghiệp với phương pháp hoàn toàn không cần neo.

YOLOX đã giới thiệu một đầu nối tách rời và một mô hình không cần neo, giúp giảm đáng kể số lượng tham số thiết kế và cải thiện hiệu năng trên các bộ dữ liệu chuẩn học thuật vào thời điểm ra mắt.

Tìm hiểu thêm về YOLOX

Bạn có biết?

Thiết kế không cần neo, được YOLOX phổ biến, đã truyền cảm hứng cho nhiều công trình kiến ​​trúc sau này. Ultralytics đã kết hợp và tinh chỉnh mạnh mẽ các khái niệm không cần neo này trong các phiên bản sau này như YOLOv8 và YOLO11 Nhằm mang lại độ chính xác vượt trội và tính linh hoạt trong triển khai.

Hiệu suất và số liệu

Khi đánh giá các mô hình phát hiện, cần xem xét sự cân bằng giữa các tham số, chi phí tính toán (FLOPs) và độ chính xác trung bình (Average Precision) mAP Điều này rất quan trọng cho việc triển khai mô hình trong thực tế.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Như thể hiện trong bảng, YOLO11x vượt trội hơn hẳn YOLOXx về độ chính xác tuyệt đối ( 54,7 mAP so với 51,1). mAP ), trong khi chỉ cần khoảng một nửa số tham số (56,9 triệu so với 99,1 triệu). Hiệu quả này dẫn đến yêu cầu bộ nhớ thấp hơn trong cả quá trình huấn luyện và suy luận, một lợi thế rất lớn cho môi trường sản xuất.

Hệ sinh thái và Trải nghiệm nhà phát triển

Lợi thế của Ultralytics

Một trong những điểm khác biệt sâu sắc nhất giữa YOLO11 Và điểm mạnh của YOLOX nằm ở tính dễ sử dụng. YOLOX hoạt động chủ yếu như một nền tảng mã nguồn nghiên cứu, đòi hỏi cấu hình môi trường phức tạp, biên dịch thủ công các toán tử C++ và các đối số dòng lệnh dài dòng để bắt đầu huấn luyện tập dữ liệu tùy chỉnh .

Ngược lại hoàn toàn, YOLO11 được tích hợp hoàn toàn vào Ultralytics Python Gói phần mềm này cung cấp quy trình làm việc hợp lý, "từ con số không đến chuyên gia". Nền tảng Ultralytics cung cấp các công cụ mở rộng để chú thích dữ liệu, theo dõi thử nghiệm và huấn luyện dựa trên đám mây, loại bỏ các công đoạn mã lặp đi lặp lại để các kỹ sư có thể tập trung vào hiệu suất mô hình.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Hơn nữa, việc xuất khẩu một Ultralytics chuyển đổi mô hình sang các định dạng như TensorRT , CoreML Hoặc OpenVINO chỉ yêu cầu một lệnh duy nhất, trong khi các kho lưu trữ cũ thường yêu cầu các công cụ phức tạp của bên thứ ba hoặc các thao tác chỉnh sửa đồ thị thủ công.

Các trường hợp sử dụng thực tế

Khi nào nên cân nhắc YOLOX

YOLOX vẫn là một lựa chọn khả thi cho các triển khai chuyên biệt, hệ thống cũ, nơi các nhà phát triển đã xây dựng các đường dẫn suy luận C++ được tùy chỉnh cao xung quanh phần đầu tách rời đặc thù của nó. tensor Ngoài ra, các nhà nghiên cứu tiến hành các nghiên cứu so sánh với các kiến ​​trúc tiên tiến nhất năm 2021 vẫn sẽ sử dụng YOLOX làm cơ sở dữ liệu chuẩn .

Nơi YOLO11 vượt trội

Đối với hầu hết các kịch bản sản xuất hiện đại, YOLO11 mang lại trải nghiệm vượt trội hơn hẳn:

  • Thành phố thông minh và bán lẻ: Nhờ tỷ lệ tốc độ trên độ chính xác vượt trội, YOLO11 Xử lý các tình huống đông đúc một cách dễ dàng, hỗ trợ các hệ thống phân tích bán lẻ tự động và quản lý giao thông mà không cần quy mô lớn. GPU các cụm.
  • Điện toán biên: Hiệu quả bộ nhớ cao và các tùy chọn xuất dữ liệu mạnh mẽ giúp YOLO11 Hoàn hảo cho việc triển khai AI biên trên các thiết bị như Raspberry Pi hoặc NVIDIA Nền tảng Jetson.
  • Các quy trình phức tạp: Nếu một dự án yêu cầu kết hợp phát hiện đối tượng với các điểm mấu chốt về tư thế (ví dụ: phân tích thể thao) hoặc phân đoạn đối tượng chính xác (ví dụ: hình ảnh y tế), YOLO11 Xử lý tất cả các tác vụ một cách tự nhiên thông qua một API thống nhất.

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLO11 Việc lựa chọn YOLOX phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn YOLO11

YOLO11 là một lựa chọn tốt cho:

  • Triển khai tại biên môi trường sản xuất: Các ứng dụng thương mại trên các thiết bị như Raspberry Pi hoặc NVIDIA Jetson , nơi độ tin cậy và bảo trì thường xuyên là yếu tố tối quan trọng.
  • Ứng dụng thị giác đa nhiệm: Các dự án yêu cầu phát hiện , phân đoạn , ước lượng tư thếOBB trong một khung thống nhất duy nhất.
  • Tạo mẫu và triển khai nhanh chóng: Các nhóm cần chuyển nhanh từ thu thập dữ liệu sang sản xuất bằng cách sử dụng API Python Ultralytics được tối ưu hóa.

Khi nào nên chọn YOLOX

YOLOX được khuyên dùng cho:

  • Nghiên cứu phát hiện không cần neo: Nghiên cứu học thuật sử dụng kiến ​​trúc sạch, không cần neo của YOLOX làm cơ sở để thử nghiệm các đầu phát hiện hoặc hàm mất mát mới.
  • Các thiết bị biên siêu nhẹ: Triển khai trên vi điều khiển hoặc phần cứng di động thế hệ cũ, nơi mà kích thước cực nhỏ (0,91 triệu tham số) của biến thể YOLOX-Nano là rất quan trọng.
  • Nghiên cứu phân bổ nhãn SimOTA: Các dự án nghiên cứu điều tra các chiến lược phân bổ nhãn dựa trên phương tiện vận chuyển tối ưu và tác động của chúng đến sự hội tụ của quá trình huấn luyện.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Nhìn về phía trước: Sức mạnh của YOLO26

Trong khi YOLO11 Là một lựa chọn đặc biệt, trong bối cảnh trí tuệ nhân tạo (AI) không ngừng phát triển nhanh chóng. Đối với các nhóm đang tìm kiếm hiệu quả và độ ổn định tối ưu, YOLO26 (phát hành tháng 1 năm 2026) là sự lựa chọn tối ưu nhất cho các dự án thị giác máy tính mới.

YOLO26 đánh dấu một bước tiến vượt bậc bằng cách triển khai thiết kế không sử dụng NMS từ đầu đến cuối . Bằng cách loại bỏ quá trình xử lý hậu kỳ Non-Maximum Suppression ( NMS ) , nó loại bỏ hoàn toàn sự biến đổi độ trễ, đơn giản hóa đáng kể logic triển khai — một khái niệm lần đầu tiên được tiên phong trong YOLOv10 .

Hơn nữa, YOLO26 có tính năng Loại bỏ DFL (Distribution Focal Loss), tối ưu hóa kiến ​​trúc để đạt được tốc độ suy luận CPU nhanh hơn tới 43% , biến nó trở thành nhà vô địch không thể tranh cãi cho các thiết bị công suất thấp và thiết bị biên. Độ ổn định huấn luyện cũng được tăng cường mạnh mẽ thông qua Trình tối ưu hóa MuSGD — một thuật toán lai lấy cảm hứng từ LLM. SGD và Muon giúp tăng tốc độ hội tụ. Kết hợp với các hàm mất mát tiên tiến như ProgLoss + STAL , YOLO26 vượt trội trong việc phát hiện các vật thể nhỏ trong môi trường đầy thách thức như ảnh chụp từ máy bay không người lái và cảm biến IoT biên.

Khám phá thêm

Bạn muốn mở rộng kiến ​​thức về các kiến ​​trúc phát hiện đối tượng? Hãy khám phá khả năng từ vựng mở của YOLO -World hoặc tìm hiểu sâu hơn về mô hình RT-DETR dựa trên Transformer được mô tả trong tài liệu này. Ultralytics hệ sinh thái.

Tóm lại, mặc dù YOLOX đã giới thiệu những khái niệm kiến ​​trúc quan trọng vào năm 2021, nhưng bộ công cụ toàn diện, hiệu quả bộ nhớ và hiệu năng tiên tiến của... YOLO11 —và đặc biệt là kiến ​​trúc mang tính cách mạng của YOLO26—tạo nên Ultralytics Hệ sinh thái là sự lựa chọn tối ưu cho các nhà nghiên cứu và nhà phát triển doanh nghiệp hiện nay.


Bình luận