Chuyển đến nội dung

YOLOX so với... YOLO11 Kết nối nghiên cứu và ứng dụng thực tiễn.

Trong bối cảnh phát triển nhanh chóng của lĩnh vực phát hiện đối tượng , việc lựa chọn mô hình phù hợp thường đòi hỏi sự cân bằng giữa nghiên cứu tiên tiến và nhu cầu triển khai thực tế. Bài so sánh này khám phá hai kiến ​​trúc quan trọng: YOLOX , một bộ phát hiện không cần neo hiệu suất cao được phát hành năm 2021, và YOLO11 , một mô hình linh hoạt và mạnh mẽ từ... Ultralytics Được thiết kế cho các ứng dụng doanh nghiệp hiện đại. Mặc dù cả hai mẫu đều có chung đặc điểm này. YOLO Mặc dù cùng nguồn gốc, chúng lại khác biệt đáng kể về triết lý kiến ​​trúc, khả năng hỗ trợ hệ sinh thái và tính dễ sử dụng.

So sánh Các chỉ số Hiệu suất

Khi đánh giá các bộ phát hiện đối tượng, các chỉ số quan trọng như Độ chính xác trung bình (Mean Average Precision) mAP ) và tốc độ suy luận là tối quan trọng. Bảng dưới đây nêu bật cách kiến ​​trúc mới hơn của YOLO11 mang lại hiệu quả vượt trội, đặc biệt là trong sự cân bằng giữa tốc độ và độ chính xác.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

YOLOX: Một sự tiến hóa không cần neo giữ

YOLOX được Megvii giới thiệu vào năm 2021 như một phiên bản không cần neo của... YOLO Loạt sản phẩm này nhằm mục đích thu hẹp khoảng cách giữa nghiên cứu học thuật và ứng dụng công nghiệp bằng cách đơn giản hóa đầu dò và loại bỏ nhu cầu về các hộp neo được xác định trước.

Các tính năng chính:

  • Thiết kế không cần Anchor: Loại bỏ quy trình phân cụm hộp neo phức tạp, đơn giản hóa quy trình huấn luyện.
  • Phân tách đầu xử lý: Tách biệt các tác vụ phân loại và hồi quy thành các nhánh khác nhau, giúp cải thiện tốc độ hội tụ và độ chính xác.
  • SimOTA: Một chiến lược gán nhãn nâng cao, tự động gán các mẫu tích cực, giúp tăng cường tính ổn định của quá trình huấn luyện.

Mặc dù YOLOX đại diện cho một bước tiến đáng kể vào năm 2021, việc triển khai nó thường đòi hỏi thiết lập phức tạp hơn và thiếu sự hỗ trợ đa nhiệm thống nhất như trong các framework mới hơn.

Chi tiết YOLOX:

YOLO11 Tính linh hoạt và sức mạnh hệ sinh thái

YOLO11 , được phát hành bởi Ultralytics Nó được xây dựng dựa trên sự thành công của các phiên bản tiền nhiệm để mang đến một mô hình không chỉ chính xác mà còn cực kỳ dễ sử dụng và triển khai. Nó được thiết kế như một giải pháp toàn diện cho nhiều nhiệm vụ thị giác máy tính khác nhau.

Điểm mạnh chính:

  • Dễ sử dụng: Ultralytics API này nổi tiếng về sự đơn giản. Việc tải, huấn luyện và dự đoán có thể được thực hiện chỉ với một vài dòng mã, giúp giảm đáng kể rào cản gia nhập cho các nhà phát triển.
  • Hệ sinh thái được duy trì tốt: YOLO11 Được hỗ trợ bởi việc bảo trì tích cực, cập nhật thường xuyên và một cộng đồng năng động. Điều này đảm bảo khả năng tương thích với các phiên bản PyTorch mới nhất và sửa lỗi nhanh chóng.
  • Tính linh hoạt: Không giống như YOLOX, chủ yếu là một ứng dụng phát hiện đối tượng, YOLO11 Hỗ trợ đa dạng các tác vụ bao gồm phân đoạn đối tượng , ước lượng tư thế , phân loại và phát hiện hộp giới hạn định hướng (OBB) .
  • Hiệu quả đào tạo: YOLO11 được tối ưu hóa để sử dụng tài nguyên hiệu quả, thường yêu cầu ít bộ nhớ hơn trong quá trình huấn luyện so với các phương pháp thay thế dựa trên transformer như RT-DETR .

Tìm hiểu thêm về YOLO11

YOLO11 Chi tiết:

Bạn có biết?

Để có được hiệu năng biên tiên tiến nhất, hãy xem YOLO26 . Được phát hành vào tháng 1 năm 2026, nó có tính năng xử lý đầu cuối tích hợp sẵn. NMS - Thiết kế miễn phí, trình tối ưu hóa MuSGD và tốc độ nhanh hơn tới 43% CPU suy luận, biến nó trở thành lựa chọn hàng đầu cho AI biên.

So sánh kiến trúc

Sự khác biệt về kiến ​​trúc giữa YOLOX và YOLO11 Nêu bật sự phát triển của các chiến lược phát hiện đối tượng theo thời gian.

Kiến trúc YOLOX

YOLOX sử dụng hệ thống xương sống CSPDarknet tương tự như... YOLOv5 nhưng lại giới thiệu cấu trúc đầu tách rời. Trong truyền thống YOLO Các mô hình, phân loại và định vị được thực hiện theo cách kết hợp. YOLOX tách chúng thành hai nhánh riêng biệt, giúp giải quyết mâu thuẫn giữa độ tin cậy phân loại và độ chính xác định vị. Cơ chế không dựa trên anchor của nó coi việc phát hiện đối tượng như một bài toán hồi quy điểm, giúp đơn giản hóa thiết kế mô hình nhưng đôi khi có thể gặp khó khăn với các trường hợp đối tượng cực kỳ dày đặc so với các phương pháp dựa trên anchor.

Kiến trúc YOLO11

YOLO11 Nó sử dụng kiến ​​trúc xương sống và cổ được tinh chỉnh giúp tăng cường khả năng trích xuất đặc trưng trên các quy mô khác nhau. Nó tích hợp các mô-đun tiên tiến để chú ý không gian tốt hơn và kết hợp đặc trưng. Một lợi thế quan trọng của... Ultralytics Điểm mấu chốt là sự tích hợp liền mạch khả năng xuất khẩu . Kiến trúc được thiết kế từ đầu để dễ dàng xuất sang các định dạng như ONNX , TensorRTOpenVINO , đảm bảo độ chính xác cao quan sát được trong quá trình huấn luyện sẽ trực tiếp chuyển thành khả năng suy luận hiệu quả trên các thiết bị biên.

Các trường hợp sử dụng lý tưởng

Việc lựa chọn giữa các mô hình này thường phụ thuộc vào các yêu cầu cụ thể của dự án của bạn.

Khi nào nên chọn YOLOX

  • Các tiêu chuẩn nghiên cứu: YOLOX là một điểm tham chiếu tuyệt vời cho các nghiên cứu học thuật tập trung vào các phương pháp phát hiện không cần neo hoặc sửa đổi các đầu tách rời.
  • Hệ thống cũ: Nếu bạn có một quy trình hiện có được xây dựng dựa trên mã nguồn Megvii hoặc cần chiến lược phân bổ SimOTA cho một tập dữ liệu chuyên biệt.

Khi nào nên chọn YOLO11

  • Phát triển nhanh chóng: Nếu bạn cần chuyển đổi nhanh chóng từ tập dữ liệu sang mô hình đã triển khai, Nền tảng Ultralytics được tối ưu hóa và Python API tạo ra YOLO11 Sự lựa chọn tối ưu.
  • Yêu cầu đa nhiệm: Các dự án có thể mở rộng từ việc phát hiện đơn giản sang phân đoạn hoặc theo dõi sẽ được hưởng lợi từ... YOLO11 khuôn khổ thống nhất của nó.
  • Triển khai sản xuất: Đối với các ứng dụng thương mại trong lĩnh vực bán lẻ, thành phố thông minh hoặc an ninh, sự hỗ trợ xuất khẩu mạnh mẽ và độ tin cậy đã được cộng đồng kiểm chứng của YOLO11 giảm thiểu rủi ro triển khai.
  • Điện toán biên: Với các biến thể được tối ưu hóa, YOLO11 hoạt động cực kỳ tốt trên các thiết bị có tài nguyên hạn chế như Raspberry Pi hoặc NVIDIA Jetson.

So sánh mã: Dễ sử dụng

Sự khác biệt về tính khả dụng rất rõ rệt khi so sánh các quy trình đào tạo.

Luyện tập với Ultralytics YOLO11 : Ultralytics Hệ sinh thái đơn giản hóa sự phức tạp, cho phép bạn tập trung vào dữ liệu của mình.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Huấn luyện với YOLOX: YOLOX thường yêu cầu sao chép kho lưu trữ, thiết lập môi trường cụ thể và chạy huấn luyện thông qua các tập lệnh dòng lệnh với nhiều tham số, điều này có thể không trực quan lắm. Python quy trình làm việc tập trung vào -.

Kết luận

Cả YOLOX và YOLO11 YOLOX là những mô hình mạnh mẽ đã đóng góp đáng kể cho lĩnh vực thị giác máy tính. YOLOX đã thách thức sự thống trị của các phương pháp dựa trên neo và giới thiệu các khái niệm quan trọng như đầu tách rời. Tuy nhiên, đối với hầu hết các nhà phát triển và doanh nghiệp hiện nay, YOLO11 cung cấp một gói giải pháp hấp dẫn hơn. Sự kết hợp giữa hiệu năng cao , tính linh hoạthệ sinh thái vượt trội khiến nó trở thành lựa chọn thực tế để xây dựng các giải pháp AI trong thế giới thực.

Đối với những ai muốn vượt qua giới hạn hiện tại, đặc biệt là đối với các triển khai ở biên mạng, chúng tôi đặc biệt khuyên bạn nên tìm hiểu YOLO26 . Với giải pháp toàn diện từ đầu đến cuối... NMS - Với thiết kế không cần cấu hình và loại bỏ tổn hao tiêu điểm phân phối (DFL), YOLO26 đại diện cho bước tiến tiếp theo về hiệu quả và tốc độ.

Các Mô hình Khác để Khám phá

  • YOLO26 : Mẫu đồng hồ hiện đại nhất từ... Ultralytics (Tháng 1 năm 2026), có sự góp mặt của... NMS - Suy luận tự do và các hàm mất mát chuyên biệt.
  • YOLOv8 : Một ứng dụng kinh điển được sử dụng rộng rãi trong... YOLO Gia đình này nổi tiếng với sự cân bằng giữa tốc độ và độ chính xác.
  • RT-DETR : Một thiết bị dò dựa trên biến áp cung cấp độ chính xác cao, lý tưởng cho các trường hợp mà tốc độ thời gian thực không quan trọng bằng độ chính xác.
  • SAM 2 : Mô hình phân đoạn mọi thứ của Meta, hoàn hảo cho các tác vụ phân đoạn không cần dữ liệu huấn luyện.

Bình luận