Chuyển đến nội dung

So sánh toàn diện giữa EfficientDet và YOLOX về phát hiện đối tượng

Khi thiết kế kiến ​​trúc cho một hệ thống xử lý hình ảnh máy tính hiện đại, việc lựa chọn mô hình phù hợp là một quyết định quan trọng, quyết định cả độ chính xác và khả năng hoạt động trong thời gian thực. Hướng dẫn kỹ thuật này cung cấp sự so sánh chuyên sâu giữa hai kiến ​​trúc then chốt trong sự phát triển của mạng nơ-ron: Google Chúng ta sẽ phân tích EfficientDet của và YOLOX của Megvii. Chúng ta sẽ đánh giá mô hình kiến ​​trúc của chúng, xem xét hiệu năng được kiểm chứng và so sánh chúng với các giải pháp tiên tiến như Ultralytics YOLO26 mới ra mắt.

Tổng quan về EfficientDet

Được giới thiệu bởi Google Nhóm nghiên cứu Brain, EfficientDet, đã tiên phong trong việc áp dụng phương pháp tiếp cận có cấu trúc cao để mở rộng mô hình, chứng minh rằng độ chính xác cao có thể đạt được với số lượng tham số ít hơn đáng kể so với các mạng nơ-ron hiện đại có nhiều tham số.

Chi tiết EfficientDet:

Điểm nổi bật về kiến trúc

EfficientDet được xây dựng dựa trên nền tảng EfficientNet, áp dụng phương pháp mở rộng phức hợp giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng của mạng. Tính năng nổi bật của nó là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN) , cho phép kết hợp đặc trưng đa tỷ lệ nhanh chóng và hiệu quả. Bằng cách sử dụng trọng số có thể học được cho các đặc trưng đầu vào khác nhau, BiFPN đảm bảo rằng mạng ưu tiên dữ liệu không gian quan trọng hơn.

Mặc dù số phép tính FLOPs lý thuyết của EfficientDet rất thấp, nhưng việc nó phụ thuộc vào hệ sinh thái TensorFlow và các cấu hình AutoML cũ hơn có thể khiến việc tích hợp nó vào các hệ thống hiện đại, phát triển nhanh chóng trở nên khó khăn. PyTorch quy trình làm việc. Hơn nữa, mạng lưới đa nhánh phức tạp của nó đôi khi có thể dẫn đến mức tiêu thụ bộ nhớ cao hơn dự kiến ​​trong quá trình huấn luyện so với các hệ thống hiện đại. YOLO các biến thể.

Tìm hiểu thêm về EfficientDet

Tổng quan về YOLOX

Ra mắt hai năm sau đó, YOLOX hướng đến mục tiêu thu hẹp khoảng cách giữa nghiên cứu học thuật và ứng dụng công nghiệp bằng cách chuyển đổi phương pháp truyền thống. YOLO kiến trúc thành một khung cấu trúc không cần neo.

Chi tiết YOLOX:

Điểm nổi bật về kiến trúc

YOLOX đã đơn giản hóa đáng kể mô hình phát hiện đối tượng. Bằng cách chuyển sang thiết kế không sử dụng anchor box , YOLOX đã loại bỏ nhu cầu điều chỉnh anchor box phức tạp, phụ thuộc vào tập dữ liệu, giảm thiểu chi phí xử lý heuristic. Nó cũng tích hợp một bộ xử lý tách rời—tách biệt các nhiệm vụ phân loại và định vị—giúp cải thiện đáng kể tốc độ hội tụ. Hơn nữa, việc giới thiệu chiến lược gán nhãn SimOTA đã tối ưu hóa việc phân bổ các mẫu tích cực một cách linh hoạt trong quá trình huấn luyện.

Mặc dù có những tiến bộ này, việc quản lý các kho lưu trữ YOLOX thường yêu cầu biên dịch các tiện ích mở rộng C++ thủ công và điều hướng các phụ thuộc phức tạp, điều này có thể cản trở việc triển khai mô hình nhanh chóng cho các nhóm ít kinh nghiệm hơn.

Tìm hiểu thêm về YOLOX

So sánh hiệu suất

Khi đánh giá các mô hình để đưa vào sản xuất, việc cân bằng giữa độ chính xác trung bình ( mAP ) và tốc độ suy luận là vô cùng quan trọng. Bảng dưới đây cung cấp sự so sánh trực tiếp giữa các họ EfficientDet và YOLOX trên các tiêu chuẩn thông thường. COCO tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Thông tin chi tiết về hiệu suất

Trong khi EfficientDet đạt được độ chính xác cao trên các mô hình lớn hơn của nó. d7 Các biến thể của YOLOX mang lại độ trễ vượt trội hơn nhiều. GPU phần cứng (thông qua) TensorRT), khiến nó trở thành lựa chọn tốt hơn cho các ứng dụng FPS cao như lái xe tự hành hoặc track thể thao.

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa EfficientDet và YOLOX phụ thuộc vào các yêu cầu dự án cụ thể, các ràng buộc triển khai và sở thích hệ sinh thái của bạn.

Khi nào nên chọn EfficientDet

EfficientDet là một lựa chọn mạnh mẽ cho:

  • Hệ thống Google Cloud và TPU Pipelines: Các hệ thống được tích hợp sâu với API Google Cloud Vision hoặc cơ sở hạ tầng TPU, nơi EfficientDet có tối ưu hóa gốc.
  • Nghiên cứu về Compound Scaling: Đánh giá chuẩn học thuật tập trung vào việc nghiên cứu ảnh hưởng của việc mở rộng quy mô độ sâu, chiều rộng và độ phân giải mạng cân bằng.
  • Triển khai di động qua TFLite: Các dự án yêu cầu cụ thể xuất TensorFlow Lite cho thiết bị Android hoặc Linux nhúng.

Khi nào nên chọn YOLOX

YOLOX được khuyên dùng cho:

  • Nghiên cứu detect không Anchor: Nghiên cứu học thuật sử dụng kiến trúc không anchor, gọn gàng của YOLOX làm cơ sở để thử nghiệm các đầu detect mới hoặc hàm mất mát.
  • Thiết bị biên siêu nhẹ: Triển khai trên vi điều khiển hoặc phần cứng di động cũ, nơi dấu chân cực nhỏ của biến thể YOLOX-Nano (0.91M tham số) là rất quan trọng.
  • Nghiên cứu gán nhãn SimOTA: Các dự án nghiên cứu điều tra các chiến lược gán nhãn dựa trên vận chuyển tối ưu và tác động của chúng đến sự hội tụ huấn luyện.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • Triển khai biên không NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của xử lý hậu kỳ Non-Maximum Suppression.
  • Môi trường chỉ có CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi khả năng suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Detect đối tượng nhỏ: Các kịch bản đầy thách thức như hình ảnh từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các đối tượng rất nhỏ.

Cái Ultralytics Ưu điểm: Giới thiệu YOLO26

Mặc dù EfficientDet và YOLOX đại diện cho những bước tiến đáng kể trong thời đại của chúng, nhưng thị giác máy tính hiện đại đòi hỏi tính linh hoạt cao hơn, quy trình làm việc được tối ưu hóa và tốc độ vượt trội. Đối với các nhà phát triển ưu tiên tính dễ sử dụng, yêu cầu bộ nhớ thấp hơn và hệ sinh thái được duy trì tốt, chúng tôi đặc biệt khuyên bạn nên nâng cấp lên Ultralytics YOLO26 , được phát hành vào tháng 1 năm 2026.

YOLO26 đại diện cho một sự thay đổi mang tính đột phá trong lĩnh vực này. YOLO Dòng dõi này, bằng cách khắc phục một cách có hệ thống những hạn chế được tìm thấy trong các mô hình cũ hơn như YOLOX và EfficientDet:

  • Thiết kế NMS-Free End-to-End: Không giống như EfficientDet và YOLOX vốn yêu cầu xử lý hậu kỳ Non-Maximum Suppression (NMS) tốn kém, YOLO26 là end-to-end nguyên bản. Điều này loại bỏ các nút thắt cổ chai về độ trễ và đơn giản hóa đáng kể việc triển khai trên thiết bị biên.
  • Tăng tốc suy luận trên CPU lên đến 43%: Thông qua việc điều chỉnh kiến trúc chiến lược và loại bỏ DFL (Distribution Focal Loss), YOLO26 được tối ưu hóa độc đáo cho các môi trường không có GPU chuyên dụng, hoàn toàn vượt trội hơn EfficientDet trên phần cứng AI biên như Raspberry Pi.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ những đổi mới trong huấn luyện LLM (như Kimi K2 của Moonshot AI), YOLO26 sử dụng sự kết hợp giữa SGD và Muon. Điều này đảm bảo quá trình huấn luyện cực kỳ ổn định và khả năng hội tụ nhanh hơn, vượt trội hơn hẳn so với các bộ ước tính TensorFlow cũ hơn.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến mang lại những cải tiến đáng kể trong nhận diện vật thể nhỏ, vốn là một điểm yếu cố hữu của cả YOLOX và EfficientDet. Điều này rất quan trọng đối với phân tích từ máy bay không người lái và IoT.
  • Tính linh hoạt đáng kinh ngạc: Trong khi EfficientDet và YOLOX chỉ là các bộ phát hiện hộp giới hạn, YOLO26 hỗ trợ nguyên bản Phân đoạn đối tượng, Ước tính tư thế (thông qua Ước tính Log-Likelihood Dư), và Hộp giới hạn có hướng (OBB).

Tìm hiểu thêm về YOLO26

Tối ưu hóa trải nghiệm người dùng và hiệu quả đào tạo.

Một trong những trở ngại lớn nhất đối với các mô hình như YOLOX là thiết lập môi trường huấn luyện. Nền tảng Ultralytics cung cấp bộ SDK Python thống nhất, cho phép huấn luyện một mô hình hiện đại chỉ với một vài dòng mã. Ngoài ra, YOLO Các mẫu này có trình tải dữ liệu được tối ưu hóa cao, đảm bảo độ chính xác thấp hơn đáng kể. CUDA Mức sử dụng bộ nhớ so với các mô hình sử dụng nhiều bộ biến áp hoặc các mạng đa nhánh cũ hơn.

from ultralytics import YOLO

# Load the cutting-edge YOLO26n model (NMS-free!)
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the model seamlessly to ONNX or OpenVINO for edge deployment
model.export(format="openvino")

Kết luận: Đưa ra lựa chọn đúng đắn

Nếu bạn đang bảo trì một hệ thống cũ đã ăn sâu vào hệ thống hiện tại... TensorFlow Trong hệ sinh thái này, EfficientDet vẫn là một lựa chọn ổn định, đặc biệt là trong các trường hợp cần mở rộng quy mô lớn về mặt lý thuyết. Ngược lại, nếu bạn cần tốc độ thuần túy trên các codebase cũ không có anchor, YOLOX đóng vai trò là một trình dò ​​nhanh và đáng tin cậy.

Tuy nhiên, đối với bất kỳ dự án mới nào được đưa vào sản xuất, sự lựa chọn chắc chắn là Ultralytics YOLO26 (hoặc YOLO11 có độ ổn định cao để hỗ trợ các hệ thống doanh nghiệp cũ). Bằng cách cung cấp giải pháp toàn diện từ đầu đến cuối NMS - Kiến trúc miễn phí, được cải tiến vượt bậc CPU tốc độ và quy trình triển khai liền mạch thông qua các nền tảng như OpenVINO và TensorRT YOLO26 đảm bảo các ứng dụng thị giác máy tính của bạn luôn sẵn sàng cho tương lai, có độ chính xác cao và cực kỳ dễ bảo trì.


Bình luận