Chuyển đến nội dung

So sánh toàn diện giữa EfficientDet và YOLOX về phát hiện đối tượng

Khi thiết kế kiến ​​trúc cho một hệ thống xử lý hình ảnh máy tính hiện đại, việc lựa chọn mô hình phù hợp là một quyết định quan trọng, quyết định cả độ chính xác và khả năng hoạt động trong thời gian thực. Hướng dẫn kỹ thuật này cung cấp sự so sánh chuyên sâu giữa hai kiến ​​trúc then chốt trong sự phát triển của mạng nơ-ron: Google Chúng ta sẽ phân tích EfficientDet của và YOLOX của Megvii. Chúng ta sẽ đánh giá mô hình kiến ​​trúc của chúng, xem xét hiệu năng được kiểm chứng và so sánh chúng với các giải pháp tiên tiến như Ultralytics YOLO26 mới ra mắt.

Tổng quan về EfficientDet

Được giới thiệu bởi Google Nhóm nghiên cứu Brain, EfficientDet, đã tiên phong trong việc áp dụng phương pháp tiếp cận có cấu trúc cao để mở rộng mô hình, chứng minh rằng độ chính xác cao có thể đạt được với số lượng tham số ít hơn đáng kể so với các mạng nơ-ron hiện đại có nhiều tham số.

Chi tiết EfficientDet:

Điểm nổi bật về kiến trúc

EfficientDet được xây dựng dựa trên nền tảng EfficientNet, áp dụng phương pháp mở rộng phức hợp giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng của mạng. Tính năng nổi bật của nó là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN) , cho phép kết hợp đặc trưng đa tỷ lệ nhanh chóng và hiệu quả. Bằng cách sử dụng trọng số có thể học được cho các đặc trưng đầu vào khác nhau, BiFPN đảm bảo rằng mạng ưu tiên dữ liệu không gian quan trọng hơn.

Mặc dù số phép tính FLOPs lý thuyết của EfficientDet rất thấp, nhưng việc nó phụ thuộc vào hệ sinh thái TensorFlow và các cấu hình AutoML cũ hơn có thể khiến việc tích hợp nó vào các hệ thống hiện đại, phát triển nhanh chóng trở nên khó khăn. PyTorch quy trình làm việc. Hơn nữa, mạng lưới đa nhánh phức tạp của nó đôi khi có thể dẫn đến mức tiêu thụ bộ nhớ cao hơn dự kiến ​​trong quá trình huấn luyện so với các hệ thống hiện đại. YOLO các biến thể.

Tìm hiểu thêm về EfficientDet

Tổng quan về YOLOX

Ra mắt hai năm sau đó, YOLOX hướng đến mục tiêu thu hẹp khoảng cách giữa nghiên cứu học thuật và ứng dụng công nghiệp bằng cách chuyển đổi phương pháp truyền thống. YOLO kiến trúc thành một khung cấu trúc không cần neo.

Chi tiết YOLOX:

Điểm nổi bật về kiến trúc

YOLOX đã đơn giản hóa đáng kể mô hình phát hiện đối tượng. Bằng cách chuyển sang thiết kế không sử dụng anchor box , YOLOX đã loại bỏ nhu cầu điều chỉnh anchor box phức tạp, phụ thuộc vào tập dữ liệu, giảm thiểu chi phí xử lý heuristic. Nó cũng tích hợp một bộ xử lý tách rời—tách biệt các nhiệm vụ phân loại và định vị—giúp cải thiện đáng kể tốc độ hội tụ. Hơn nữa, việc giới thiệu chiến lược gán nhãn SimOTA đã tối ưu hóa việc phân bổ các mẫu tích cực một cách linh hoạt trong quá trình huấn luyện.

Bất chấp những tiến bộ này, việc quản lý kho lưu trữ YOLOX thường đòi hỏi phải biên dịch các phần mở rộng C++ thủ công và xử lý các phụ thuộc phức tạp, điều này có thể cản trở việc triển khai mô hình nhanh chóng đối với các nhóm ít kinh nghiệm.

Tìm hiểu thêm về YOLOX

So sánh hiệu suất

Khi đánh giá các mô hình để đưa vào sản xuất, việc cân bằng giữa độ chính xác trung bình ( mAP ) và tốc độ suy luận là vô cùng quan trọng. Bảng dưới đây cung cấp sự so sánh trực tiếp giữa các họ EfficientDet và YOLOX trên các tiêu chuẩn thông thường. COCO tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Thông tin chi tiết về hiệu suất

Trong khi EfficientDet đạt được độ chính xác cao trên các mô hình lớn hơn của nó. d7 Các biến thể của YOLOX mang lại độ trễ vượt trội hơn nhiều. GPU phần cứng (thông qua) TensorRT), khiến nó trở thành lựa chọn tốt hơn cho các ứng dụng yêu cầu tốc độ khung hình cao như lái xe tự động hoặc theo dõi thể thao.

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa EfficientDet và YOLOX phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn EfficientDet

EfficientDet là một lựa chọn mạnh mẽ cho:

  • Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
  • Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
  • Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.

Khi nào nên chọn YOLOX

YOLOX được khuyên dùng cho:

  • Nghiên cứu phát hiện không cần neo: Nghiên cứu học thuật sử dụng kiến ​​trúc sạch, không cần neo của YOLOX làm cơ sở để thử nghiệm các đầu phát hiện hoặc hàm mất mát mới.
  • Các thiết bị biên siêu nhẹ: Triển khai trên vi điều khiển hoặc phần cứng di động thế hệ cũ, nơi mà kích thước cực nhỏ (0,91 triệu tham số) của biến thể YOLOX-Nano là rất quan trọng.
  • Nghiên cứu phân bổ nhãn SimOTA: Các dự án nghiên cứu điều tra các chiến lược phân bổ nhãn dựa trên phương tiện vận chuyển tối ưu và tác động của chúng đến sự hội tụ của quá trình huấn luyện.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Cái Ultralytics Ưu điểm: Giới thiệu YOLO26

Mặc dù EfficientDet và YOLOX đại diện cho những bước tiến đáng kể trong thời đại của chúng, nhưng thị giác máy tính hiện đại đòi hỏi tính linh hoạt cao hơn, quy trình làm việc được tối ưu hóa và tốc độ vượt trội. Đối với các nhà phát triển ưu tiên tính dễ sử dụng, yêu cầu bộ nhớ thấp hơn và hệ sinh thái được duy trì tốt, chúng tôi đặc biệt khuyên bạn nên nâng cấp lên Ultralytics YOLO26 , được phát hành vào tháng 1 năm 2026.

YOLO26 đại diện cho một sự thay đổi mang tính đột phá trong lĩnh vực này. YOLO Dòng dõi này, bằng cách khắc phục một cách có hệ thống những hạn chế được tìm thấy trong các mô hình cũ hơn như YOLOX và EfficientDet:

  • Thiết kế không cần NMS từ đầu đến cuối: Không giống như EfficientDet và YOLOX, vốn yêu cầu tính năng triệt tiêu cực đại không cần thiết tốn kém ( NMS Nhờ xử lý hậu kỳ, YOLO26 hoạt động hoàn toàn từ đầu đến cuối. Điều này loại bỏ các điểm nghẽn về độ trễ và đơn giản hóa đáng kể việc triển khai ở biên mạng.
  • Suy luận CPU nhanh hơn tới 43%: Thông qua việc tinh chỉnh kiến ​​trúc chiến lược và loại bỏ DFL (Distribution Focal Loss), YOLO26 được tối ưu hóa độc đáo cho các môi trường không có GPU chuyên dụng, vượt trội hoàn toàn so với EfficientDet trên phần cứng AI biên như Raspberry Pi.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ những cải tiến trong huấn luyện LLM (như Kimi K2 của Moonshot AI), YOLO26 sử dụng sự kết hợp của... SGD và Muon. Điều này đảm bảo quá trình huấn luyện cực kỳ ổn định và hội tụ nhanh hơn, vượt trội hơn hẳn so với các hệ thống cũ. TensorFlow các nhà ước lượng.
  • ProgLoss + STAL: Các hàm mất mát nâng cao mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ, một điểm yếu cố hữu của cả YOLOX và EfficientDet. Điều này rất quan trọng đối với phân tích dữ liệu từ máy bay không người lái và IoT.
  • Tính linh hoạt đáng kinh ngạc: Trong khi EfficientDet và YOLOX chỉ là các công cụ phát hiện hộp giới hạn, YOLO26 hỗ trợ nguyên bản Phân đoạn đối tượng , Ước tính tư thế (thông qua Ước tính logarit khả năng dư) và Hộp giới hạn định hướng (OBB) .

Tìm hiểu thêm về YOLO26

Tối ưu hóa trải nghiệm người dùng và hiệu quả đào tạo.

Một trong những trở ngại lớn nhất đối với các mô hình như YOLOX là thiết lập môi trường huấn luyện. Nền tảng Ultralytics cung cấp bộ SDK Python thống nhất, cho phép huấn luyện một mô hình hiện đại chỉ với một vài dòng mã. Ngoài ra, YOLO Các mẫu này có trình tải dữ liệu được tối ưu hóa cao, đảm bảo độ chính xác thấp hơn đáng kể. CUDA Mức sử dụng bộ nhớ so với các mô hình sử dụng nhiều bộ biến áp hoặc các mạng đa nhánh cũ hơn.

from ultralytics import YOLO

# Load the cutting-edge YOLO26n model (NMS-free!)
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the model seamlessly to ONNX or OpenVINO for edge deployment
model.export(format="openvino")

Kết luận: Đưa ra lựa chọn đúng đắn

Nếu bạn đang bảo trì một hệ thống cũ đã ăn sâu vào hệ thống hiện tại... TensorFlow Trong hệ sinh thái này, EfficientDet vẫn là một lựa chọn ổn định, đặc biệt là trong các trường hợp cần mở rộng quy mô lớn về mặt lý thuyết. Ngược lại, nếu bạn cần tốc độ thuần túy trên các codebase cũ không có anchor, YOLOX đóng vai trò là một trình dò ​​nhanh và đáng tin cậy.

Tuy nhiên, đối với bất kỳ dự án mới nào được đưa vào sản xuất, sự lựa chọn chắc chắn là Ultralytics YOLO26 (hoặc YOLO11 có độ ổn định cao để hỗ trợ các hệ thống doanh nghiệp cũ). Bằng cách cung cấp giải pháp toàn diện từ đầu đến cuối NMS - Kiến trúc miễn phí, được cải tiến vượt bậc CPU tốc độ và quy trình triển khai liền mạch thông qua các nền tảng như OpenVINO và TensorRT YOLO26 đảm bảo các ứng dụng thị giác máy tính của bạn luôn sẵn sàng cho tương lai, có độ chính xác cao và cực kỳ dễ bảo trì.


Bình luận