Chuyển đến nội dung

So sánh kỹ thuật toàn diện giữa PP-YOLOE+ và EfficientDet

Việc lựa chọn kiến trúc phù hợp là một bước quan trọng trong việc xây dựng các ứng dụng thị giác máy tính mạnh mẽ. Hướng dẫn kỹ thuật này khám phá sự đánh đổi giữa hai mô hình detect đối tượng nổi tiếng: PP-YOLOE+EfficientDet. Chúng tôi sẽ phân tích kiến trúc của chúng, phân tích các chỉ số hiệu suất của chúng và khám phá các kịch bản triển khai lý tưởng của chúng.

Mặc dù cả hai mô hình đều đã đóng góp đáng kể cho lĩnh vực này, chúng ta cũng sẽ thảo luận về cách các giải pháp thay thế hiện đại như Ultralytics YOLO26 mang lại hiệu quả bộ nhớ vượt trội hơn nhiều, tốc độ suy luận nhanh hơn và trải nghiệm phát triển được tối ưu hóa cao.

Tổng quan kiến trúc: PP-YOLOE+

PP-YOLOE+ là phiên bản cải tiến của PP- gốc. YOLO Được xây dựng đặc biệt để tối ưu hóa hiệu năng trên GPU phía máy chủ trong PaddlePaddle Hệ sinh thái này giới thiệu một số cải tiến cho kiến ​​trúc cơ bản, tập trung vào mô hình không cần neo.

Tìm hiểu thêm về PP-YOLOE+

PP-YOLOE+ sử dụng kiến ​​trúc xương sống CSPRepResNet, đầu xử lý hiệu quả theo nhiệm vụ (ET-head), và dựa nhiều vào hàm mất mát varifocal để phân loại cùng với hàm mất mát distribution focal để hồi quy hộp giới hạn. Việc chuyển sang thiết kế bộ dò không có anchor đã giúp đơn giản hóa quy trình xử lý hậu kỳ, khiến nó có tính cạnh tranh cao vào thời điểm ra mắt.

Lợi ích tích hợp

Các nhóm đã đầu tư rất nhiều vào Baidu PaddlePaddle Các framework thường thấy PP-YOLOE+ dễ áp ​​dụng hơn cho các tác vụ như phân đoạn đối tượng , mặc dù nó thiếu sự hỗ trợ đa framework rộng rãi như ở các công cụ mới hơn.

Tổng quan kiến trúc: EfficientDet

EfficientDet áp dụng một phương pháp hoàn toàn khác biệt cho việc phát hiện đối tượng , dựa nhiều vào tìm kiếm kiến ​​trúc mạng nơ-ron và các nguyên tắc mở rộng phức hợp.

Tìm hiểu thêm về EfficientDet

Nền tảng của EfficientDet là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN). Không giống như các FPN truyền thống, BiFPN cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng bằng cách giới thiệu các trọng số có thể học được để tìm hiểu tầm quan trọng của các đặc trưng đầu vào khác nhau. Kết hợp với kiến ​​trúc xương sống EfficientNet, EfficientDet mở rộng một cách có hệ thống chiều rộng, chiều sâu và độ phân giải của mạng đồng thời.

Mặc dù về mặt lý thuyết, các mô hình EfficientDet rất hiệu quả về số phép tính FLOP, nhưng đôi khi chúng gặp khó khăn trong việc chuyển đổi hiệu quả lý thuyết thành tốc độ thực tế trên các thiết bị biên do mô hình truy cập bộ nhớ phức tạp của chúng, điều này trái ngược hoàn toàn với yêu cầu bộ nhớ thấp hơn của các mô hình khác. YOLO các mô hình dựa trên.

Phân tích hiệu suất và tiêu chuẩn so sánh

Bảng dưới đây so sánh các chỉ số chính trên các tập dữ liệu chuẩn như COCO . So sánh độ chính xác trung bình ( mAP ) với tốc độ suy luận sẽ cho thấy rõ ràng đường biên Pareto.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Như đã trình bày, PP-YOLOE+ nhìn chung mở rộng tốt hơn về mAP thô cho các GPU cao cấp, trong khi EfficientDet cố gắng giảm thiểu tham số. Tuy nhiên, cả hai đều tụt hậu so với khả năng thời gian thực hiện đại cần thiết cho AI biên tiên tiến.

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa PP-YOLOE+ và EfficientDet phụ thuộc vào các yêu cầu dự án cụ thể, các ràng buộc triển khai và sở thích hệ sinh thái của bạn.

Khi nào nên chọn PP-YOLOE+

PP-YOLOE+ là một lựa chọn tuyệt vời cho:

  • Tích hợp hệ sinh thái PaddlePaddle: Các tổ chức có cơ sở hạ tầng hiện có được xây dựng trên khung và công cụ PaddlePaddle của Baidu.
  • Triển khai biên Paddle Lite: Triển khai trên phần cứng với các nhân suy luận được tối ưu hóa cao, đặc biệt dành cho công cụ suy luận Paddle Lite hoặc Paddle.
  • Detect phía máy chủ độ chính xác cao: Các kịch bản ưu tiên độ chính xác detect tối đa trên các máy chủ GPU mạnh mẽ, nơi sự phụ thuộc vào framework không phải là mối bận tâm.

Khi nào nên chọn EfficientDet

EfficientDet được khuyến nghị sử dụng cho:

  • Hệ thống Google Cloud và TPU Pipelines: Các hệ thống được tích hợp sâu với API Google Cloud Vision hoặc cơ sở hạ tầng TPU, nơi EfficientDet có tối ưu hóa gốc.
  • Nghiên cứu về Compound Scaling: Đánh giá chuẩn học thuật tập trung vào việc nghiên cứu ảnh hưởng của việc mở rộng quy mô độ sâu, chiều rộng và độ phân giải mạng cân bằng.
  • Triển khai di động qua TFLite: Các dự án yêu cầu cụ thể xuất TensorFlow Lite cho thiết bị Android hoặc Linux nhúng.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • Triển khai biên không NMS: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của xử lý hậu kỳ Non-Maximum Suppression.
  • Môi trường chỉ có CPU: Các thiết bị không có tăng tốc GPU chuyên dụng, nơi khả năng suy luận CPU nhanh hơn tới 43% của YOLO26 mang lại lợi thế quyết định.
  • Detect đối tượng nhỏ: Các kịch bản đầy thách thức như hình ảnh từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL tăng cường đáng kể độ chính xác trên các đối tượng rất nhỏ.

Giải pháp thay thế hiện đại: Ultralytics YOLO26

Mặc dù PP-YOLOE+ và EfficientDet đại diện cho những cột mốc lịch sử quan trọng, nhưng các nhà phát triển đang tìm kiếm độ chính xác tiên tiến nhất, mức tiêu thụ bộ nhớ thấp hơn và trải nghiệm người dùng được tối ưu hóa nên xem xét Ultralytics YOLO26 .

YOLO26 đánh dấu một bước tiến vượt bậc trong lĩnh vực phát hiện đối tượng, giới thiệu một số cải tiến quan trọng:

  • Thiết kế đầu cuối không NMS: Dựa trên những đột phá của YOLOv10, YOLO26 loại bỏ tự nhiên Non-Maximum Suppression (NMS) trong quá trình suy luận. Điều này giúp giảm đáng kể độ trễ và loại bỏ các nút thắt cổ chai hậu xử lý phức tạp.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ những đổi mới trong huấn luyện LLM, YOLO26 sử dụng trình tối ưu hóa lai SGD và Muon. Điều này cải thiện đáng kể sự ổn định huấn luyện và giảm thời gian hội tụ.
  • Tốc độ cực cao: YOLO26 mang lại hiệu suất suy luận trên CPU nhanh hơn tới 43% so với các thế hệ cũ hơn như YOLO11, biến nó thành lựa chọn tốt nhất tuyệt đối cho các thiết bị biên chạy bằng pin hoặc chỉ sử dụng CPU.
  • Hàm mất mát nâng cao: Sự tích hợp ProgLoss và STAL cải thiện đáng kể khả năng nhận diện vật thể nhỏ, điều này rất cần thiết cho các tác vụ như phân tích từ dronerobot học.

Tính linh hoạt đa nhiệm

Không giống như EfficientDet chỉ tập trung vào phát hiện đối tượng, YOLO26 xử lý đồng thời việc ước tính tư thế , phân loại hình ảnhhộp giới hạn định hướng (OBB) , tất cả đều nằm trong cùng một hệ sinh thái được duy trì tốt.

Dễ sử dụng và tích hợp hệ sinh thái

Một trong những nhược điểm lớn nhất của các mô hình cũ như EfficientDet là sự phức tạp của quy trình huấn luyện và thiết lập máy học tự động . Ngược lại, Nền tảng Ultralytics mang đến trải nghiệm phát triển vượt trội.

Triển khai một mô hình với Ultralytics chỉ cần vài dòng mã, tạo ra sự khác biệt rõ rệt so với các cấu hình dài dòng mà các framework cũ hơn yêu cầu.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

Đối với những ai đang tìm kiếm các giải pháp thay thế khác, các kiến ​​trúc như RT-DETR hoặc YOLOv8 cũ cũng có sẵn trong hệ thống. Ultralytics một hệ sinh thái cho phép trao đổi và thử nghiệm liền mạch.

Kết luận

PP-YOLOE+ vẫn là một lựa chọn mạnh mẽ cho các triển khai máy chủ cụ thể trong hệ sinh thái Paddle, và EfficientDet tiếp tục là một nghiên cứu thú vị về thiết kế kiến ​​trúc tự động. Tuy nhiên, đối với các ứng dụng hiện đại đòi hỏi suy luận thời gian thực , dễ triển khai và yêu cầu bộ nhớ tối thiểu, Ultralytics YOLO26 cung cấp sự cân bằng hiệu năng thuyết phục nhất. Nó hỗ trợ natively NMS - Thiết kế miễn phí và tốc độ cực nhanh CPU Hiệu năng vượt trội khiến nó trở thành lựa chọn tối ưu để đảm bảo khả năng đáp ứng nhu cầu trong tương lai cho cơ sở hạ tầng AI của bạn.


Bình luận