Chuyển đến nội dung

PP-YOLOE+ so với EfficientDet: Phân tích chuyên sâu về các kiến ​​trúc phát hiện đối tượng

Việc định hướng trong lĩnh vực mô hình phát hiện đối tượng thường liên quan đến việc lựa chọn giữa các kiến ​​trúc cũ đã được thiết lập và các khung công tác mới hơn, được tối ưu hóa. Bài so sánh này khám phá những khác biệt kỹ thuật giữa PP-YOLOE+ , một bộ phát hiện không cần neo được tinh chỉnh từ Baidu, và EfficientDet . Google Kiến trúc có khả năng mở rộng của hãng này đã giới thiệu khả năng mở rộng theo cấp số nhân. Mặc dù cả hai đều đã có những đóng góp đáng kể cho thị giác máy tính , nhưng cách tiếp cận của chúng đối với hiệu quả và độ chính xác lại khác nhau đáng kể.

Phân tích hiệu suất và tiêu chuẩn so sánh

Sự đánh đổi giữa tốc độ suy luận và độ chính xác phát hiện — thường được đo bằng Độ chính xác trung bình ( mAP ) — là thước đo chính để đánh giá các mô hình này.

Bảng dưới đây cho thấy PP-YOLOE+ nhìn chung cung cấp độ trễ vượt trội hơn. GPU phần cứng do nó TensorRT - Thiết kế thân thiện, trong khi EfficientDet, dù tiết kiệm tham số, thường gặp phải độ trễ cao hơn do các kết nối kim tự tháp tính năng phức tạp của nó.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Kiến trúc và Triết lý Thiết kế

Sự khác biệt cốt lõi giữa hai mô hình này nằm ở cách chúng xử lý việc kết hợp và điều chỉnh tỷ lệ các tính năng.

EfficientDet: Mở rộng hợp chất và BiFPN

Được phát triển bởi Google Nhóm nghiên cứu Brain, EfficientDet, đã giới thiệu khái niệm mở rộng phức hợp, giúp mở rộng đồng đều độ phân giải, độ sâu và độ rộng của mạng.

Đặc điểm nổi bật của EfficientDet là BiFPN (Weighted Bidirectional Feature Pyramid Network) . Khác với FPN tiêu chuẩn, BiFPN cho phép kết hợp đặc trưng đa tỷ lệ từ trên xuống và từ dưới lên. Mặc dù điều này mang lại hiệu quả tham số cao (số phép tính FLOPs thấp), nhưng các mẫu truy cập bộ nhớ không đều của BiFPN có thể làm chậm đáng kể quá trình suy luận trên GPU, khiến nó kém lý tưởng hơn cho các ứng dụng thời gian thực bất chấp hiệu quả lý thuyết của nó.

PP-YOLOE+: Phát hiện không neo được tinh chỉnh

PP-YOLOE+ là sự phát triển của kiến ​​trúc PP-YOLOE, được nhóm của Baidu thiết kế để chạy đặc biệt trên... PaddlePaddle khung.

Mô hình này sử dụng mô hình không cần neo (anchor-free paradigm), loại bỏ nhu cầu về các hộp neo được xác định trước. Nó sử dụng kiến ​​trúc xương sống CSPRepResStage và chiến lược Học căn chỉnh nhiệm vụ (Task Alignment Learning - TAL) để căn chỉnh tốt hơn giữa phân loại và định vị. Phiên bản "+" đặc biệt giới thiệu kiến ​​trúc xương sống được thu nhỏ (hệ số nhân chiều rộng 0,75) và các chiến lược huấn luyện được cải tiến, giúp nó cạnh tranh hơn trong chế độ tham số thấp.

Sự tiến hóa kiến trúc

PP-YOLOE+ thể hiện sự chuyển dịch sang các kiến ​​trúc "tái tham số hóa", trong đó các cấu trúc phức tạp trong quá trình huấn luyện được thu gọn thành các khối đơn giản hơn trong quá trình suy luận. Điều này trái ngược với độ phức tạp đồ thị tĩnh của EfficientDet, mang lại tốc độ triển khai tốt hơn trên phần cứng như... NVIDIA TensorRT .

Phương pháp luận đào tạo và Hệ sinh thái

Việc lựa chọn framework thường quyết định độ dễ dàng của quá trình phát triển.

  • PP-YOLOE+ gắn bó chặt chẽ với hệ sinh thái PaddlePaddle . Mặc dù mạnh mẽ, người dùng bên ngoài hệ sinh thái này có thể gặp khó khăn khi tích hợp với các công cụ MLOps tiêu chuẩn hoặc chuyển đổi mô hình cho các mục tiêu triển khai không phải là hệ sinh thái gốc.
  • EfficientDet dựa trên TensorFlow (cụ thể là thư viện AutoML). Mặc dù được hỗ trợ rộng rãi, kho lưu trữ này lại được cập nhật ít thường xuyên hơn so với các dự án hiện đại. YOLO Việc tái tạo kết quả đôi khi đòi hỏi phải xử lý các chuỗi phụ thuộc cũ.

Ngược lại, các nhà phát triển ưu tiên tính dễ sử dụnghệ sinh thái được duy trì tốt thường hướng đến... Ultralytics . Cái Ultralytics Hệ sinh thái cho phép đào tạo liền mạch về PyTorch , cung cấp khả năng tích hợp mạnh mẽ với các công cụ như Weights & Biases và các lộ trình rõ ràng để triển khai mô hình .

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn EfficientDet

EfficientDet vẫn là một lựa chọn phù hợp cho nghiên cứu học thuật, nơi hiệu quả tham số là ràng buộc nghiêm ngặt hơn là độ trễ. Nó cũng được tìm thấy trong các ứng dụng di động cũ (khoảng năm 2020) nơi các bộ tăng tốc phần cứng cụ thể được tối ưu hóa cho các khối kiểu MobileNet.

Khi nào nên chọn PP-YOLOE+

PP-YOLOE+ hoạt động xuất sắc trong các môi trường mà hiệu suất GPU là yếu tố quan trọng, chẳng hạn như kiểm soát chất lượng công nghiệp hoặc xử lý video phía máy chủ. Phần đầu không có neo của nó giúp đơn giản hóa không gian tìm kiếm siêu tham số so với các phương pháp dựa trên neo cũ hơn.

Khi nào nên lựa chọn Ultralytics Mô hình

Dành cho các nhà phát triển đang tìm kiếm sự cân bằng giữa tốc độ và độ chính xác với chi phí kỹ thuật tối thiểu, Ultralytics Các mô hình như YOLO11YOLO26 mới được khuyến nghị. Những mô hình này yêu cầu bộ nhớ thấp hơn trong quá trình huấn luyện so với các bộ dò dựa trên Transformer và cung cấp tính linh hoạt cao — hỗ trợ các tác vụ như ước tính tư thếphân đoạn ngay từ đầu.

Ngoài ra, hiệu quả đào tạo của Ultralytics Các mô hình được tăng cường nhờ các trọng số được huấn luyện sẵn có và một API đơn giản giúp loại bỏ các đoạn mã phức tạp.

from ultralytics import YOLO

# Load the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("path/to/image.jpg")

Tìm hiểu thêm về YOLO26

Tiêu chuẩn hiện đại: Ultralytics YOLO26

Mặc dù PP-YOLOE+ và EfficientDet là những cột mốc quan trọng, lĩnh vực này đã tiến bộ hơn nữa. Ra mắt vào năm 2026, Ultralytics YOLO26 giới thiệu các tính năng đột phá nhằm khắc phục những hạn chế của các kiến ​​trúc trước đó.

Thiết kế không NMS đầu cuối

Không giống như EfficientDet và hầu hết các phần mềm khác, YOLO các biến thể yêu cầu ức chế không tối đa ( NMS (Xử lý hậu kỳ), YOLO26 là hệ thống end-to-end nguyên bản. Thiết kế này, được tiên phong trong YOLOv10 , loại bỏ độ trễ và sự phức tạp liên quan đến NMS , đảm bảo tốc độ suy luận nhanh hơn và chính xác hơn, điều cần thiết cho trí tuệ nhân tạo biên (edge ​​AI) .

Tối ưu hóa cho thiết bị biên và CPU

YOLO26 được thiết kế để triển khai rộng rãi. Nó có tính năng loại bỏ suy hao tiêu điểm phân tán (DFL) , giúp đơn giản hóa đồ thị mô hình cho các định dạng xuất như... ONNX Và CoreML Kết hợp với các tối ưu hóa giúp tăng tốc độ suy luận CPU lên tới 43% , đây là lựa chọn vượt trội cho các thiết bị từ Raspberry Pi đến điện thoại di động.

Đào tạo nâng cao với MuSGD và ProgLoss

Kế thừa những cải tiến từ quá trình huấn luyện Mô hình Ngôn ngữ Lớn (LLM), YOLO26 sử dụng Trình tối ưu hóa MuSGD — một sự kết hợp giữa... SGD và Muon. Điều này dẫn đến động lực huấn luyện ổn định hơn và hội tụ nhanh hơn. Hơn nữa, việc giới thiệu ProgLossSTAL (Soft Task Alignment Learning) cải thiện đáng kể khả năng phát hiện vật thể nhỏ , một điểm yếu phổ biến trong các bộ dò trước đây như EfficientDet-d0.

Tính đặc thù của nhiệm vụ

YOLO26 không chỉ dành cho việc tạo hộp giới hạn. Nó bao gồm các cải tiến chuyên biệt cho từng tác vụ, chẳng hạn như ước lượng logarit xác suất dư (RLE) để ước lượng tư thế với độ chính xác cao và hàm mất mát góc chuyên dụng cho các tác vụ hộp giới hạn định hướng (OBB) , đảm bảo phát hiện chính xác các đối tượng xoay trong ảnh chụp từ trên không.

Kết luận

Cả PP-YOLOE+ và EfficientDet đều mang lại những ưu điểm riêng biệt tùy thuộc vào các ràng buộc cụ thể của phần cứng và khung phần mềm được lựa chọn. EfficientDet chứng minh rằng khả năng mở rộng phức hợp là một khái niệm lý thuyết mạnh mẽ, trong khi PP-YOLOE+ thể hiện những lợi ích về tốc độ thực tế của các kiến ​​trúc được tham số hóa lại, không cần neo trên GPU.

Tuy nhiên, đối với một giải pháp toàn diện kết hợp độ chính xác hàng đầu, dễ triển khai và cộng đồng người dùng phát triển mạnh mẽ, Ultralytics YOLO26 nổi bật như một lựa chọn hàng đầu. Với khả năng xử lý từ đầu đến cuối... NMS Với kiến ​​trúc không phụ thuộc vào hệ thống và hỗ trợ gốc cho Nền tảng Ultralytics , nó cho phép các nhà phát triển chuyển từ ý tưởng sang sản phẩm với hiệu quả chưa từng có.

Để tìm hiểu thêm các tùy chọn hiệu năng cao khác, hãy xem tài liệu hướng dẫn của YOLO11 hoặc YOLOv10 .


Bình luận