Chuyển đến nội dung

So sánh kỹ thuật toàn diện giữa PP-YOLOE+ và EfficientDet

Việc lựa chọn kiến ​​trúc phù hợp là bước quan trọng trong việc xây dựng các ứng dụng thị giác máy tính mạnh mẽ. Hướng dẫn kỹ thuật này sẽ khám phá những sự đánh đổi giữa hai mô hình phát hiện đối tượng nổi tiếng: PP-YOLOE+EfficientDet . Chúng ta sẽ phân tích kiến ​​trúc của chúng, đánh giá các chỉ số hiệu suất và khám phá các kịch bản triển khai lý tưởng.

Mặc dù cả hai mô hình đều đã đóng góp đáng kể cho lĩnh vực này, chúng ta cũng sẽ thảo luận về cách các giải pháp thay thế hiện đại như Ultralytics YOLO26 mang lại hiệu quả bộ nhớ vượt trội hơn nhiều, tốc độ suy luận nhanh hơn và trải nghiệm phát triển được tối ưu hóa cao.

Tổng quan kiến ​​trúc: PP-YOLOE+

PP-YOLOE+ là phiên bản cải tiến của PP- gốc. YOLO Được xây dựng đặc biệt để tối ưu hóa hiệu năng trên GPU phía máy chủ trong PaddlePaddle Hệ sinh thái này giới thiệu một số cải tiến cho kiến ​​trúc cơ bản, tập trung vào mô hình không cần neo.

Tìm hiểu thêm về PP-YOLOE+

PP-YOLOE+ sử dụng kiến ​​trúc xương sống CSPRepResNet, đầu xử lý hiệu quả theo nhiệm vụ (ET-head), và dựa nhiều vào hàm mất mát varifocal để phân loại cùng với hàm mất mát distribution focal để hồi quy hộp giới hạn. Việc chuyển sang thiết kế bộ dò không có anchor đã giúp đơn giản hóa quy trình xử lý hậu kỳ, khiến nó có tính cạnh tranh cao vào thời điểm ra mắt.

Lợi ích tích hợp

Các nhóm đã đầu tư rất nhiều vào Baidu PaddlePaddle Các framework thường thấy PP-YOLOE+ dễ áp ​​dụng hơn cho các tác vụ như phân đoạn đối tượng , mặc dù nó thiếu sự hỗ trợ đa framework rộng rãi như ở các công cụ mới hơn.

Tổng quan kiến ​​trúc: EfficientDet

EfficientDet áp dụng một phương pháp hoàn toàn khác biệt cho việc phát hiện đối tượng , dựa nhiều vào tìm kiếm kiến ​​trúc mạng nơ-ron và các nguyên tắc mở rộng phức hợp.

Tìm hiểu thêm về EfficientDet

Nền tảng của EfficientDet là Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN). Không giống như các FPN truyền thống, BiFPN cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng bằng cách giới thiệu các trọng số có thể học được để tìm hiểu tầm quan trọng của các đặc trưng đầu vào khác nhau. Kết hợp với kiến ​​trúc xương sống EfficientNet, EfficientDet mở rộng một cách có hệ thống chiều rộng, chiều sâu và độ phân giải của mạng đồng thời.

Mặc dù về mặt lý thuyết, các mô hình EfficientDet rất hiệu quả về số phép tính FLOP, nhưng đôi khi chúng gặp khó khăn trong việc chuyển đổi hiệu quả lý thuyết thành tốc độ thực tế trên các thiết bị biên do mô hình truy cập bộ nhớ phức tạp của chúng, điều này trái ngược hoàn toàn với yêu cầu bộ nhớ thấp hơn của các mô hình khác. YOLO các mô hình dựa trên.

Phân tích hiệu suất và tiêu chuẩn so sánh

Bảng dưới đây so sánh các chỉ số chính trên các tập dữ liệu chuẩn như COCO . So sánh độ chính xác trung bình ( mAP ) với tốc độ suy luận sẽ cho thấy rõ ràng đường biên Pareto.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Như đã trình bày, PP-YOLOE+ nhìn chung có khả năng mở rộng tốt hơn ở dạng thô. mAP Đối với các GPU cao cấp, EfficientDet cố gắng giảm thiểu số tham số, nhưng cả hai đều không đáp ứng được khả năng xử lý thời gian thực hiện đại cần thiết cho trí tuệ nhân tạo biên tiên tiến.

Các trường hợp sử dụng và Khuyến nghị

Việc lựa chọn giữa PP-YOLOE+ và EfficientDet phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn PP-YOLOE+

PP-YOLOE+ là một lựa chọn tuyệt vời cho:

  • Tích hợp hệ sinh thái PaddlePaddle : Các tổ chức có cơ sở hạ tầng hiện có được xây dựng trên nền tảng và công cụ PaddlePaddle của Baidu .
  • Triển khai Paddle Lite Edge: Triển khai trên phần cứng với các nhân suy luận được tối ưu hóa cao, dành riêng cho công cụ suy luận Paddle Lite hoặc Paddle.
  • Phát hiện phía máy chủ độ chính xác cao: Các kịch bản ưu tiên độ chính xác phát hiện tối đa trên các hệ thống mạnh mẽ. GPU các máy chủ mà sự phụ thuộc vào framework không phải là vấn đề đáng quan tâm.

Khi nào nên chọn EfficientDet

EfficientDet được khuyến nghị sử dụng cho:

  • Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
  • Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
  • Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Giải pháp thay thế hiện đại: Ultralytics YOLO26

Mặc dù PP-YOLOE+ và EfficientDet đại diện cho những cột mốc lịch sử quan trọng, nhưng các nhà phát triển đang tìm kiếm độ chính xác tiên tiến nhất, mức tiêu thụ bộ nhớ thấp hơn và trải nghiệm người dùng được tối ưu hóa nên xem xét Ultralytics YOLO26 .

YOLO26 đánh dấu một bước tiến vượt bậc trong lĩnh vực phát hiện đối tượng, giới thiệu một số cải tiến quan trọng:

  • Thiết kế hoàn toàn không có NMS : Dựa trên những đột phá của YOLOv10 , YOLO26 loại bỏ hoàn toàn hiện tượng Non-Maximum Suppression (NMS) một cách tự nhiên. NMS Điều này giúp giảm đáng kể độ trễ và loại bỏ các nút thắt cổ chai phức tạp trong quá trình xử lý hậu kỳ.
  • MuSGD Optimizer: Lấy cảm hứng từ những cải tiến trong đào tạo LLM, YOLO26 sử dụng phương pháp lai ghép. SGD và trình tối ưu hóa Muon. Điều này cải thiện đáng kể tính ổn định của quá trình huấn luyện và giảm thời gian hội tụ.
  • Tốc độ cực nhanh: YOLO26 mang lại khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ cũ hơn như YOLO11 , biến nó trở thành lựa chọn tốt nhất cho các thiết bị chạy bằng pin hoặc CPU -Chỉ dành cho các thiết bị biên.
  • Các hàm mất mát nâng cao: Việc tích hợp ProgLoss và STAL cải thiện đáng kể khả năng nhận dạng vật thể nhỏ, điều này rất cần thiết cho các tác vụ như phân tích dữ liệu từ máy bay không người láirobot .

Tính linh hoạt đa nhiệm

Không giống như EfficientDet chỉ tập trung vào phát hiện đối tượng, YOLO26 xử lý đồng thời việc ước tính tư thế , phân loại hình ảnhhộp giới hạn định hướng (OBB) , tất cả đều nằm trong cùng một hệ sinh thái được duy trì tốt.

Dễ sử dụng và tích hợp hệ sinh thái

Một trong những nhược điểm lớn nhất của các mô hình cũ như EfficientDet là sự phức tạp của quy trình huấn luyện và thiết lập máy học tự động . Ngược lại, Nền tảng Ultralytics mang đến trải nghiệm phát triển vượt trội.

Triển khai mô hình với Ultralytics Chỉ cần một vài dòng mã, nó tạo ra sự khác biệt rõ rệt so với các cấu hình dài dòng mà các framework cũ yêu cầu.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

Đối với những ai đang tìm kiếm các giải pháp thay thế khác, các kiến ​​trúc như RT-DETR hoặc YOLOv8 cũ cũng có sẵn trong hệ thống. Ultralytics một hệ sinh thái cho phép trao đổi và thử nghiệm liền mạch.

Kết luận

PP-YOLOE+ vẫn là một lựa chọn mạnh mẽ cho các triển khai máy chủ cụ thể trong hệ sinh thái Paddle, và EfficientDet tiếp tục là một nghiên cứu thú vị về thiết kế kiến ​​trúc tự động. Tuy nhiên, đối với các ứng dụng hiện đại đòi hỏi suy luận thời gian thực , dễ triển khai và yêu cầu bộ nhớ tối thiểu, Ultralytics YOLO26 cung cấp sự cân bằng hiệu năng thuyết phục nhất. Nó hỗ trợ natively NMS - Thiết kế miễn phí và tốc độ cực nhanh CPU Hiệu năng vượt trội khiến nó trở thành lựa chọn tối ưu để đảm bảo khả năng đáp ứng nhu cầu trong tương lai cho cơ sở hạ tầng AI của bạn.


Bình luận