Chuyển đến nội dung

EfficientDet so với PP-YOLOE+: So sánh kỹ thuật giữa các kiến ​​trúc phát hiện có khả năng mở rộng

Trong bối cảnh cạnh tranh khốc liệt của lĩnh vực phát hiện đối tượng , ít có sự cạnh tranh nào minh họa rõ nét sự tiến hóa của thiết kế mạng nơ-ron hơn sự đối lập giữa EfficientDetPP-YOLOE+ . Trong khi EfficientDet giới thiệu khái niệm về mở rộng phức hợp cho thế giới, PP-YOLOE+ đã tinh chỉnh mô hình không cần neo cho các ứng dụng công nghiệp.

Hướng dẫn này cung cấp phân tích kỹ thuật chuyên sâu về hai mô hình có ảnh hưởng lớn này, đánh giá các lựa chọn kiến ​​trúc, độ trễ suy luận và tính phù hợp triển khai của chúng. Chúng ta cũng sẽ khám phá cách các giải pháp thay thế hiện đại như Ultralytics YOLO26YOLO11 xây dựng dựa trên những nền tảng này để mang lại sự dễ sử dụng vượt trội và hiệu năng tiên tiến.

Điểm chuẩn hiệu suất tương tác

Để hiểu rõ vị trí của các mô hình này trong hệ thống phân cấp hiện tại của thị giác máy tính, hãy xem biểu đồ bên dưới. Biểu đồ này minh họa sự đánh đổi giữa tốc độ (độ trễ) và độ chính xác ( mAP ), giúp bạn xác định mô hình tối ưu phù hợp với các hạn chế phần cứng của mình.

Bảng so sánh số liệu

Bảng sau đây trình bày chi tiết các chỉ số hiệu suất trên tập dữ liệu COCO . Hãy lưu ý sự tiến bộ về hiệu quả, đặc biệt là tỷ lệ tham số trên hiệu suất.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

EfficientDet: Người tiên phong trong việc mở rộng quy mô theo cấp số nhân

Được phát triển bởi Google Nghiên cứu cho thấy EfficientDet đã cách mạng hóa thiết kế mô hình bằng cách đề xuất rằng độ chính xác và hiệu quả có thể được mở rộng cùng nhau một cách có hệ thống. Trước EfficientDet, việc mở rộng mô hình có nghĩa là tăng độ sâu, độ rộng hoặc độ phân giải một cách tùy ý.

Đổi mới Kiến trúc

EfficientDet sử dụng kiến ​​trúc xương sống EfficientNet , nổi tiếng với hiệu quả tham số cao. Tuy nhiên, tính năng nổi bật của nó là BiFPN (Mạng kim tự tháp đặc trưng hai chiều). Không giống như các FPN tiêu chuẩn cộng các đặc trưng mà không phân biệt, BiFPN áp dụng trọng số có thể học được cho các đặc trưng đầu vào khác nhau, cho phép mạng học được tầm quan trọng của từng thang đo.

Điều này được kết hợp với Compound Scaling , một phương pháp dựa trên hệ số giúp điều chỉnh đồng đều độ phân giải, độ sâu và độ rộng của mạng xương sống, mạng đặc trưng và mạng dự đoán. Cách tiếp cận toàn diện này cho phép EfficientDet bao phủ một phạm vi rộng các hạn chế về tài nguyên, từ thiết bị di động (D0) đến các thiết bị cao cấp. GPU cụm (D7).

Tìm hiểu thêm về EfficientDet

PP-YOLOE+: Được tinh chỉnh để triển khai trong công nghiệp

PP-YOLOE+ là sự phát triển của PP- YOLO loạt phim từ Baidu's PaddlePaddle nhóm. Điều này thể hiện sự chuyển dịch sang các bộ dò không cần neo, được tối ưu hóa đặc biệt cho điện toán đám mây và thiết bị biên. GPU suy luận, chẳng hạn như V100 và T4.

Đổi mới Kiến trúc

Chữ "Plus" trong PP-YOLOE+ biểu thị những cải tiến so với phiên bản gốc, bao gồm một kiến ​​trúc xương sống mạnh mẽ dựa trên CSPRepResNet . Kiến trúc này tận dụng việc tái tham số hóa để đơn giản hóa các cấu trúc phức tạp trong quá trình huấn luyện thành các lớp đơn giản hơn trong quá trình suy luận, giúp tăng tốc độ đáng kể.

PP-YOLOE+ sử dụng Học căn chỉnh nhiệm vụ (Task Alignment Learning - TAL) , một chiến lược gán nhãn chọn lọc động các mẫu tích cực dựa trên sự kết hợp giữa điểm phân loại và điểm định vị. Điều này đảm bảo rằng các dự đoán có độ tin cậy cao cũng là những dự đoán được định vị chính xác nhất, một thách thức phổ biến trong các bộ dò không sử dụng neo .

Tìm hiểu thêm về PP-YOLOE+

Phân tích chuyên sâu: Những điểm khác biệt quan trọng

1. Các phương pháp kết hợp đặc trưng

Mô hình BiFPN của EfficientDet về mặt lý thuyết rất thanh lịch, cho phép tái sử dụng các đặc trưng phức tạp. Tuy nhiên, sự bất thường trong các mẫu truy cập bộ nhớ này có thể làm chậm các bộ tăng tốc phần cứng ưu tiên các phép toán ma trận đồng nhất. Ngược lại, PP-YOLOE+ sử dụng thiết kế RepResBlock trong PANet của nó, về mặt toán học tương đương với các khối phức tạp trong quá trình huấn luyện nhưng được thu gọn thành một phép tích chập duy nhất trong quá trình suy luận, tối đa hóa thông lượng GPU .

2. Rèn luyện sự ổn định

EfficientDet dựa trên khung AutoML , việc sao chép hoặc tinh chỉnh nó có thể tốn kém về mặt tính toán nếu không có nguồn lực khổng lồ. PP-YOLOE+ sử dụng phương pháp đồ thị tĩnh điển hình của... PaddlePaddle , vốn ổn định nhưng có thể tạo cảm giác cứng nhắc so với tính chất năng động của PyTorch các mô hình dựa trên như Ultralytics YOLOv8 hoặc YOLO11 .

3. Hệ sinh thái và bảo trì

Trong khi Google Kho lưu trữ của 's có ý nghĩa lịch sử quan trọng, nhưng lại nhận được ít sự bảo trì tích cực hơn so với các dự án do cộng đồng điều khiển. PP-YOLOE+ là một phần của bộ PaddleDetection, một bộ phần mềm mạnh mẽ nhưng lại phụ thuộc nhiều vào... PaddlePaddle khung làm việc. Điều này có thể tạo ra một quá trình học tập khó khăn cho các nhà phát triển quen thuộc với PyTorch hoặc TensorFlow Điều này làm phức tạp thêm quy trình triển khai mô hình lên phần cứng không tiêu chuẩn.

Độ phức tạp triển khai

Triển khai các mô hình từ các framework cụ thể như PaddlePaddle thường yêu cầu các công cụ chuyển đổi chuyên dụng (ví dụ: paddle2onnx) trước khi chúng có thể được sử dụng với các công cụ suy luận chung như TensorRT hoặc OpenVINO .

Cái Ultralytics Ưu điểm: YOLO26 và YOLO11

Mặc dù EfficientDet và PP-YOLOE+ đã mở đường, lĩnh vực này đã chuyển sang các mô hình cung cấp sự cân bằng tốt hơn giữa tốc độ và độ chính xác với khả năng sử dụng được cải thiện đáng kể. Các mô hình Ultralytics ưu tiên trải nghiệm liền mạch cho nhà phát triển ("Dễ sử dụng") cùng với hiệu năng mạnh mẽ.

Lý do các nhà phát triển chọn Ultralytics

  1. Dễ sử dụng: Với giao diện thống nhất. Python Thông qua API, bạn có thể chuyển đổi giữa YOLO11 , YOLO26 và RT-DETR bằng cách thay đổi một chuỗi duy nhất.
  2. Hệ sinh thái được duy trì tốt: Nền tảng Ultralyticscộng đồng GitHub năng động đảm bảo bạn có quyền truy cập vào các bản vá lỗi mới nhất, định dạng xuất dữ liệu và hướng dẫn triển khai .
  3. Hiệu quả bộ nhớ: Ultralytics Các mô hình này nổi tiếng với mức tiêu thụ bộ nhớ thấp trong quá trình huấn luyện so với các kiến ​​trúc cũ hơn hoặc các mô hình transformer nặng nề, giúp chúng có thể truy cập được trên các GPU cấp người tiêu dùng.
  4. Tính linh hoạt: Không giống như EfficientDet (chỉ dùng để phát hiện), Ultralytics Các mô hình hỗ trợ sẵn có các chức năng phân đoạn , ước lượng tư thế , OBB và phân loại.

Tiêu điểm: YOLO26

Mẫu YOLO26 mới ra mắt đã thiết lập một tiêu chuẩn mới cho năm 2026. Nó tích hợp các tính năng nhằm khắc phục những hạn chế của các thế hệ trước:

  • Kiến trúc hoàn chỉnh từ đầu đến cuối: YOLO26 là kiến ​​trúc không cần hệ thống quản lý mạng NMS . Điều này loại bỏ hoàn toàn bước loại bỏ các kết quả không tối đa, vốn thường là điểm nghẽn trong các môi trường có nhiều kết nối và đơn giản hóa đáng kể logic triển khai.
  • Bộ tối ưu MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM, bộ tối ưu này đảm bảo sự hội tụ ổn định ngay cả với các tập dữ liệu khổng lồ.
  • ProgLoss + STAL: Các hàm mất mát nâng cao này cải thiện khả năng phát hiện vật thể nhỏ, một điểm yếu truyền thống của các phương pháp khác. YOLO các mô hình được so sánh với khả năng mở rộng độ phân giải cao của EfficientDet.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Tìm hiểu thêm về YOLO26

Các ứng dụng thực tế

Việc lựa chọn mô hình phù hợp thường phụ thuộc vào ứng dụng cụ thể trong ngành.

Chẩn đoán Hình ảnh Y tế

Biến thể D7 của EfficientDet từ lâu đã phổ biến trong phân tích hình ảnh y tế (như phát hiện khối u trong ảnh X-quang) vì nó xử lý hiệu quả các dữ liệu đầu vào có độ phân giải rất cao. Tuy nhiên, tốc độ suy luận chậm khiến nó chỉ có thể xử lý ngoại tuyến. Các giải pháp thay thế hiện đại như YOLO11 hiện được ưa chuộng hơn cho các công cụ hỗ trợ chẩn đoán thời gian thực.

Sản xuất và Kiểm soát chất lượng

PP-YOLOE+ hoạt động xuất sắc trong môi trường sản xuất tự động , nơi camera được cố định và ánh sáng được điều khiển. Khả năng tối ưu hóa của nó dành cho TensorRT Điều này giúp nó phù hợp với các dây chuyền lắp ráp tốc độ cao trong việc phát hiện lỗi.

Thành phố thông minh và Trí tuệ nhân tạo biên

Đối với các ứng dụng thành phố thông minh như giám sát giao thông, Ultralytics YOLO26 là lựa chọn vượt trội. Khả năng suy luận CPU nhanh hơn 43% của nó rất quan trọng đối với các thiết bị biên (như Raspberry Pi hoặc...) NVIDIA Jetson) trong trường hợp không có GPU hiệu năng cao chuyên dụng. Việc loại bỏ NMS Điều này cũng có nghĩa là độ trễ là có tính xác định, một yếu tố quan trọng đối với các hệ thống an toàn thời gian thực.

Kết luận

Cả EfficientDet và PP-YOLOE+ đều là những cột mốc quan trọng trong lịch sử thị giác máy tính. EfficientDet đã chứng minh rằng việc mở rộng quy mô có thể mang tính khoa học, trong khi PP-YOLOE+ thể hiện sức mạnh của các thiết kế không cần neo. GPU suy luận.

Tuy nhiên, đối với các nhà phát triển bắt đầu các dự án mới vào năm 2026, Ultralytics YOLO26 cung cấp gói giải pháp hấp dẫn nhất. Bằng cách kết hợp độ chính xác của các thuật toán tìm kiếm không cần neo hiện đại với sự đơn giản của một thuật toán thông thường... NMS Với thiết kế miễn phí và sự hỗ trợ mạnh mẽ từ hệ sinh thái Ultralytics , nó cung cấp con đường nhanh nhất từ ​​ý tưởng đến sản xuất.

Để bắt đầu huấn luyện các mô hình tiên tiến của riêng bạn ngay hôm nay, hãy truy cập Nền tảng Ultralytics .


Bình luận