Chuyển đến nội dung

So sánh PP-YOLOE+ và EfficientDet: So sánh kỹ thuật cho phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng tối ưu là rất quan trọng đối với các ứng dụng thị giác máy tính. Trang này cung cấp so sánh kỹ thuật chi tiết giữa PP-YOLOE+EfficientDet, hai mô hình quan trọng, để hỗ trợ bạn đưa ra quyết định sáng suốt dựa trên các yêu cầu của dự án. Chúng ta sẽ đi sâu vào thiết kế kiến trúc, điểm chuẩn hiệu suất và tính phù hợp của ứng dụng. Mặc dù cả hai mô hình đều có những đóng góp quan trọng, nhưng chúng đại diện cho các giai đoạn khác nhau trong quá trình phát triển của các bộ phát hiện đối tượng hiệu quả.

PP-YOLOE+: Tối ưu hóa cho hiệu quả và độ chính xác

PP-YOLOE+, được phát triển bởi các tác giả PaddlePaddle tại Baidu và phát hành vào ngày 2 tháng 4 năm 2022, là một phiên bản nâng cao của series PP-YOLOE. Nó tập trung vào việc cung cấp độ chính xác cao và triển khai hiệu quả, đặc biệt là trong hệ sinh thái PaddlePaddle. Nó nổi bật như một detector một giai đoạn không neo, được thiết kế để cân bằng hiệu suất và tốc độ vượt trội trong các tác vụ phát hiện đối tượng.

Kiến trúc và các tính năng chính

PP-YOLOE+ áp dụng phương pháp không cần anchor box, giúp đơn giản hóa cấu trúc mô hình và quy trình huấn luyện bằng cách loại bỏ nhu cầu về các anchor box được xác định trước. Kiến trúc của nó có một decoupled detection head, tách biệt các tác vụ phân loại và định vị, giúp cải thiện độ chính xác tổng thể. Mô hình sử dụng VariFocal Loss, một hàm mất mát chuyên biệt, để xử lý tốt hơn sự mất cân bằng giữa các mẫu dương và âm, từ đó tinh chỉnh độ chính xác của phân loại và bounding box. Kiến trúc này bao gồm các cải tiến ở backbone, neck với Path Aggregation Network (PAN) và head để tăng cường cả độ chính xác lẫn tốc độ suy luận.

Điểm mạnh và Điểm yếu

  • Ưu điểm: Độ chính xác cao so với số lượng tham số, thiết kế không mỏ neo giúp đơn giản hóa việc triển khai và được hỗ trợ tốt trong framework PaddlePaddle. Mô hình cho thấy tốc độ suy luận GPU tuyệt vời khi được tối ưu hóa với TensorRT.
  • Điểm yếu: Được tối ưu hóa chủ yếu cho hệ sinh thái PaddlePaddle, điều này có thể hạn chế tính linh hoạt cho người dùng các framework phổ biến khác như PyTorch. Hỗ trợ từ cộng đồng và các tài nguyên có sẵn có thể ít phong phú hơn so với các mô hình được áp dụng trên toàn cầu như dòng Ultralytics YOLO.

Các Trường hợp Sử dụng

Hiệu suất cân bằng và thiết kế không neo hiện đại giúp PP-YOLOE+ trở thành một lựa chọn linh hoạt cho nhiều ứng dụng khác nhau. Nó rất phù hợp cho các tác vụ như kiểm tra chất lượng công nghiệp, tự động hóa tái chế và nâng cao hoạt động bán lẻ thông minh.

Tìm hiểu thêm về PP-YOLOE+

EfficientDet: Kiến trúc có thể mở rộng và hiệu quả

EfficientDet được giới thiệu bởi nhóm Google Brain vào tháng 11 năm 2019. Nó đã thiết lập một tiêu chuẩn mới về hiệu quả trong phát hiện đối tượng bằng cách giới thiệu một họ các mô hình có thể mở rộng từ các thiết bị biên đến các máy chủ đám mây lớn. Các cải tiến cốt lõi của nó tập trung vào việc tạo ra một kiến trúc có tính mở rộng và hiệu quả cao.

Kiến trúc và các tính năng chính

Kiến trúc của EfficientDet được xây dựng dựa trên ba ý tưởng chính:

  • EfficientNet Backbone: Sử dụng EfficientNet hiệu quả cao làm backbone để trích xuất đặc trưng, được thiết kế bằng cách sử dụng tìm kiếm kiến trúc mạng nơ-ron để tối ưu hóa độ chính xác và FLOPs.
  • BiFPN (Mạng lưới Kim tự tháp Đặc trưng Hai hướng): Thay vì một FPN tiêu chuẩn, EfficientDet giới thiệu BiFPN, một phương pháp hợp nhất đặc trưng đa tỷ lệ hiệu quả hơn. Nó cho phép luồng thông tin dễ dàng và nhanh chóng trên các cấp độ đặc trưng khác nhau với các kết nối có trọng số.
  • Compound Scaling: Một phương pháp scaling mới điều chỉnh đồng đều độ sâu, độ rộng và độ phân giải cho backbone, mạng đặc trưng và detection head bằng cách sử dụng một hệ số compound đơn giản. Điều này cho phép mô hình mở rộng từ biến thể D0 nhỏ đến D7 lớn một cách có nguyên tắc và hiệu quả.

Phân tích hiệu suất

Bảng dưới đây cung cấp so sánh chi tiết về hiệu suất. Trong khi EfficientDet là công nghệ tiên tiến nhất tại thời điểm phát hành, các điểm chuẩn cho thấy các mô hình mới hơn như PP-YOLOE+ mang lại hiệu suất tốt hơn đáng kể, đặc biệt về tốc độ suy luận trên GPU. Ví dụ: PP-YOLOE+l đạt mAP cao hơn (52.9) so với EfficientDet-d5 (51.5) nhưng nhanh hơn hơn 8 lần trên GPU T4 với TensorRT. Điều này làm nổi bật những tiến bộ nhanh chóng trong kiến trúc mô hình và kỹ thuật tối ưu hóa.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Điểm mạnh và Điểm yếu

  • Ưu điểm: Kiến trúc đột phá với BiFPN và khả năng mở rộng hỗn hợp đã ảnh hưởng đến nhiều mô hình tiếp theo. Khả năng mở rộng cao trên một loạt các yêu cầu về tài nguyên tính toán.
  • Điểm yếu: Tốc độ suy luận chậm hơn so với các kiến trúc hiện đại. Thiết kế dựa trên anchor phức tạp hơn so với các lựa chọn thay thế không cần anchor. Việc triển khai ban đầu là trong TensorFlow, điều này có thể là một trở ngại cho cộng đồng nghiên cứu chủ yếu sử dụng PyTorch.

Các Trường hợp Sử dụng

EfficientDet vẫn là một lựa chọn khả thi cho các ứng dụng mà khả năng mở rộng mô hình là chìa khóa và hiệu suất thời gian thực cực cao không phải là hạn chế chính. Nó có thể được sử dụng để xử lý hàng loạt hình ảnh ngoại tuyến, API thị giác dựa trên đám mây và một số tình huống AI biên nhất định, nơi các biến thể nhỏ hơn của nó (D0-D2) có thể cung cấp sự cân bằng tốt giữa độ chính xác và tài nguyên.

Tìm hiểu thêm về EfficientDet

Kết luận: Bạn nên chọn mô hình nào?

Cả PP-YOLOE+ và EfficientDet đều là những mô hình mạnh mẽ, nhưng chúng phục vụ cho các nhu cầu khác nhau và đại diện cho các thời điểm khác nhau trong dòng thời gian nghiên cứu phát hiện đối tượng.

  • PP-YOLOE+ là một lựa chọn tốt nếu bạn đang làm việc trong hệ sinh thái PaddlePaddle và cần một trình dò tìm không neo hiện đại, nhanh chóng và chính xác.
  • EfficientDet vẫn là một mô hình mang tính bước ngoặt do những đổi mới về kiến trúc của nó. Tuy nhiên, đối với các dự án mới, hiệu suất của nó phần lớn đã bị vượt qua bởi các mô hình mới hơn.

Đối với các nhà phát triển và nhà nghiên cứu đang tìm kiếm sự kết hợp tốt nhất giữa hiệu suất, tính linh hoạt và dễ sử dụng, chúng tôi khuyên bạn nên xem xét dòng Ultralytics YOLO. Các mô hình như YOLOv8YOLO11 mới nhất mang lại một số lợi thế chính:

  • Cân bằng hiệu suất: Các mô hình Ultralytics YOLO cung cấp sự cân bằng hiện đại giữa tốc độ và độ chính xác, phù hợp cho cả triển khai biên thời gian thực và các ứng dụng đám mây có độ chính xác cao.
  • Tính linh hoạt: Chúng là các mô hình đa tác vụ, không chỉ hỗ trợ phát hiện đối tượng mà còn cả phân vùng thể hiện, ước tính tư thế, phân loại và hơn thế nữa, tất cả trong một khuôn khổ duy nhất, thống nhất.
  • Dễ sử dụng: Các mô hình đi kèm với Python APICLI đơn giản, tài liệu phong phú và quy trình huấn luyện trực quan.
  • Hệ sinh thái được duy trì tốt: Ultralytics cung cấp một hệ sinh thái mạnh mẽ với sự phát triển tích cực, hỗ trợ cộng đồng mạnh mẽ và tích hợp liền mạch với các công cụ như Ultralytics HUB để hợp lý hóa MLOps từ quản lý tập dữ liệu đến triển khai.
  • Hiệu Quả Huấn Luyện: Các mô hình Ultralytics YOLO được biết đến với khả năng huấn luyện hiệu quả, đòi hỏi ít bộ nhớ và thời gian hơn so với nhiều lựa chọn thay thế, đồng thời đi kèm với một loạt các trọng số đã được huấn luyện trước để tăng tốc các dự án tùy chỉnh.

Để so sánh chi tiết hơn, bạn có thể quan tâm đến việc khám phá cách các mô hình này so sánh với các kiến trúc phổ biến khác như YOLO11 so với EfficientDet hoặc PP-YOLOE+ so với YOLOv10.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận