Chuyển đến nội dung

EfficientDet so với YOLOv5: So sánh kỹ thuật chi tiết

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, cân bằng giữa nhu cầu về độ chính xác, tốc độ và tài nguyên tính toán. Trang này cung cấp so sánh kỹ thuật toàn diện giữa EfficientDet, một họ mô hình từ Google nổi tiếng về khả năng mở rộng và độ chính xác và Ultralytics YOLOv5, một mô hình được áp dụng rộng rãi, nổi tiếng về tốc độ vượt trội và dễ sử dụng. Chúng ta sẽ đi sâu vào sự khác biệt về kiến trúc, điểm chuẩn hiệu suất và các trường hợp sử dụng lý tưởng của chúng để giúp bạn chọn mô hình tốt nhất cho dự án thị giác máy tính của mình.

EfficientDet: Kiến trúc có thể mở rộng và hiệu quả

EfficientDet được giới thiệu bởi nhóm Google Brain như một họ công cụ phát hiện đối tượng mới có khả năng mở rộng và hiệu quả. Đổi mới cốt lõi của nó nằm ở một kiến trúc được thiết kế cẩn thận, tối ưu hóa cả độ chính xác và hiệu quả thông qua việc mở rộng hỗn hợp.

Chi tiết kỹ thuật

Kiến trúc và các tính năng chính

Kiến trúc của EfficientDet được xây dựng dựa trên ba thành phần quan trọng:

  • EfficientNet Backbone: Sử dụng EfficientNet hiệu quả cao làm backbone để trích xuất đặc trưng, vốn đã được tối ưu hóa cho tỷ lệ độ chính xác trên tính toán tuyệt vời.
  • BiFPN (Mạng lưới Kim tự tháp Đặc trưng Hai hướng): Để hợp nhất đặc trưng, EfficientDet giới thiệu BiFPN, cho phép hợp nhất đặc trưng đa tỷ lệ đơn giản và nhanh chóng. Không giống như các FPN truyền thống, BiFPN có các kết nối hai chiều và sử dụng hợp nhất đặc trưng có trọng số để tìm hiểu tầm quan trọng của các đặc trưng đầu vào khác nhau.
  • Compound Scaling: Một phương pháp scaling mới điều chỉnh đồng đều độ sâu, độ rộng và độ phân giải cho backbone, mạng đặc trưng và mạng dự đoán hộp/lớp. Điều này cho phép tạo ra một họ các mô hình (từ D0 đến D7) phục vụ cho các giới hạn tài nguyên khác nhau trong khi vẫn duy trì tính nhất quán về kiến trúc.

Điểm mạnh và Điểm yếu

Điểm mạnh:

  • Độ chính xác cao: Các mô hình EfficientDet lớn hơn (ví dụ: D5-D7) có thể đạt được điểm mAP hiện đại, thường vượt trội hơn các mô hình khác trong các chuẩn mực về độ chính xác thuần túy.
  • Hiệu quả tham số: Đối với một mức độ chính xác nhất định, các model EfficientDet thường hiệu quả hơn về tham số và FLOP so với các kiến trúc cũ hơn như Mask R-CNN.
  • Khả năng mở rộng: Phương pháp mở rộng hỗn hợp cung cấp một lộ trình rõ ràng để tăng hoặc giảm kích thước mô hình dựa trên phần cứng mục tiêu và các yêu cầu về hiệu suất.

Điểm yếu:

  • Tốc độ suy luận: Mặc dù hiệu quả về độ chính xác, EfficientDet thường chậm hơn so với các detector một giai đoạn như YOLOv5, đặc biệt là trên GPU. Điều này có thể làm cho nó kém phù hợp hơn cho các ứng dụng suy luận thời gian thực.
  • Độ phức tạp: BiFPN và compound scaling (tỉ lệ hợp chất) giới thiệu mức độ phức tạp kiến trúc cao hơn so với thiết kế đơn giản hơn của YOLOv5.

Các trường hợp sử dụng lý tưởng

EfficientDet là một lựa chọn tuyệt vời cho các ứng dụng mà việc đạt được độ chính xác cao nhất có thể là mục tiêu chính và độ trễ là một mối quan tâm thứ yếu:

  • Phân tích hình ảnh y tế: Phát hiện các bất thường nhỏ trong các bản quét y tế, nơi độ chính xác là tối quan trọng.
  • Ảnh vệ tinh: Phân tích độ phân giải cao cho các ứng dụng như nông nghiệp hoặc giám sát môi trường.
  • Xử lý hàng loạt ngoại tuyến: Phân tích các bộ dữ liệu lớn gồm hình ảnh hoặc video, trong đó quá trình xử lý không cần diễn ra theo thời gian thực.

Tìm hiểu thêm về EfficientDet

Ultralytics YOLOv5: Mô hình linh hoạt và được áp dụng rộng rãi

Ultralytics YOLOv5 đã trở thành một tiêu chuẩn công nghiệp, nổi tiếng với sự cân bằng đáng kinh ngạc giữa tốc độ, độ chính xác và tính dễ sử dụng vô song. Được phát triển trên PyTorch, nó đã trở thành một mô hình được các nhà phát triển và nhà nghiên cứu tìm kiếm để có một giải pháp thiết thực và hiệu suất cao.

Chi tiết kỹ thuật

Điểm mạnh và Điểm yếu

Điểm mạnh:

  • Tốc độ Vượt trội: YOLOv5 cực kỳ nhanh, cho phép phát hiện đối tượng thời gian thực, rất quan trọng đối với các ứng dụng như hệ thống báo động an ninh.
  • Dễ sử dụng: Nó cung cấp quy trình huấn luyện và triển khai đơn giản, được hỗ trợ bởi tài liệu Ultralytics tuyệt vời và trải nghiệm người dùng được tối ưu hóa thông qua giao diện PythonCLI đơn giản.
  • Hệ sinh thái được duy trì tốt: YOLOv5 được hưởng lợi từ quá trình phát triển tích cực, một cộng đồng lớn, cập nhật thường xuyên và các tài nguyên phong phú như hướng dẫn và tích hợp với các công cụ như Ultralytics HUB để đào tạo không cần code.
  • Cân bằng hiệu suất: Mô hình đạt được sự cân bằng tốt giữa tốc độ suy luận và độ chính xác phát hiện, phù hợp với nhiều tình huống thực tế.
  • Hiệu quả huấn luyện: YOLOv5 có quy trình huấn luyện hiệu quả với các trọng số đã được huấn luyện trước có sẵn và thường yêu cầu ít bộ nhớ hơn để huấn luyện và suy luận so với các kiến trúc phức tạp hơn.
  • Tính linh hoạt: Vượt xa phát hiện đối tượng, YOLOv5 cũng hỗ trợ các tác vụ phân vùng thể hiệnphân loại ảnh.

Điểm yếu:

  • Độ chính xác: Mặc dù rất chính xác, YOLOv5 có thể không phải lúc nào cũng đạt được mAP cao nhất tuyệt đối so với các mô hình EfficientDet lớn nhất, đặc biệt là để phát hiện các đối tượng rất nhỏ.
  • Phát hiện dựa trên Anchor: Nó dựa vào các hộp anchor được xác định trước, có thể yêu cầu điều chỉnh để có hiệu suất tối ưu trên các bộ dữ liệu có tỷ lệ khung hình đối tượng bất thường.

Các trường hợp sử dụng lý tưởng

YOLOv5 là lựa chọn ưu tiên cho các ứng dụng mà tốc độ, hiệu quả và dễ triển khai là tối quan trọng:

  • Giám sát video theo thời gian thực: Phát hiện đối tượng nhanh chóng trong luồng video trực tiếp.
  • Hệ thống tự động: Nhận diện độ trễ thấp cho robotxe tự hành.
  • Điện toán biên: Triển khai trên các thiết bị có tài nguyên hạn chế như Raspberry PiNVIDIA Jetson nhờ vào hiệu quả của mô hình.
  • Ứng dụng di động: Thời gian suy luận nhanh và kích thước mô hình nhỏ hơn phù hợp với nền tảng di động.

Tìm hiểu thêm về YOLOv5

Phân tích hiệu năng: Độ chính xác so với tốc độ

Sự đánh đổi chính giữa EfficientDet và YOLOv5 nằm ở độ chính xác so với tốc độ. Bảng dưới đây cho thấy trong khi các mô hình EfficientDet lớn hơn có thể đạt được điểm mAP cao hơn, chúng làm như vậy với độ trễ cao hơn đáng kể. Ngược lại, các mô hình YOLOv5 cung cấp tốc độ suy luận nhanh hơn nhiều, đặc biệt là trên GPU (T4 TensorRT), khiến chúng trở nên lý tưởng cho các ứng dụng thời gian thực. Ví dụ: YOLOv5l đạt được mAP cạnh tranh là 49.0 với độ trễ chỉ 6.61 ms, trong khi EfficientDet-d4 có độ chính xác tương tự chậm hơn hơn 5 lần ở 33.55 ms.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Kết luận: Bạn nên chọn mô hình nào?

Cả EfficientDet và Ultralytics YOLOv5 đều là những mô hình phát hiện đối tượng mạnh mẽ, nhưng chúng phục vụ cho các ưu tiên khác nhau. EfficientDet vượt trội khi độ chính xác tối đa là mục tiêu chính, có khả năng phải trả giá bằng tốc độ suy luận.

Tuy nhiên, Ultralytics YOLOv5 nổi bật nhờ sự cân bằng vượt trội giữa tốc độ và độ chính xác, khiến nó trở nên lý tưởng cho phần lớn các ứng dụng thực tế. Tính dễ sử dụng, Hệ sinh thái được duy trì tốt và toàn diện (bao gồm Ultralytics HUB), khả năng đào tạo hiệu quả và khả năng mở rộng của nó làm cho nó trở thành một lựa chọn rất thiết thực và thân thiện với nhà phát triển. Đối với các dự án yêu cầu triển khai nhanh chóng, hiệu suất thời gian thực và hỗ trợ cộng đồng mạnh mẽ, YOLOv5 thường là lựa chọn vượt trội hơn.

Người dùng quan tâm đến việc khám phá các mô hình mới hơn với những cải tiến hơn nữa cũng có thể cân nhắc Ultralytics YOLOv8 hoặc YOLO11 mới nhất, được xây dựng dựa trên thế mạnh của YOLOv5 với độ chính xác được cải thiện và các tính năng mới. Để so sánh thêm, hãy truy cập trang so sánh mô hình của Ultralytics.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận