Chuyển đến nội dung

EfficientDet so với YOLOv5 : So sánh kỹ thuật chi tiết

Bối cảnh phát hiện đối tượng đã phát triển nhanh chóng, được thúc đẩy bởi nhu cầu liên tục cân bằng giữa độ chính xác và hiệu quả tính toán. Hai kiến trúc có ảnh hưởng đáng kể đến lĩnh vực này là EfficientDet , được phát triển bởi Google Đội ngũ Brain và YOLOv5 , được tạo ra bởi Ultralytics . Trong khi cả hai mô hình đều hướng tới detect các đối tượng trong hình ảnh một cách hiệu quả, họ tiếp cận vấn đề bằng các triết lý thiết kế và chiến lược kiến trúc khác nhau về cơ bản.

Hướng dẫn này cung cấp so sánh kỹ thuật chuyên sâu để giúp các nhà phát triển, nhà nghiên cứu và kỹ sư chọn đúng công cụ cho các ứng dụng thị giác máy tính cụ thể của họ.

EfficientDet: Có khả năng mở rộng và hiệu quả

Được phát hành vào cuối năm 2019, EfficientDet xuất phát từ mục tiêu nghiên cứu là tối ưu hóa đồng thời cả độ chính xác và hiệu quả. EfficientDet đã giới thiệu khái niệm "Compound Scaling" (Tăng tỷ lệ hợp chất) cho phát hiện đối tượng, một phương pháp đồng bộ hóa độ phân giải, độ sâu và chiều rộng của mạng xương sống.

Điểm nổi bật về kiến trúc

EfficientDet được xây dựng trên nền tảng EfficientNet và giới thiệu một mạng lưới hợp nhất tính năng mới gọi là BiFPN (Mạng Kim tự tháp Tính năng Hai chiều). Không giống như các Mạng Kim tự tháp Tính năng (FPN) truyền thống vốn giới hạn luồng thông tin theo hướng từ trên xuống, BiFPN cho phép luồng thông tin phức tạp, hai chiều giữa các lớp phân giải khác nhau.

Mô hình này cũng sử dụng Compound Scaling , cho phép người dùng lựa chọn từ một họ mô hình (D0 đến D7) tùy thuộc vào hạn chế tài nguyên của họ. Điều này đảm bảo rằng nếu bạn có nhiều khả năng tính toán hơn, bạn có thể tăng kích thước mô hình một cách tuyến tính để đạt được độ chính xác cao hơn.

Điểm mạnh và Điểm yếu

Điểm mạnh chính của EfficientDet nằm ở hiệu quả lý thuyết . Nó đạt điểm mAP cao với FLOP (Phép toán dấu phẩy động) cực thấp. Điều này khiến EfficientDet trở thành một ứng cử viên sáng giá cho nghiên cứu học thuật, nơi hiệu quả tham số là thước đo quan trọng.

Tuy nhiên, EfficientDet có một nhược điểm thực tế: độ trễ suy luận . Các kết nối phức tạp trong BiFPN và việc sử dụng nhiều phép tích chập tách biệt theo chiều sâu—mặc dù hiệu quả về mặt toán học—thường không được tối ưu hóa hoàn toàn trên GPU phần cứng so với tích chập tiêu chuẩn. Do đó, mặc dù FLOP thấp hơn, EfficientDet có thể chạy chậm hơn trên GPU so với các mô hình có chi phí tính toán lý thuyết cao hơn.

Tìm hiểu thêm về EfficientDet

Ultralytics YOLOv5 : Hiệu suất và khả năng sử dụng trong thế giới thực

Ultralytics YOLOv5 đại diện cho một sự thay đổi mô hình khi nó được phát hành vào năm 2020. Không giống như những người tiền nhiệm của nó, nó là người đầu tiên YOLO Mô hình được triển khai gốc trong PyTorch , giúp nó dễ dàng tiếp cận với một hệ sinh thái nhà phát triển khổng lồ. Nó ưu tiên "tính dễ triển khai" bên cạnh hiệu suất thô.

Điểm nổi bật về kiến trúc

YOLOv5 sử dụng xương sống CSPDarknet, giúp tối ưu hóa luồng gradient và giảm thiểu tính toán. Nó tiên phong trong việc sử dụng Mosaic Augmentation trong quá trình huấn luyện—một kỹ thuật ghép bốn hình ảnh lại với nhau—cải thiện khả năng của mô hình detect các vật thể nhỏ và giảm nhu cầu về kích thước lô nhỏ lớn.

Kiến trúc được thiết kế để đạt tốc độ cao . Bằng cách sử dụng các phép tích chập tiêu chuẩn và cấu trúc đầu được sắp xếp hợp lý, YOLOv5 tối đa hóa khả năng xử lý song song của GPU hiện đại, mang lại độ trễ suy luận cực kỳ thấp.

Các Ultralytics Lợi thế của hệ sinh thái

Một trong những YOLOv5 Ưu điểm quan trọng nhất của là hệ sinh thái xung quanh. Ultralytics cung cấp quy trình làm việc liền mạch bao gồm tạo neo tự động , phát triển siêu tham số và hỗ trợ xuất bản gốc sang ONNX , TensorRT , CoreML , Và TFLite Phương pháp "có kèm pin" này giúp giảm đáng kể thời gian từ ý tưởng đến sản xuất.

Điểm mạnh và Điểm yếu

YOLOv5 vượt trội về khả năng suy luận thời gian thựcdễ sử dụng . API đơn giản và tài liệu hướng dẫn mạnh mẽ cho phép các nhà phát triển huấn luyện các mô hình tùy chỉnh trên dữ liệu của riêng họ chỉ trong vài phút. Nó cân bằng tốc độ và độ chính xác theo cách tối ưu cho AI biên và triển khai đám mây. Mặc dù các mô hình mới hơn như YOLO11 đã vượt trội hơn về độ chính xác, YOLOv5 vẫn là một công cụ đáng tin cậy, đạt tiêu chuẩn công nghiệp.

Tìm hiểu thêm về YOLOv5

Chỉ số hiệu suất: Tốc độ so với Độ chính xác

Bảng sau đây so sánh hiệu suất của EfficientDet và YOLOv5 trên tập dữ liệu COCO val2017 . Điểm mấu chốt là sự khác biệt giữa chi phí lý thuyết (FLOP) và tốc độ thực tế (Độ trễ).

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Như minh họa, YOLOv5 thống trị trong GPU độ trễ. Ví dụ, YOLOv5s (37,4 mAP ) chạy ở 1,92 ms trên T4 GPU , trong khi EfficientDet-d0 (34,6 mAP ) mất 3,92 ms-làm YOLOv5 đại khái Nhanh hơn gấp 2 lần trong khi vẫn mang lại độ chính xác cao hơn. Sự chênh lệch này càng lớn hơn với các mô hình lớn hơn; YOLOv5l (49,0 mAP ) gần như Nhanh hơn 5 lần hơn so sánh EfficientDet-d4 (49,7 mAP ).

Ngược lại, EfficientDet tỏa sáng trong CPU -chỉ những môi trường mà FLOP thấp thường chuyển đổi tốt hơn thành hiệu suất, như đã thấy trong ONNX CPU tốc độ cho các biến thể D0 nhỏ hơn.

Các trường hợp sử dụng lý tưởng

Việc lựa chọn giữa các mô hình này phụ thuộc vào những hạn chế cụ thể của bạn:

Khi nào nên chọn EfficientDet

  • Đánh giá chuẩn mực học thuật: Khi mục tiêu chính là chứng minh hiệu quả của tham số hoặc quy luật mở rộng kiến trúc.
  • Ràng buộc CPU nghiêm ngặt: Nếu việc triển khai bị giới hạn nghiêm ngặt đối với các phiên bản cũ hơn CPU phần cứng nơi FLOP là nút thắt cổ chai tuyệt đối, các biến thể EfficientDet nhỏ nhất (D0-D1) cung cấp hiệu suất cạnh tranh.
  • Nghiên cứu: Để nghiên cứu các biến thể mạng kim tự tháp tính năng như BiFPN.

Khi nào nên lựa chọn Ultralytics YOLOv5

  • Ứng dụng thời gian thực: Thiết yếu cho xe tự hành , robot và giám sát video khi độ trễ thấp là điều không thể thương lượng.
  • Triển khai sản xuất: Hệ sinh thái được duy trì tốt và dễ dàng xuất sang các công cụ như TensorRT Và OpenVINO làm YOLOv5 vượt trội cho các sản phẩm thương mại.
  • Hiệu quả đào tạo: YOLOv5 các mô hình thường đào tạo nhanh hơn và yêu cầu ít bộ nhớ hơn so với các kiến trúc phức tạp như mô hình dựa trên EfficientDet hoặc Transformer, giúp giảm chi phí điện toán đám mây.
  • Tính linh hoạt: Ngoài các hộp giới hạn đơn giản, Ultralytics khung cho phép chuyển đổi liền mạch sang các nhiệm vụ phân đoạn và phân loại.

Ví dụ mã: Sự đơn giản của Ultralytics

Một trong những đặc điểm xác định của Ultralytics Mô hình là Dễ sử dụng . Trong khi việc triển khai EfficientDet thường đòi hỏi sự phức tạp TensorFlow cấu hình hoặc bản sao kho lưu trữ cụ thể, YOLOv5 có thể được tải và chạy chỉ với một vài dòng Python mã thông qua PyTorch Trục.

import torch

# Load the YOLOv5s model from the official Ultralytics repository
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image (URL or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Perform inference
results = model(img)

# Display results
results.print()  # Print predictions to console
results.show()  # Show image with bounding boxes

Kết luận và triển vọng tương lai

Trong khi EfficientDet đánh dấu một cột mốc quan trọng trong lĩnh vực thị giác máy tính bằng cách chứng minh giá trị của khả năng mở rộng hợp chất và hợp nhất tính năng hiệu quả, YOLOv5 đã cách mạng hóa ngành công nghiệp này bằng cách giúp phát hiện đối tượng hiệu suất cao trở nên dễ tiếp cận, nhanh chóng và có thể triển khai.

Đối với các nhà phát triển bắt đầu một dự án mới ngày hôm nay, chúng tôi khuyên bạn nên xem xét những tiến bộ mới nhất trong Ultralytics dòng dõi. YOLO11 xây dựng trên nền tảng vững chắc của YOLOv5 , cung cấp:

Để đọc thêm về cách Ultralytics các mô hình so sánh với các kiến trúc khác, hãy khám phá sự so sánh của chúng tôi với YOLOv8RT-DETR .


Bình luận