Chuyển đến nội dung

So sánh EfficientDet với YOLOv5 So sánh kỹ thuật toàn diện

Việc lựa chọn kiến ​​trúc mạng nơ-ron tối ưu là bước then chốt trong bất kỳ dự án thị giác máy tính nào . Sự cân bằng giữa độ trễ suy luận, hiệu quả tham số và độ chính xác phát hiện quyết định mức độ hiệu quả của mô hình trong thế giới thực. Hướng dẫn kỹ thuật toàn diện này cung cấp phân tích chuyên sâu về hai khung phát hiện đối tượng có ảnh hưởng lớn: Google EfficientDet và Ultralytics YOLOv5 .

Bằng cách so sánh những cải tiến về kiến ​​trúc, phương pháp đào tạo và khả năng triển khai của chúng, các nhà phát triển có thể đưa ra quyết định sáng suốt cho môi trường triển khai cụ thể của mình, cho dù là mở rộng quy mô trên các máy chủ đám mây hay chạy trên các thiết bị biên có tài nguyên hạn chế.

EfficientDet: Kiến trúc có khả năng mở rộng với BiFPN

Được giới thiệu bởi Google Trong quá trình nghiên cứu, EfficientDet được thiết kế để mở rộng một cách có hệ thống cả mạng xương sống và mạng đặc trưng nhằm đạt được độ chính xác cao với ít tham số hơn so với các mô hình tiên tiến trước đây.

Chi tiết mô hình

Đổi mới Kiến trúc

EfficientDet tận dụng mô hình phân loại EfficientNet làm nền tảng, sử dụng phương pháp mở rộng phức hợp giúp mở rộng đồng đều chiều rộng, chiều sâu và độ phân giải của mạng. Đóng góp đáng chú ý nhất của nó cho việc phát hiện đối tượng là sự ra đời của Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN). Không giống như các Mạng Kim tự tháp Đặc trưng tiêu chuẩn chỉ đơn giản là tổng hợp các đặc trưng từ trên xuống, BiFPN cho phép các kết nối phức tạp, hai chiều xuyên suốt các tỷ lệ và giới thiệu các trọng số có thể học được để xác định tầm quan trọng của các đặc trưng đầu vào khác nhau.

Mặc dù có độ chính xác cao, EfficientDet phụ thuộc rất nhiều vào hệ sinh thái TensorFlow và các thư viện AutoML cụ thể. Sự phụ thuộc này đôi khi có thể gây khó khăn trong việc tích hợp nó vào các quy trình triển khai tùy chỉnh, gọn nhẹ hoặc các môi trường ưu tiên đồ thị tính toán động.

Tìm hiểu thêm về EfficientDet

Ultralytics YOLOv5 Dân chủ hóa trí tuệ nhân tạo thời gian thực

Ra mắt không lâu sau EfficientDet, Ultralytics YOLOv5 đã cách mạng hóa ngành công nghiệp bằng cách cung cấp một giao diện gốc, dễ sử dụng đến kinh ngạc. PyTorch việc thực hiện YOLO Kiến trúc này đã thiết lập một tiêu chuẩn mới về trải nghiệm nhà phát triển, hiệu quả đào tạo và tính linh hoạt triển khai theo thời gian thực.

Chi tiết mô hình

Đổi mới Kiến trúc

YOLOv5 Phiên bản này đã giới thiệu những nâng cấp đáng kể so với các phiên bản trước đó, sử dụng kiến ​​trúc CSPDarknet (Cross-Stage Partial) giúp tăng cường đáng kể luồng gradient đồng thời giảm số lượng tham số tổng thể. Hơn nữa, YOLOv5 Tích hợp các hộp neo tự học, tự động tính toán các hộp giới hạn tối ưu dựa trên dữ liệu huấn luyện tùy chỉnh cụ thể của bạn, loại bỏ nhu cầu điều chỉnh siêu tham số thủ công.

YOLOv5 Ngoài ra, mô hình còn sử dụng rộng rãi kỹ thuật tăng cường dữ liệu Mosaic , kết hợp bốn hình ảnh khác nhau thành một ô huấn luyện duy nhất. Điều này giúp cải thiện đáng kể khả năng của mô hình. detect Nó nhận diện các vật thể nhỏ và khái quát hóa khả năng hiểu ngữ cảnh, giúp nó hoạt động hiệu quả trong nhiều môi trường khác nhau.

Tìm hiểu thêm về YOLOv5

Hiệu năng và điểm chuẩn

Việc đánh giá các mô hình trên các bộ dữ liệu chuẩn như bộ dữ liệu COCO là rất quan trọng để hiểu được sự đánh đổi giữa độ chính xác và tốc độ. Bảng dưới đây minh họa cách các kích thước khác nhau của EfficientDet và YOLOv5 Thực hiện trong điều kiện tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Phân tích sự đánh đổi

Trong khi EfficientDet-d7 đạt được hiệu suất tối đa ấn tượng. mAP Với hệ số 53.7, nó gặp phải hiện tượng độ trễ suy luận đáng kể. GPU phần cứng so với YOLO kiến trúc. Ngược lại, YOLOv5 Vượt trội về khả năng tăng tốc phần cứng. Biến thể YOLOv5n đạt được thời gian suy luận nhanh đáng kinh ngạc là 1,12 ms trên T4. GPU Sử dụng NVIDIA TensorRT , giúp nó vượt trội hơn hẳn cho các ứng dụng thời gian thực như lái xe tự hành hoặc dây chuyền sản xuất tốc độ cao.

Ngoài ra, YOLOv5 các mô hình cho thấy mức thấp hơn nhiều CUDA Yêu cầu bộ nhớ trong quá trình huấn luyện thấp hơn so với các mạng phức hợp đa cấp hoặc các mô hình Transformer lớn. Cấu hình bộ nhớ gọn nhẹ này giúp dân chủ hóa việc tiếp cận AI tiên tiến, cho phép các nhà nghiên cứu huấn luyện các mô hình mạnh mẽ trên phần cứng tiêu dùng thông thường.

Tối ưu hóa hiệu quả phần cứng

Để đạt được số khung hình mỗi giây (FPS) tối đa từ... YOLOv5 mô hình trên các thiết bị biên, xuất của bạn PyTorch trọng lượng đến TensorRT vì NVIDIA GPU hoặc OpenVINO cho Intel CPU. Bước này thường có thể tăng gấp đôi tốc độ suy luận của bạn.

Hệ sinh thái đào tạo và trải nghiệm nhà phát triển

Ưu điểm thực sự của Ultralytics Điểm mấu chốt của hệ sinh thái nằm ở trải nghiệm người dùng được tối ưu hóa. Trong khi đó, EfficientDet lại đòi hỏi kiến ​​thức chuyên sâu về... TensorFlow API phát hiện đối tượng, YOLOv5 cung cấp một giải pháp nhất quán, đơn giản. Python API.

Hệ sinh thái Ultralytics được duy trì tốt đảm bảo các nhà phát triển có quyền truy cập vào các bản cập nhật thường xuyên, hỗ trợ cộng đồng tích cực và tích hợp liền mạch với các công cụ theo dõi thử nghiệm như... Weights & Biases Và ClearML .

Ví dụ mã: Bắt đầu với YOLOv5

Thực hiện suy luận với mô hình đã được huấn luyện trước. YOLOv5 Mô hình này chỉ cần một vài dòng mã thông qua PyTorch Hub :

from ultralytics import YOLO

# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display the detected bounding boxes
results[0].show()

Tính linh hoạt và các ứng dụng thực tế

EfficientDet là một framework chuyên về phát hiện đối tượng, điều này hạn chế tính hữu dụng của nó trong các quy trình xử lý hình ảnh phức tạp. Mặt khác, YOLOv5 đã phát triển để hỗ trợ nhiều tác vụ thị giác máy tính. Các phiên bản hiện đại của mô hình hỗ trợ phân đoạn đối tượngphân loại hình ảnh với độ chính xác cao, cho phép các nhà phát triển hợp nhất hệ thống học máy của họ.

Các trường hợp sử dụng lý tưởng

  • EfficientDet: Phù hợp nhất cho xử lý ngoại tuyến, nghiên cứu học thuật và phân tích dựa trên đám mây, nơi độ chính xác tối đa được ưu tiên hơn độ trễ, và khi có sẵn TPU cấp máy chủ hoặc GPU bộ nhớ cao.
  • YOLOv5 : Sự lựa chọn tối ưu cho các triển khai AI tại biên . Sự kết hợp giữa độ trễ thấp, dung lượng tham số nhỏ và độ chính xác cao khiến nó trở nên lý tưởng cho phân tích dữ liệu từ máy bay không người lái, tự động hóa bán lẻ thời gian thực và các ứng dụng di động thông qua CoreML hoặc TFLite .

Thế hệ tiếp theo: Nâng cấp lên YOLO26

Trong khi YOLOv5 Mặc dù mô hình này vẫn mạnh mẽ và được triển khai rộng rãi, lĩnh vực trí tuệ nhân tạo (AI) đang phát triển nhanh chóng. Đối với các nhóm bắt đầu dự án mới hoặc tìm kiếm hiệu suất tối ưu tuyệt đối của công nghệ hiện đại, Ultralytics đã giới thiệu YOLO26 , dự kiến ​​phát hành vào tháng 1 năm 2026.

YOLO26 định nghĩa lại ranh giới Pareto về tốc độ và độ chính xác, giới thiệu những thay đổi kiến ​​trúc đột phá giúp việc triển khai dễ dàng hơn và quá trình suy luận nhanh hơn.

Những cải tiến quan trọng của YOLO26

  • Thiết kế không cần NMS từ đầu đến cuối: YOLO26 loại bỏ hoàn toàn quá trình xử lý hậu kỳ Non-Maximum Suppression. Điều này giúp đơn giản hóa đáng kể logic triển khai và giảm sự biến đổi độ trễ, một phương pháp đột phá được hoàn thiện từ các thử nghiệm ban đầu trong YOLOv10 .
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Được thiết kế đặc biệt cho điện toán biên và các thiết bị IoT công suất thấp hoạt động mà không cần GPU chuyên dụng.
  • MuSGD Optimizer: Lấy cảm hứng từ các kỹ thuật huấn luyện mô hình ngôn ngữ quy mô lớn (như Kimi K2 của Moonshot AI), đây là sự kết hợp của... SGD Và Muon mang đến những cải tiến của LLM cho thị giác máy tính, cho phép hội tụ nhanh hơn và động lực huấn luyện ổn định cao.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận dạng vật thể nhỏ, điều rất quan trọng đối với ảnh chụp từ trên không và robot.
  • Loại bỏ DFL: Bằng cách loại bỏ hiện tượng mất tiêu điểm phân bổ (Distribution Focal Loss - DFL), mô hình đầu thu được đơn giản hóa đáng kể, dẫn đến khả năng tương thích tốt hơn khi xuất sang phần cứng biên cũ hoặc có cấu hình hạn chế cao.

Đối với các nhóm triển khai các pipeline đa nhiệm, YOLO26 cũng giới thiệu các nâng cấp dành riêng cho từng nhiệm vụ, chẳng hạn như proto đa tỷ lệ cho phân đoạn và hàm mất mát góc chuyên dụng cho hộp giới hạn định hướng (OBB) . Để khám phá các lựa chọn thay thế hiện đại khác trong hệ sinh thái, bạn cũng có thể xem xét YOLO11 hoặc... YOLOv8 ngành kiến ​​​​trúc.

Kết luận

Lựa chọn giữa EfficientDet và YOLOv5 Điều này phụ thuộc rất nhiều vào mục tiêu triển khai của bạn. EfficientDet cung cấp một phương pháp mở rộng quy mô thanh lịch về mặt toán học, phù hợp cho việc suy luận dựa trên điện toán đám mây. Tuy nhiên, YOLOv5 Trải nghiệm phát triển vượt trội, cực kỳ nhanh chóng PyTorch Các vòng lặp huấn luyện và khả năng triển khai biên được tối ưu hóa cao khiến nó trở thành lựa chọn ưu tiên cho phần lớn các ứng dụng thực tế, thời gian thực. Bằng cách tận dụng các công cụ toàn diện được cung cấp bởi Ultralytics Nhờ đó, các nhóm có thể đẩy nhanh thời gian đưa sản phẩm ra thị trường và xây dựng các hệ thống AI có khả năng phản hồi cao.


Bình luận