Chuyển đến nội dung

So sánh EfficientDet với YOLOv5 So sánh kỹ thuật toàn diện

Việc lựa chọn kiến ​​trúc mạng nơ-ron tối ưu là bước then chốt trong bất kỳ dự án thị giác máy tính nào . Sự cân bằng giữa độ trễ suy luận, hiệu quả tham số và độ chính xác phát hiện quyết định mức độ hiệu quả của mô hình trong thế giới thực. Hướng dẫn kỹ thuật toàn diện này cung cấp phân tích chuyên sâu về hai khung phát hiện đối tượng có ảnh hưởng lớn: Google EfficientDet và Ultralytics YOLOv5 .

Bằng cách so sánh các đổi mới kiến trúc, phương pháp huấn luyện và khả năng triển khai của chúng, các nhà phát triển có thể đưa ra quyết định sáng suốt cho các môi trường triển khai cụ thể của họ, cho dù mở rộng quy mô trên các máy chủ đám mây hay chạy trên các thiết bị biên bị hạn chế.

EfficientDet: Kiến trúc có khả năng mở rộng với BiFPN

Được giới thiệu bởi Google Trong quá trình nghiên cứu, EfficientDet được thiết kế để mở rộng một cách có hệ thống cả mạng xương sống và mạng đặc trưng nhằm đạt được độ chính xác cao với ít tham số hơn so với các mô hình tiên tiến trước đây.

Chi tiết mô hình

Đổi mới Kiến trúc

EfficientDet tận dụng mô hình phân loại EfficientNet làm nền tảng, sử dụng phương pháp mở rộng phức hợp giúp mở rộng đồng đều chiều rộng, chiều sâu và độ phân giải của mạng. Đóng góp đáng chú ý nhất của nó cho việc phát hiện đối tượng là sự ra đời của Mạng Kim tự tháp Đặc trưng Hai chiều (BiFPN). Không giống như các Mạng Kim tự tháp Đặc trưng tiêu chuẩn chỉ đơn giản là tổng hợp các đặc trưng từ trên xuống, BiFPN cho phép các kết nối phức tạp, hai chiều xuyên suốt các tỷ lệ và giới thiệu các trọng số có thể học được để xác định tầm quan trọng của các đặc trưng đầu vào khác nhau.

Mặc dù có độ chính xác cao, EfficientDet phụ thuộc rất nhiều vào hệ sinh thái TensorFlow và các thư viện AutoML cụ thể. Sự phụ thuộc này đôi khi có thể gây khó khăn trong việc tích hợp nó vào các quy trình triển khai tùy chỉnh, gọn nhẹ hoặc các môi trường ưu tiên đồ thị tính toán động.

Tìm hiểu thêm về EfficientDet

Ultralytics YOLOv5 Dân chủ hóa trí tuệ nhân tạo thời gian thực

Ra mắt không lâu sau EfficientDet, Ultralytics YOLOv5 đã cách mạng hóa ngành công nghiệp bằng cách cung cấp một giao diện gốc, dễ sử dụng đến kinh ngạc. PyTorch việc thực hiện YOLO Kiến trúc này đã thiết lập một tiêu chuẩn mới về trải nghiệm nhà phát triển, hiệu quả đào tạo và tính linh hoạt triển khai theo thời gian thực.

Chi tiết mô hình

Đổi mới Kiến trúc

YOLOv5 Phiên bản này đã giới thiệu những nâng cấp đáng kể so với các phiên bản trước đó, sử dụng kiến ​​trúc CSPDarknet (Cross-Stage Partial) giúp tăng cường đáng kể luồng gradient đồng thời giảm số lượng tham số tổng thể. Hơn nữa, YOLOv5 Tích hợp các hộp neo tự học, tự động tính toán các hộp giới hạn tối ưu dựa trên dữ liệu huấn luyện tùy chỉnh cụ thể của bạn, loại bỏ nhu cầu điều chỉnh siêu tham số thủ công.

YOLOv5 Ngoài ra, mô hình còn sử dụng rộng rãi kỹ thuật tăng cường dữ liệu Mosaic , kết hợp bốn hình ảnh khác nhau thành một ô huấn luyện duy nhất. Điều này giúp cải thiện đáng kể khả năng của mô hình. detect Nó nhận diện các vật thể nhỏ và khái quát hóa khả năng hiểu ngữ cảnh, giúp nó hoạt động hiệu quả trong nhiều môi trường khác nhau.

Tìm hiểu thêm về YOLOv5

Hiệu năng và điểm chuẩn

Việc đánh giá các mô hình trên các bộ dữ liệu chuẩn như bộ dữ liệu COCO là rất quan trọng để hiểu được sự đánh đổi giữa độ chính xác và tốc độ. Bảng dưới đây minh họa cách các kích thước khác nhau của EfficientDet và YOLOv5 Thực hiện trong điều kiện tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Phân tích các đánh đổi

Trong khi EfficientDet-d7 đạt được hiệu suất tối đa ấn tượng. mAP Với hệ số 53.7, nó gặp phải hiện tượng độ trễ suy luận đáng kể. GPU phần cứng so với YOLO kiến trúc. Ngược lại, YOLOv5 Vượt trội về khả năng tăng tốc phần cứng. Biến thể YOLOv5n đạt được thời gian suy luận nhanh đáng kinh ngạc là 1,12 ms trên T4. GPU Sử dụng NVIDIA TensorRT , giúp nó vượt trội hơn hẳn cho các ứng dụng thời gian thực như lái xe tự hành hoặc dây chuyền sản xuất tốc độ cao.

Ngoài ra, các mô hình YOLOv5 yêu cầu bộ nhớ CUDA thấp hơn đáng kể trong quá trình huấn luyện so với các mạng phức tạp được mở rộng theo cấp số nhân hoặc các mô hình transformer lớn. Hồ sơ bộ nhớ tinh gọn này dân chủ hóa quyền truy cập vào AI tiên tiến, cho phép các nhà nghiên cứu huấn luyện các mô hình mạnh mẽ trên phần cứng tiêu dùng tiêu chuẩn.

Tối ưu hóa hiệu quả phần cứng

Để đạt được số khung hình mỗi giây (FPS) tối đa từ... YOLOv5 mô hình trên các thiết bị biên, xuất của bạn PyTorch trọng lượng đến TensorRT vì NVIDIA GPU hoặc OpenVINO cho Intel CPU. Bước này thường có thể tăng gấp đôi tốc độ suy luận của bạn.

Hệ sinh thái đào tạo và trải nghiệm nhà phát triển

Ưu điểm thực sự của Ultralytics Điểm mấu chốt của hệ sinh thái nằm ở trải nghiệm người dùng được tối ưu hóa. Trong khi đó, EfficientDet lại đòi hỏi kiến ​​thức chuyên sâu về... TensorFlow API phát hiện đối tượng, YOLOv5 cung cấp một giải pháp nhất quán, đơn giản. Python API.

Hệ sinh thái Ultralytics được duy trì tốt đảm bảo các nhà phát triển có quyền truy cập vào các bản cập nhật thường xuyên, hỗ trợ cộng đồng tích cực và tích hợp liền mạch với các công cụ theo dõi thử nghiệm như... Weights & Biases Và ClearML .

Ví dụ mã: Bắt đầu với YOLOv5

Thực hiện suy luận với mô hình đã được huấn luyện trước. YOLOv5 Mô hình này chỉ cần một vài dòng mã thông qua PyTorch Hub :

from ultralytics import YOLO

# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display the detected bounding boxes
results[0].show()

Tính linh hoạt và các ứng dụng thực tế

EfficientDet là một framework chuyên về phát hiện đối tượng, điều này hạn chế tính hữu dụng của nó trong các quy trình xử lý hình ảnh phức tạp. Mặt khác, YOLOv5 đã phát triển để hỗ trợ nhiều tác vụ thị giác máy tính. Các phiên bản hiện đại của mô hình hỗ trợ phân đoạn đối tượngphân loại hình ảnh với độ chính xác cao, cho phép các nhà phát triển hợp nhất hệ thống học máy của họ.

Các trường hợp sử dụng lý tưởng

  • EfficientDet: Phù hợp nhất cho xử lý ngoại tuyến, nghiên cứu học thuật và phân tích dựa trên đám mây, nơi độ chính xác tối đa được ưu tiên hơn độ trễ, và nơi có sẵn các TPU cấp máy chủ hoặc GPU bộ nhớ cao.
  • YOLOv5: Lựa chọn tối ưu cho các triển khai AI biên. Sự kết hợp giữa độ trễ thấp, dung lượng tham số nhỏ và độ chính xác cao khiến nó trở nên lý tưởng cho phân tích máy bay không người lái, tự động hóa bán lẻ thời gian thực và các ứng dụng di động thông qua CoreML hoặc TFLite.

Thế hệ tiếp theo: Nâng cấp lên YOLO26

Trong khi YOLOv5 Mặc dù mô hình này vẫn mạnh mẽ và được triển khai rộng rãi, lĩnh vực trí tuệ nhân tạo (AI) đang phát triển nhanh chóng. Đối với các nhóm bắt đầu dự án mới hoặc tìm kiếm hiệu suất tối ưu tuyệt đối của công nghệ hiện đại, Ultralytics đã giới thiệu YOLO26 , dự kiến ​​phát hành vào tháng 1 năm 2026.

YOLO26 định nghĩa lại ranh giới Pareto về tốc độ và độ chính xác, giới thiệu những thay đổi kiến ​​trúc đột phá giúp việc triển khai dễ dàng hơn và quá trình suy luận nhanh hơn.

Những cải tiến quan trọng của YOLO26

  • Thiết kế loại bỏ NMS đầu cuối (End-to-End NMS-Free): YOLO26 tự nhiên loại bỏ hậu xử lý Non-Maximum Suppression. Điều này đơn giản hóa đáng kể logic triển khai và giảm sự biến động độ trễ, một phương pháp đột phá được tinh chỉnh từ các thử nghiệm ban đầu trong YOLOv10.
  • Suy luận trên CPU nhanh hơn tới 43%: Được thiết kế đặc biệt cho điện toán biên và các thiết bị IoT công suất thấp hoạt động mà không cần GPU chuyên dụng.
  • Trình tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện mô hình ngôn ngữ lớn (như Kimi K2 của Moonshot AI), sự kết hợp giữa SGD và Muon này mang những đổi mới của LLM vào thị giác máy tính, cho phép hội tụ nhanh hơn và động lực huấn luyện rất ổn định.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải thiện đáng kể trong nhận diện vật thể nhỏ, điều này rất quan trọng đối với hình ảnh từ trên không và robot học.
  • Loại bỏ DFL: Bằng cách loại bỏ Distribution Focal Loss, phần đầu mô hình được đơn giản hóa đáng kể, dẫn đến khả năng tương thích tốt hơn khi xuất sang phần cứng biên cũ hoặc bị hạn chế cao.

Đối với các nhóm triển khai các pipeline đa nhiệm, YOLO26 cũng giới thiệu các nâng cấp dành riêng cho từng nhiệm vụ, chẳng hạn như proto đa tỷ lệ cho phân đoạn và hàm mất mát góc chuyên dụng cho hộp giới hạn định hướng (OBB) . Để khám phá các lựa chọn thay thế hiện đại khác trong hệ sinh thái, bạn cũng có thể xem xét YOLO11 hoặc... YOLOv8 ngành kiến ​​​​trúc.

Kết luận

Việc lựa chọn giữa EfficientDet và YOLOv5 phụ thuộc rất nhiều vào mục tiêu triển khai của bạn. EfficientDet cung cấp một phương pháp mở rộng quy mô tinh tế về mặt toán học, phù hợp cho suy luận nặng trên đám mây. Tuy nhiên, trải nghiệm phát triển vượt trội của YOLOv5, các vòng lặp huấn luyện PyTorch cực nhanh và khả năng triển khai biên được tối ưu hóa cao khiến nó trở thành lựa chọn ưu tiên cho phần lớn các ứng dụng thực tế, thời gian thực. Bằng cách tận dụng các công cụ toàn diện do Ultralytics cung cấp, các nhóm có thể tăng tốc thời gian đưa sản phẩm ra thị trường và xây dựng các hệ thống AI có khả năng phản hồi cao.


Bình luận