So sánh EfficientDet với... YOLOv5 Cân bằng giữa khả năng mở rộng và hiệu suất thời gian thực

Việc lựa chọn kiến trúc phát hiện đối tượng phù hợp đòi hỏi phải cân nhắc giữa độ chính xác, tốc độ suy luận và độ phức tạp triển khai. Hướng dẫn này cung cấp so sánh kỹ thuật chuyên sâu giữa EfficientDet , một kiến trúc có khả năng mở rộng từ... Google Nghiên cứu, và YOLOv5 , bộ dò thời gian thực được sử dụng rộng rãi từ Ultralytics .

Trong khi EfficientDet giới thiệu những khái niệm đột phá về mở rộng quy mô phức hợp, YOLOv5 đã tạo ra một cuộc cách mạng trong lĩnh vực này bằng cách giúp cho việc tiếp cận thị giác máy tính hiệu năng cao trở nên dễ dàng hơn thông qua một API được đơn giản hóa và một hệ sinh thái mạnh mẽ.

Tổng quan mô hình

Google EfficientDet

EfficientDet được xây dựng dựa trên nền tảng EfficientNet, áp dụng phương pháp mở rộng tỷ lệ kết hợp giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng. Nó giới thiệu Mạng kim tự tháp đặc trưng hai chiều (BiFPN) để cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng.

Tác giả: Mingxing Tan, Ruoming Pang, và Quoc V. Le
Tổ chức:Google
Ngày: 2019-11-20
Arxiv:EfficientDet: detect Đối tượng Hiệu quả và Có khả năng Mở rộng
GitHub: Kho lưu trữ EfficientDet

Ultralytics YOLOv5

YOLOv5 tập trung vào tính khả dụng thực tế và tốc độ. Nó sử dụng kiến trúc mạng CSPDarknet và được thiết kế để dễ dàng đào tạo và triển khai trên nhiều loại phần cứng khác nhau. Nó vẫn là một trong những mô hình phổ biến nhất nhờ sự cân bằng giữa hiệu suất và hiệu quả.

Tác giả: Glenn Jocher
Tổ chức:Ultralytics
Ngày: 2020-06-26
Tài liệu:Tài liệu YOLOv5
GitHub:Kho lưu trữ YOLOv5

Tìm hiểu thêm về YOLOv5

So sánh Kiến trúc Kỹ thuật

Triết lý kiến trúc của hai mô hình này khác biệt đáng kể, ảnh hưởng đến tính phù hợp của chúng đối với các nhiệm vụ khác nhau.

EfficientDet: Mở rộng hợp chất và BiFPN

Điểm đột phá cốt lõi của EfficientDet là BiFPN (Weighted Bi-directional Feature Pyramid Network). Không giống như các FPN tiêu chuẩn cộng các đặc trưng mà không phân biệt, BiFPN giới thiệu các trọng số có thể học được để hiểu tầm quan trọng của các đặc trưng đầu vào khác nhau. Điều này cho phép mạng ưu tiên các đặc trưng có nhiều thông tin hơn trong quá trình kết hợp.

Ngoài ra, EfficientDet sử dụng Compound Scaling , giúp đồng thời tăng độ phân giải, độ sâu và độ rộng của mạng xương sống, mạng đặc trưng và mạng dự đoán. Điều này cho phép người dùng lựa chọn từ một nhóm các mô hình (D0 đến D7) tùy thuộc vào hạn chế về tài nguyên của họ. Tuy nhiên, sự phức tạp này có thể dẫn đến độ trễ cao hơn trên các thiết bị biên thiếu hỗ trợ chuyên dụng cho các hoạt động này.

YOLOv5 : CSPDarknet và PANet

YOLOv5 Nó sử dụng kiến trúc xương sống CSPDarknet , tích hợp các mạng Cross Stage Partial. Thiết kế này giúp giảm số lượng tham số và FLOPS trong khi vẫn duy trì độ chính xác bằng cách chia tách bản đồ đặc trưng ở lớp cơ sở.

Đối với việc tổng hợp các đặc trưng, YOLOv5 Nó sử dụng Mạng tổng hợp đường dẫn (PANet). Cấu trúc này tăng cường luồng thông tin từ các lớp thấp hơn lên các lớp cao hơn, cải thiện khả năng định vị đối tượng — điều rất quan trọng để tạo ra các hộp giới hạn chính xác. Phần đầu dựa trên neo, dự đoán độ lệch từ các hộp neo được xác định trước. Kiến trúc này được tối ưu hóa cao cho GPU Tính song song, dẫn đến thời gian suy luận nhanh hơn so với các thao tác mở rộng phức tạp của EfficientDet.

Lợi thế Hệ sinh thái Ultralytics

Lựa chọn YOLOv5 Cung cấp quyền truy cập vào Hệ sinh thái Ultralytics , đảm bảo tích hợp liền mạch với các công cụ chú thích dữ liệu , theo dõi thí nghiệm và đào tạo trên nền tảng đám mây thông qua Nền tảng Ultralytics . Cấu trúc hỗ trợ này thường thiếu trong các kho lưu trữ tập trung vào nghiên cứu như EfficientDet.

Các chỉ số hiệu suất

Khi đánh giá hiệu năng, điều quan trọng là phải xem xét cả độ chính xác ( mAP ) và tốc độ (độ trễ). Mặc dù EfficientDet có thể đạt được độ chính xác cao hơn với các biến thể lớn hơn (D7), nhưng nó thường phải chịu tổn thất đáng kể về tốc độ so với các biến thể khác. YOLOv5 các mô hình có kích thước tương đương.

Bảng dưới đây nêu bật sự khác biệt về hiệu năng. Hãy chú ý cách thức... YOLOv5 cung cấp tốc độ nhanh hơn đáng kể CPU tốc độ cao hơn, giúp việc triển khai trở nên thực tế hơn nhiều mà không cần đến các bộ tăng tốc chuyên dụng.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Phân tích

Tốc độ so với Độ chính xác: EfficientDet-d0 rất hiệu quả về số phép tính FLOPs, nhưng trên thực tế, YOLOv5n và YOLOv5s thường chạy nhanh hơn trên các GPU tiêu chuẩn do các phép toán thân thiện hơn với phần cứng (tránh các phép tích chập tách theo chiều sâu có thể chậm trên một số GPU cũ hơn). CUDA hạt nhân).
Hiệu quả bộ nhớ: YOLOv5 Thông thường, EfficientDet yêu cầu ít VRAM hơn trong quá trình huấn luyện, cho phép kích thước lô lớn hơn trên phần cứng cấp người tiêu dùng. Các kết nối phức tạp của EfficientDet có thể làm tăng chi phí bộ nhớ.
Tối ưu hóa: EfficientDet phụ thuộc rất nhiều vào các tìm kiếm AutoML để xác định kiến trúc, điều này có thể gây ra nhiều lỗi khi chỉnh sửa. YOLOv5 Cho phép tùy chỉnh dễ dàng hơn các bội số chiều sâu và chiều rộng trực tiếp trong cấu hình YAML.

Huấn luyện và Khả năng sử dụng

Hiệu quả huấn luyện

Ultralytics YOLOv5 được biết đến với khả năng "huấn luyện ngay lập tức". Kho lưu trữ này bao gồm công nghệ tăng cường dữ liệu Mosaic , tính toán neo tự động và tiến hóa siêu tham số. Điều này có nghĩa là người dùng có thể đạt được kết quả xuất sắc trên các tập dữ liệu tùy chỉnh mà không cần tinh chỉnh nhiều. Các triển khai EfficientDet thường yêu cầu thiết lập thủ công nhiều hơn. TensorFlow ghi chép và lập kế hoạch tốc độ học tập cẩn thận.

Tính linh hoạt trong triển khai

Mặc dù EfficientDet chủ yếu là một mô hình phát hiện đối tượng, YOLOv5 và những người kế nhiệm của nó trong Ultralytics Công cụ sắp xếp đội hình hỗ trợ nhiều tác vụ hơn. Bạn có thể chuyển đổi liền mạch sang phân đoạn đối tượng hoặc phân loại hình ảnh bằng cùng một cấu trúc API.

Hơn nữa, việc triển khai YOLOv5 Quá trình này được đơn giản hóa thông qua chế độ xuất , hỗ trợ chuyển đổi chỉ bằng một cú nhấp chuột. ONNX , TensorRT , CoreML , Và TFLite .

from ultralytics import YOLO

# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")

# Train the model on a custom dataset
model.train(data="coco128.yaml", epochs=100)

# Export to ONNX format for deployment
model.export(format="onnx")

Chuẩn bị cho tương lai: Lý do nên chọn YOLO26

Trong khi YOLOv5 YOLO26 vẫn là một lựa chọn mạnh mẽ, và lĩnh vực này đã tiến bộ. Đối với các nhà phát triển tìm kiếm công nghệ tiên tiến nhất, YOLO26 được xây dựng dựa trên nền tảng của... YOLOv5 Với những cải tiến đáng kể về kiến trúc.

YOLO26 giới thiệu thiết kế không cần NMS từ đầu đến cuối , loại bỏ nhu cầu xử lý hậu kỳ loại bỏ cực đại không cần thiết (Non-Maximum Suppression). Điều này giúp giảm độ trễ và đơn giản hóa quy trình triển khai, một lợi thế lớn so với cả EfficientDet và... YOLOv5 Hơn nữa, YOLO26 sử dụng thuật toán tối ưu hóa MuSGD , lấy cảm hứng từ quá trình huấn luyện LLM, đảm bảo sự hội tụ nhanh hơn và quá trình huấn luyện ổn định ngay cả trên các tập dữ liệu khó.

Nếu dự án của bạn liên quan đến AI biên (edge AI ), YOLO26 được tối ưu hóa đặc biệt cho mục đích đó. CPU suy luận, mang lại tốc độ nhanh hơn tới 43% so với các thế hệ trước.

Tìm hiểu thêm về YOLO26

Các trường hợp sử dụng lý tưởng

Khi nào nên chọn EfficientDet

Hạn chế của nghiên cứu: Khi mục tiêu chính là nghiên cứu các quy luật tỷ lệ phức hợp hoặc tái tạo các chuẩn mực học thuật cụ thể.
Chế độ FLOP thấp: Trong các kịch bản lý thuyết mà số lượng FLOP là chỉ số duy nhất cần quan tâm, bỏ qua chi phí truy cập bộ nhớ hoặc độ trễ thực tế trên phần cứng.

Khi nào nên lựa chọn Ultralytics YOLOv5 (hoặc YOLO26)

Các ứng dụng thời gian thực: Lái xe tự động, phân tích video và robot, nơi độ trễ thấp là yếu tố không thể thiếu.
Triển khai tại biên: Chạy trên Raspberry Pi, NVIDIA Jetson, hoặc các thiết bị di động nơi hiệu quả bộ nhớ và ONNX / TensorRT Sự hỗ trợ là vô cùng quan trọng.
Phát triển nhanh chóng: Các dự án yêu cầu chu kỳ lặp lại nhanh, quản lý tập dữ liệu dễ dàng và trọng số được huấn luyện trước đáng tin cậy.
Các nhiệm vụ đa dạng: Nếu dự án của bạn có thể mở rộng để bao gồm ước lượng tư thế hoặc phát hiện đối tượng định hướng (OBB) , thì Ultralytics Khung phần mềm hỗ trợ các tính năng này một cách tự nhiên.

Tóm tắt

Cả EfficientDet và YOLOv5 đã có những đóng góp đáng kể cho lĩnh vực thị giác máy tính. EfficientDet đã chứng minh sức mạnh của việc mở rộng quy mô một cách có hệ thống, trong khi đó YOLOv5 Dân chủ hóa khả năng phát hiện hiệu suất cao. Đối với hầu hết các ứng dụng thực tế hiện nay, hệ sinh thái Ultralytics — được đại diện bởi YOLOv5 và YOLO26 tiên tiến —mang lại sự cân bằng vượt trội giữa tốc độ, độ chính xác và tính dễ sử dụng, được hỗ trợ bởi mã nguồn được cập nhật liên tục và một cộng đồng phát triển mạnh mẽ.

Để tìm hiểu thêm về so sánh mô hình, hãy khám phá cách thức... YOLO Các mô hình này được so sánh với các mô hình khác như YOLOv8 so với EfficientDet hoặc RT-DETR dựa trên biến áp.