So sánh EfficientDet với YOLO11 So sánh kỹ thuật toàn diện
Việc lựa chọn kiến trúc mạng nơ-ron tối ưu là nền tảng của bất kỳ ứng dụng thị giác máy tính thành công nào. Hướng dẫn toàn diện này cung cấp sự so sánh kỹ thuật chuyên sâu giữa các kiến trúc mạng nơ-ron khác nhau. Google So sánh EfficientDet và Ultralytics YOLO11 , phân tích sự khác biệt về kiến trúc, số liệu hiệu năng và kịch bản triển khai lý tưởng của chúng.
Cho dù bạn đang nhắm đến độ trễ mili giây trên các thiết bị AI biên hay yêu cầu độ chính xác có thể mở rộng cho suy luận dựa trên đám mây, việc hiểu rõ những điểm khác biệt tinh tế của các mô hình này là vô cùng quan trọng.
Thông tin chi tiết về mẫu sản phẩm và kỹ thuật
Việc hiểu rõ nguồn gốc và triết lý thiết kế cơ bản của từng kiến trúc giúp đánh giá hiệu năng của chúng trong các tác vụ phát hiện đối tượng thực tế.
EfficientDet
Được phát triển bởi các nhà nghiên cứu tại Google Brain, EfficientDet đã giới thiệu một phương pháp tiếp cận có nguyên tắc để mở rộng quy mô mạng phát hiện đối tượng cùng với mạng BiFPN (Bidirectional Feature Pyramid Network) mới.
- Tác giả: Mingxing Tan, Ruoming Pang, và Quoc V. Le
- Tổ chức:Google
- Ngày: 2019-11-20
- Arxiv:https://arxiv.org/abs/1911.09070
- GitHub:https://github.com/google/automl/tree/master/efficientdet
- Tài liệu:https://github.com/google/automl/tree/master/efficientdet#readme
YOLO11
YOLO11 đại diện cho một sự tiến hóa đáng kể trong Ultralytics hệ sinh thái, thúc đẩy giới hạn về hiệu năng thời gian thực, hiệu quả tham số và khả năng học đa nhiệm.
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Tài liệu:https://docs.ultralytics.com/models/yolo11/
So sánh kiến trúc
Những khác biệt về kiến trúc giữa hai mô hình này làm nổi bật sự khác biệt trong chiến lược thiết kế qua các năm.
EfficientDet tận dụng kiến trúc xương sống của EfficientNet và giới thiệu BiFPN, cho phép kết hợp các đặc trưng đa tỷ lệ từ trên xuống và từ dưới lên. Nó sử dụng phương pháp mở rộng tỷ lệ phức hợp để mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho tất cả các mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp cùng một lúc. Mặc dù rất hiệu quả trong việc tối đa hóa Độ chính xác trung bình ( mAP ) , nhưng việc định tuyến phức tạp trong BiFPN đôi khi có thể gây tắc nghẽn băng thông bộ nhớ trong quá trình suy luận.
YOLO11 Mặt khác, phương pháp này sử dụng mô-đun C2f được tối ưu hóa và đầu phát hiện không cần neo tiên tiến. Cách tiếp cận tinh gọn này giúp giảm thiểu chi phí trong quá trình trích xuất đặc trưng. Ultralytics được thiết kế YOLO11 để tối đa hóa GPU Việc tối ưu hóa sử dụng phần cứng giúp giảm đáng kể yêu cầu bộ nhớ trong cả quá trình huấn luyện và suy luận so với các kiến trúc cũ hơn hoặc các mô hình transformer nặng nề.
Tính linh hoạt đa nhiệm
Mặc dù EfficientDet về bản chất là một công cụ phát hiện đối tượng, YOLO11 Sở hữu tính linh hoạt vượt trội. Một sản phẩm duy nhất YOLO11 Kiến trúc này hỗ trợ sẵn các chức năng Phân đoạn đối tượng , Phân loại hình ảnh , Ước tính tư thế và Hộp giới hạn định hướng (OBB) .
Điểm chuẩn hiệu suất
Bảng dưới đây so sánh hiệu suất của cả hai nhóm mô hình trên nhiều quy mô khác nhau trên tập dữ liệu COCO .
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Phân tích cân bằng: Điểm mạnh và điểm yếu
Tăng tốc GPU : YOLO11 chiếm ưu thế trong GPU môi trường. Ví dụ, YOLO11m cung cấp một mAP đạt 51,5% với tốc độ cực nhanh 4,7ms trên T4. GPU Sử dụng TensorRT . Để đạt được độ chính xác tương đương, EfficientDet-d5 mất 67,86ms—chậm hơn hơn 14 lần. Điều này làm nổi bật sự cân bằng hiệu năng vượt trội của... Ultralytics các mô hình cho các ứng dụng thời gian thực.
Môi trường CPU : EfficientDet thể hiện khả năng tối ưu hóa cao. CPU Tốc độ suy luận trong các biến thể nhỏ hơn của nó (như d0 và d1) sử dụng ONNX . Tuy nhiên, độ chính xác của nó tăng kém nếu không tốn nhiều chi phí. GPU Hình phạt về độ trễ trong các biến thể lớn hơn như d7.
Phương pháp huấn luyện và hệ sinh thái
Trải nghiệm của nhà phát triển thường quan trọng không kém khả năng lý thuyết của mô hình. Đây là điểm mấu chốt. Ultralytics Hệ sinh thái tỏa sáng.
EfficientDet phụ thuộc rất nhiều vào hệ sinh thái TensorFlow cũ và các thư viện AutoML phức tạp. Việc thiết lập một quy trình huấn luyện tùy chỉnh đòi hỏi quá trình học hỏi khó khăn, quản lý phụ thuộc phức tạp và cấu hình thủ công các anchor và hàm mất mát .
Ngược lại, Ultralytics Mang đến sự dễ sử dụng chưa từng có. Được hỗ trợ bởi một hệ thống được bảo trì tốt. PyTorch hệ sinh thái, đào tạo một YOLO Mô hình chỉ cần một vài dòng mã. Khung phần mềm tự động quản lý việc điều chỉnh siêu tham số , tăng cường dữ liệu nâng cao và lập lịch tốc độ học tối ưu ngay từ đầu.
Ví dụ mã: Bắt đầu với Ultralytics
Đoạn mã mạnh mẽ, sẵn sàng cho môi trường sản xuất này minh họa cách thức huấn luyện và suy luận đơn giản như thế nào trong API Python .
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()
Các trường hợp sử dụng lý tưởng
Khi nào nên sử dụng EfficientDet: EfficientDet vẫn là một lựa chọn khả thi cho các môi trường nghiên cứu có truyền thống lâu đời. TensorFlow đường ống hoặc cụ thể CPU - Các ràng buộc giới hạn mà các kiến trúc ban đầu như d0 hoạt động khá tốt.
Khi nào nên sử dụng YOLO11 : YOLO11 Đây là sự lựa chọn tối ưu cho các triển khai doanh nghiệp hiện đại. Tốc độ vượt trội của nó làm cho nó trở nên hoàn hảo cho xe tự hành , phân tích thể thao thời gian thực và phát hiện lỗi sản xuất năng suất cao. Hơn nữa, mức sử dụng bộ nhớ thấp hơn cho phép triển khai linh hoạt trên phần cứng hạn chế tài nguyên như NVIDIA Jetson .
Hướng tới tương lai: Bản nâng cấp YOLO26
Trong khi YOLO11 có năng lực vượt trội, các nhà phát triển khi bắt đầu dự án mới nên đánh giá các lựa chọn khác. Ultralytics các kiến trúc như YOLOv8 đã được chứng minh hoặc YOLO26 mới ra mắt. Được phát hành vào đầu năm 2026, YOLO26 dựa trên nền tảng của YOLO11 và giới thiệu một số cải tiến mang tính đột phá:
- Thiết kế hoàn toàn không có NMS : Dựa trên nền tảng của YOLOv10 , YOLO26 loại bỏ hoàn toàn hiện tượng Non-Maximum Suppression (NMS) ( NMS ) trong quá trình xử lý hậu kỳ, giúp giảm độ trễ và đơn giản hóa quy trình triển khai.
- MuSGD Optimizer: Trình tối ưu hóa lai kết hợp các tiêu chuẩn thông thường. SGD Với Muon (lấy cảm hứng từ việc huấn luyện mô hình ngôn ngữ quy mô lớn), độ ổn định của quá trình huấn luyện được cải thiện đáng kể.
- Tốc độ suy luận CPU nhanh hơn tới 43%: Các tối ưu hóa đặc biệt giúp YOLO26 hoạt động cực kỳ hiệu quả trên các thiết bị biên không có GPU rời.
- ProgLoss + STAL: Các hàm mất mát tiên tiến giúp cải thiện đáng kể khả năng phát hiện vật thể nhỏ, rất quan trọng đối với ảnh chụp từ trên không và robot.
Khám phá bức tranh tổng quan rộng lớn hơn về các kiến trúc thị giác, bao gồm cả các bộ dò dựa trên transformer như RT-DETR , trong tài liệu Ultralytics Docs toàn diện của chúng tôi.