Link to this sectionEfficientDet so với YOLO11#

Việc lựa chọn kiến trúc mạng thần kinh tối ưu là nền tảng của mọi ứng dụng computer vision thành công. Hướng dẫn toàn diện này cung cấp sự so sánh kỹ thuật chuyên sâu giữa EfficientDet của Google và Ultralytics YOLO11, phân tích sự khác biệt về kiến trúc, các chỉ số hiệu suất và các kịch bản triển khai lý tưởng.

Cho dù bạn đang nhắm đến độ trễ tính bằng mili giây trên các thiết bị edge AI hay cần độ chính xác có thể mở rộng để suy luận trên nền tảng đám mây, việc hiểu rõ các sắc thái của các model này là rất quan trọng.

Link to this sectionHồ sơ Model và Chi tiết kỹ thuật#

Việc hiểu rõ nguồn gốc và triết lý thiết kế cơ bản của từng kiến trúc giúp tạo bối cảnh cho hiệu suất của chúng trong các tác vụ object detection thực tế.

Link to this sectionEfficientDet#

Được phát triển bởi các nhà nghiên cứu tại Google Brain, EfficientDet giới thiệu một phương pháp có nguyên tắc để mở rộng quy mô các mạng phát hiện đối tượng cùng với BiFPN (Bidirectional Feature Pyramid Network) mới lạ.

Tác giả: Mingxing Tan, Ruoming Pang và Quoc V. Le
Tổ chức: Google
Ngày: 20-11-2019
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Tài liệu: https://github.com/google/automl/tree/master/efficientdet#readme

Tìm hiểu thêm về EfficientDet

Link to this sectionYOLO11#

YOLO11 đại diện cho một bước tiến đáng kể trong hệ sinh thái Ultralytics, vượt qua các giới hạn về hiệu suất thời gian thực, hiệu quả tham số và học đa tác vụ.

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Docs: https://docs.ultralytics.com/models/yolo11/

Tìm hiểu thêm về YOLO11

Link to this sectionSo sánh kiến trúc#

Những khác biệt về kiến trúc giữa hai model này làm nổi bật sự phân kỳ trong các chiến lược thiết kế qua nhiều năm.

EfficientDet tận dụng backbone EfficientNet và giới thiệu BiFPN, cho phép hợp nhất các tính năng đa quy mô từ trên xuống dưới và từ dưới lên trên. Nó sử dụng phương pháp mở rộng quy mô hợp nhất giúp mở rộng đồng nhất độ phân giải, độ sâu và độ rộng cho tất cả các mạng backbone, mạng tính năng và mạng dự đoán box/lớp cùng một lúc. Mặc dù rất hiệu quả trong việc tối đa hóa mean Average Precision (mAP), việc định tuyến phức tạp trong BiFPN đôi khi có thể gây tắc nghẽn băng thông bộ nhớ trong quá trình suy luận.

Mặt khác, YOLO11 sử dụng module C3k2 được tối ưu hóa và head phát hiện không cần neo (anchor-free) tiên tiến. Phương pháp tinh gọn này giảm thiểu chi phí trong quá trình trích xuất tính năng. Ultralytics đã thiết kế YOLO11 để tối đa hóa khả năng sử dụng phần cứng GPU, dẫn đến yêu cầu bộ nhớ thấp hơn đáng kể trong cả quá trình huấn luyện và suy luận so với các kiến trúc cũ hơn hoặc các model transformer nặng nề.

Tính linh hoạt đa tác vụ

Trong khi EfficientDet chỉ thuần túy là bộ phát hiện đối tượng, YOLO11 tự hào về tính linh hoạt cực cao. Một kiến trúc YOLO11 duy nhất hỗ trợ nguyên bản Instance Segmentation, Image Classification, Pose Estimation và Oriented Bounding Boxes (OBB).

Link to this sectionĐiểm chuẩn hiệu năng#

Bảng dưới đây so sánh hiệu suất của cả hai dòng model trên nhiều quy mô khác nhau trên COCO dataset.

Mô hình	kích thước ^(pixel)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

Link to this sectionPhân tích cân bằng: Điểm mạnh và Điểm yếu#

Tăng tốc GPU: YOLO11 chiếm ưu thế trong các môi trường GPU. Ví dụ, YOLO11m mang lại mAP là 51.5% ở tốc độ cực nhanh 4.7ms trên GPU T4 sử dụng TensorRT. Để đạt được độ chính xác tương đương, EfficientDet-d5 mất 67.86ms—chậm hơn gấp 14 lần. Điều này làm nổi bật sự cân bằng hiệu suất vượt trội của các model Ultralytics cho các ứng dụng thời gian thực.

Môi trường CPU: EfficientDet thể hiện tốc độ suy luận CPU được tối ưu hóa cao ở các biến thể nhỏ hơn (như d0 và d1) sử dụng ONNX. Tuy nhiên, độ chính xác của nó mở rộng kém mà không phải chịu các hình phạt về độ trễ GPU lớn ở các biến thể lớn hơn như d7.

Link to this sectionPhương pháp huấn luyện và Hệ sinh thái#

Trải nghiệm nhà phát triển thường quan trọng như khả năng lý thuyết của model. Đây là nơi hệ sinh thái Ultralytics tỏa sáng.

EfficientDet dựa nhiều vào hệ sinh thái TensorFlow cũ và các thư viện AutoML phức tạp. Việc thiết lập một quy trình huấn luyện tùy chỉnh liên quan đến các đường cong học tập dốc, quản lý phụ thuộc phức tạp và cấu hình thủ công các neo và loss functions.

Ngược lại, Ultralytics cung cấp sự dễ sử dụng vô song. Được hỗ trợ bởi hệ sinh thái PyTorch được bảo trì tốt, việc huấn luyện một model YOLO chỉ cần một vài dòng mã. Framework tự động quản lý hyperparameter tuning, tăng cường dữ liệu nâng cao và lập lịch tốc độ học tối ưu ngay khi cài đặt.

Link to this sectionVí dụ về mã: Bắt đầu với Ultralytics#

Đoạn mã mạnh mẽ, sẵn sàng cho sản xuất này chứng minh việc huấn luyện và suy luận đơn giản như thế nào trong Python API.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Link to this sectionCác trường hợp sử dụng lý tưởng#

Khi nào nên sử dụng EfficientDet: EfficientDet vẫn là một lựa chọn khả thi cho các môi trường nghiên cứu gắn liền với các đường ống TensorFlow hoặc các ràng buộc giới hạn CPU cụ thể nơi các kiến trúc đời đầu như d0 hoạt động đầy đủ.

Khi nào nên sử dụng YOLO11: YOLO11 là lựa chọn dứt khoát cho các triển khai doanh nghiệp hiện đại. Tốc độ vượt trội của nó làm cho nó trở nên hoàn hảo cho autonomous vehicles, phân tích thể thao thời gian thực và phát hiện lỗi sản xuất thông lượng cao. Hơn nữa, mức tiêu thụ bộ nhớ thấp hơn cho phép triển khai linh hoạt trên phần cứng hạn chế tài nguyên như NVIDIA Jetson.

Link to this sectionHướng tới tương lai: Bản nâng cấp YOLO26#

Mặc dù YOLO11 cực kỳ mạnh mẽ, các nhà phát triển bắt đầu các dự án mới nên đánh giá các kiến trúc Ultralytics khác như YOLOv8 đã được kiểm chứng hoặc YOLO26 mới ra mắt. Được phát hành vào đầu năm 2026, YOLO26 lấy nền tảng của YOLO11 và giới thiệu một số đổi mới mang tính đột phá:

Thiết kế không cần NMS từ đầu đến cuối: Xây dựng trên di sản của YOLOv10, YOLO26 loại bỏ hoàn toàn Non-Maximum Suppression (NMS) trong quá trình hậu xử lý, giảm độ trễ và đơn giản hóa các đường ống triển khai.
Trình tối ưu hóa MuSGD: Một trình tối ưu hóa lai pha trộn giữa SGD tiêu chuẩn với Muon (lấy cảm hứng từ quá trình huấn luyện mô hình ngôn ngữ lớn), cải thiện đáng kể độ ổn định khi huấn luyện.
Suy luận CPU nhanh hơn tới 43%: Các tối ưu hóa cụ thể làm cho YOLO26 cực kỳ mạnh mẽ trên các thiết bị cạnh thiếu GPU rời.
ProgLoss + STAL: Các hàm loss nâng cao cải thiện đáng kể khả năng phát hiện đối tượng nhỏ, rất quan trọng đối với hình ảnh trên không và robot.

Khám phá bối cảnh rộng lớn hơn về kiến trúc thị giác, bao gồm các bộ phát hiện dựa trên transformer như RT-DETR, trong Ultralytics Docs toàn diện của chúng tôi.

Người đóng góp

GLglenn-jocher¹³ PDpderrenger¹

Đã tạo 27 thg 1, 2025Đã cập nhật 3 tuần trước