Chuyển đến nội dung

EfficientDet so với YOLO26: Tìm hiểu sâu về các kiến trúc detect đối tượng

Khi lựa chọn một mô hình detect đối tượng, các nhà phát triển thường cân nhắc sự đánh đổi giữa độ phức tạp kiến trúc, tốc độ và độ chính xác. So sánh chi tiết này khám phá những khác biệt kỹ thuật giữa EfficientDet của Google và YOLO26 của Ultralytics, phân tích triết lý thiết kế, các chỉ số hiệu suất và sự phù hợp của chúng cho triển khai thực tế.

Tổng quan về các kiến trúc

Mặc dù cả hai mô hình đều nhằm giải quyết vấn đề detect đối tượng, nhưng chúng tiếp cận hiệu quả và khả năng mở rộng từ các góc độ cơ bản khác nhau. EfficientDet dựa vào phương pháp mở rộng hợp chất, trong khi YOLO26 nhấn mạnh kiến trúc tinh gọn, end-to-end được tối ưu hóa cho hiệu suất biên.

EfficientDet: Kết hợp tính năng có thể mở rộng

Tác giả: Mingxing Tan, Ruoming Pang, và Quoc V. Le
Tổ chức:Google
Ngày: 20 tháng 11 năm 2019
Liên kết:Arxiv | GitHub

EfficientDet đã giới thiệu khái niệm về BiFPN (Bidirectional Feature Pyramid Network), cho phép hợp nhất đặc trưng đa tỷ lệ dễ dàng và nhanh chóng. Nó kết hợp điều này với một phương pháp mở rộng hợp chất để mở rộng đồng nhất độ phân giải, độ sâu và chiều rộng cho tất cả các mạng backbone, mạng đặc trưng và mạng dự đoán hộp/lớp. Mặc dù rất hiệu quả vào thời điểm đó, sự phụ thuộc lớn vào các lớp hợp nhất đặc trưng phức tạp này thường dẫn đến độ trễ cao hơn trên phần cứng không chuyên dụng.

YOLO26: Tốc độ và sự đơn giản từ đầu đến cuối

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức:Ultralytics
Ngày: 14 tháng 1 năm 2026
Liên kết:Tài liệu | GitHub

YOLO26 đại diện cho một sự thay đổi mô hình hướng tới suy luận end-to-end (E2E) nguyên bản, loại bỏ hoàn toàn nhu cầu về Non-Maximum Suppression (NMS). Lựa chọn thiết kế này đơn giản hóa đáng kể quy trình triển khai. Bằng cách loại bỏ module Distribution Focal Loss (DFL), YOLO26 đạt được tốc độ suy luận nhanh hơn tới 43% trên CPU, biến nó thành lựa chọn vượt trội cho điện toán biên. Nó cũng giới thiệu bộ tối ưu hóa MuSGD, một sự kết hợp giữa SGD và Muon, mang lại những cải thiện về độ ổn định huấn luyện lấy cảm hứng từ các đổi mới LLM.

Tìm hiểu thêm về YOLO26

Điểm khác biệt chính: End-to-End so với Hậu xử lý

EfficientDet dựa vào xử lý hậu kỳ NMS để lọc các hộp giới hạn chồng chéo, điều này có thể trở thành nút thắt cổ chai trong các cảnh có mật độ cao. YOLO26 sử dụng thiết kế không NMS, xuất trực tiếp các dự đoán cuối cùng từ mô hình, đảm bảo độ trễ nhất quán bất kể mật độ đối tượng.

Phân tích hiệu suất

Các điểm chuẩn cho thấy sự khác biệt đáng kể về hiệu quả, đặc biệt khi triển khai trong các môi trường hạn chế tài nguyên. Biểu đồ và bảng sau đây minh họa khoảng cách hiệu suất giữa dòng EfficientDet (d0-d7) và chuỗi YOLO26 (n-x).

Bảng so sánh các chỉ số

Bảng dưới đây làm nổi bật hiệu suất trên tập dữ liệu COCO. Hãy chú ý đến lợi thế tốc độ vượt trội của YOLO26, đặc biệt trong các điểm chuẩn CPU.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Tốc độ và Độ trễ

EfficientDet đạt độ chính xác khá nhưng thường gặp khó khăn về độ trễ do các lớp BiFPN phức tạp và các phép toán mở rộng nặng nề. Ngược lại, YOLO26 cung cấp sự đánh đổi tốc độ-độ chính xác vượt trội. Ví dụ, YOLO26s vượt trội hơn EfficientDet-d3 về độ chính xác (48.6% so với 47.5% mAP) trong khi duy trì FLOPs thấp hơn đáng kể (20.7B so với 24.9B) và tốc độ suy luận nhanh hơn đáng kể trên GPU (2.5ms so với 19.59ms).

Yêu cầu về bộ nhớ và tài nguyên

YOLO26 nổi bật trong các môi trường có hạn chế bộ nhớ nghiêm ngặt. Việc loại bỏ DFL và kiến trúc tinh gọn giúp sử dụng VRAM thấp hơn trong quá trình huấn luyện và kích thước tệp xuất nhỏ hơn. Trong khi các mô hình EfficientDet có thể mở rộng lên kích thước lớn (d7 yêu cầu tính toán đáng kể), hệ sinh thái Ultralytics đảm bảo ngay cả các biến thể YOLO26 lớn nhất vẫn có thể huấn luyện được trên phần cứng tiêu dùng tiêu chuẩn, không giống như các mô hình dựa trên Transformer nặng hoặc các kiến trúc nặng cũ hơn.

Điểm nổi bật và Đổi mới về Tính năng

Độ ổn định và hội tụ của quá trình huấn luyện

Một lợi thế độc đáo của YOLO26 là việc tích hợp bộ tối ưu hóa MuSGD. Lấy cảm hứng từ Kimi K2 của Moonshot AI, bộ tối ưu hóa này ổn định động lực huấn luyện, cho phép tốc độ học cao hơn và hội tụ nhanh hơn so với các kỹ thuật tối ưu hóa tiêu chuẩn thường được yêu cầu cho mở rộng hợp chất phức tạp của EfficientDet.

Detect vật thể nhỏ

EfficientDet nổi tiếng về khả năng xử lý tốt các đối tượng đa tỷ lệ, nhưng YOLO26 giới thiệu ProgLoss (Progressive Loss) + STAL (Small-Target-Aware Label Assignment). Các hàm mất mát chuyên biệt này đặc biệt nhắm vào điểm yếu chung là detect các đối tượng nhỏ, giúp YOLO26 đặc biệt có khả năng cho các tác vụ như phân tích ảnh hàng không hoặc giám sát từ xa.

Tính linh hoạt trên nhiều tác vụ

Trong khi EfficientDet chủ yếu là một bộ detect đối tượng, YOLO26 là một khung làm việc thống nhất. Nó hỗ trợ nguyên bản:

Các trường hợp sử dụng thực tế

Triển khai biên và IoT

Mô hình lý tưởng: YOLO26n Đối với các ứng dụng chạy trên Raspberry Pi hoặc NVIDIA Jetson Nano, YOLO26n là người chiến thắng rõ ràng. Tối ưu hóa CPU của nó cho phép xử lý thời gian thực mà không cần GPU chuyên dụng.

  • Ứng dụng: Camera an ninh nhà thông minh detect người và vật nuôi.
  • Lý do: EfficientDet-d0 chậm hơn đáng kể trên CPU, có thể bỏ lỡ các khung hình trong các luồng dữ liệu thời gian thực.

Kiểm tra công nghiệp độ chính xác cao

Mô hình lý tưởng: YOLO26x / EfficientDet-d7 Trong các kịch bản mà độ chính xác là tối quan trọng và phần cứng không phải là một hạn chế (ví dụ: xử lý phía máy chủ), cả hai mô hình đều khả thi. Tuy nhiên, YOLO26x cung cấp mAP cao hơn (57.5%) so với EfficientDet-d7 (53.7%) chỉ bằng một phần nhỏ thời gian suy luận.

  • Ứng dụng:Kiểm soát chất lượng sản xuất phát hiện các lỗi nhỏ trên dây chuyền lắp ráp.
  • Lý do: Tính năng STAL của YOLO26x cải thiện khả năng detect các lỗi nhỏ mà các kiến trúc cũ hơn có thể bỏ sót.

Khả năng Sử dụng và Hệ sinh thái

Một trong những khác biệt đáng kể nhất nằm ở trải nghiệm của nhà phát triển. EfficientDet, mặc dù mạnh mẽ, thường yêu cầu cấu hình phức tạp trong TensorFlow Object Detection API hoặc các bộ AutoML.

Ultralytics ưu tiên Dễ sử dụng. Với một API python đơn giản, người dùng có thể tải, huấn luyện và triển khai các mô hình chỉ với vài dòng code:

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Hệ sinh thái được duy trì tốt xung quanh Ultralytics bao gồm các tích hợp liền mạch cho chú thích dữ liệu, theo dõi thử nghiệmxuất sang các định dạng như ONNX, TensorRT và CoreML. Mạng lưới hỗ trợ rộng lớn này đảm bảo các nhà phát triển dành ít thời gian hơn để debug cơ sở hạ tầng và nhiều thời gian hơn để tinh chỉnh ứng dụng của họ.

Các mô hình tương tự

Nếu bạn quan tâm đến việc khám phá các kiến trúc hiện đại khác trong khuôn khổ Ultralytics, hãy xem xét:

  • YOLO11: Tiền thân của YOLO26, mang lại hiệu suất mạnh mẽ và khả năng tương thích rộng.
  • RT-DETR: Một Real-Time Detection Transformer cung cấp độ chính xác cao, mặc dù yêu cầu bộ nhớ cao hơn so với các mô hình YOLO.

Kết luận

Trong khi EfficientDet giới thiệu các khái niệm quan trọng về mở rộng tính năng, YOLO26 đại diện cho công nghệ tiên tiến nhất vào năm 2026. Những đổi mới kiến trúc của nó—cụ thể là thiết kế end-to-end không NMS, bộ tối ưu hóa MuSGD và loại bỏ DFL—mang lại lợi thế rõ rệt về cả tốc độ và độ chính xác.

Đối với các nhà phát triển tìm kiếm một mô hình đa năng, hiệu suất cao, dễ huấn luyện và triển khai hiệu quả trên các thiết bị biên, YOLO26 là lựa chọn được khuyến nghị. Việc tích hợp nó vào hệ sinh thái Ultralytics đơn giản hóa hơn nữa vòng đời của các dự án học máy, từ chuẩn bị tập dữ liệu đến triển khai sản xuất.


Bình luận