Chuyển đến nội dung

YOLO26 so với EfficientDet: So sánh kỹ thuật giữa hai kiến ​​trúc phát hiện đối tượng hiện đại

Việc lựa chọn kiến ​​trúc mạng nơ-ron phù hợp là rất quan trọng đối với sự thành công của bất kỳ ứng dụng thị giác máy tính nào . Hướng dẫn kỹ thuật này sẽ khám phá những sự đánh đổi, các chỉ số hiệu suất và những đổi mới về kiến ​​trúc của hai mô hình nổi bật: Ultralytics YOLO26 tiên tiến và Google EfficientDet đã được khẳng định vị thế của 's.

Cho dù mục tiêu triển khai của bạn là các máy chủ đám mây có thông lượng cao hay các thiết bị AI biên có độ trễ thấp, việc hiểu rõ sự khác biệt giữa các kiến ​​trúc này sẽ đảm bảo sự cân bằng tối ưu giữa tốc độ, độ chính xác và hiệu quả.

Tổng quan kiến ​​trúc: YOLO26

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức: Ultralytics
Ngày: 14/01/2026
GitHub: Ultralytics GitHub
Tài liệu: Tài liệu chính thức của YOLO26

Ra mắt vào đầu năm 2026, YOLO26 đại diện cho bước tiến mới nhất trong dòng sản phẩm này. YOLO Thuộc dòng sản phẩm này, được thiết kế đặc biệt để mang lại trải nghiệm người dùng vượt trội và độ chính xác trung bình ( mAP ) hàng đầu. Được thiết kế từ đầu cho phần cứng hiện đại, nó cung cấp tính linh hoạt vượt trội trong phát hiện đối tượng , phân đoạn thể hiện , phân loại hình ảnhước tính tư thế .

YOLO26 giới thiệu một số tính năng đột phá giúp cải thiện đáng kể cả độ ổn định của quá trình huấn luyện và tốc độ suy luận:

  • Hệ NMS từ đầu đến cuối - Thiết kế miễn phí: Xây dựng dựa trên các khái niệm tiên phong trong YOLOv10 YOLO26 là hệ thống end-to-end nguyên bản, loại bỏ hoàn toàn nhu cầu sử dụng Non-Maximum Suppression (Ngăn chặn lỗi không tối đa). NMS ) xử lý hậu kỳ. Điều này dẫn đến logic triển khai đơn giản hơn và độ biến thiên độ trễ thấp hơn đáng kể.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Thông qua các tối ưu hóa kiến ​​trúc chuyên sâu, mô hình đạt được tốc độ suy luận chưa từng có trên các CPU tiêu chuẩn, khiến nó rất phù hợp cho môi trường IoT và hệ thống nhúng.
  • Loại bỏ DFL: Hiện tượng suy hao tiêu điểm phân bổ (Distribution Focal Loss - DFL) đã được loại bỏ, giúp quá trình xuất dữ liệu sạch hơn và tăng cường khả năng tương thích với các thiết bị biên công suất thấp sử dụng các công cụ như ONNX .
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các thuật toán huấn luyện LLM của Kimi K2 thuộc Moonshot AI , đây là sự kết hợp của... SGD Và Muon mang đến những cải tiến trong việc huấn luyện mô hình ngôn ngữ quy mô lớn trực tiếp cho thị giác máy tính, đảm bảo sự hội tụ nhanh hơn và các chế độ huấn luyện ổn định hơn.
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong nhận dạng vật thể nhỏ, một yếu tố quan trọng đối với các ứng dụng liên quan đến hình ảnh từ máy bay không người lái và robot.

Xuất khẩu được đơn giản hóa

Nhờ việc loại bỏ DFL và NMS - Với kiến ​​trúc hoàn toàn tự do, việc xuất các mô hình YOLO26 sang các định dạng thân thiện với thiết bị biên như NVIDIA TensorRT hoặc Intel OpenVINO hầu như không yêu cầu phát triển plugin tùy chỉnh.

Tìm hiểu thêm về YOLO26

Tổng quan kiến ​​trúc: EfficientDet

Tác giả: Mingxing Tan, Ruoming Pang, và Quốc V. Lê
Tổ chức: Google Research
Ngày: 20/11/2019
Arxiv: Bài báo EfficientDet
GitHub: Kho lưu trữ Google AutoML

Được giới thiệu bởi Google EfficientDet tận dụng tối đa hệ sinh thái TensorFlow và được thiết kế dựa trên khái niệm mở rộng quy mô kết hợp. Kiến trúc của nó mở rộng mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp đồng thời dựa trên các hạn chế về tài nguyên.

Các cải tiến chính của EfficientDet bao gồm:

  • BiFPN (Mạng kim tự tháp đặc trưng hai chiều): Một cơ chế cho phép kết hợp các đặc trưng đa tỷ lệ một cách dễ dàng và nhanh chóng, giúp mạng hiểu rõ hơn các đối tượng có kích thước khác nhau.
  • Phương pháp mở rộng phức hợp: Một phương pháp dựa trên kinh nghiệm để mở rộng độ phân giải, độ sâu và chiều rộng một cách đồng đều, tạo ra một họ các mô hình từ d0 (nhỏ nhất) đến d7 (lớn nhất).

Mặc dù EfficientDet vẫn là một lựa chọn mạnh mẽ cho việc phát hiện hộp giới hạn chính xác, nhưng nhìn chung nó thiếu tính linh hoạt đa nhiệm hiện đại (như các tác vụ OBB gốc) và hệ sinh thái Python hợp lý, thống nhất mà các nhà phát triển hiện đại mong đợi.

Tìm hiểu thêm về EfficientDet

So sánh hiệu năng và số liệu

Để xác định ranh giới Pareto về tốc độ và độ chính xác, chúng tôi đã đánh giá hiệu năng của cả hai kiến ​​trúc trên các môi trường tiêu chuẩn bằng cách sử dụng tập dữ liệu COCO . Bảng sau đây nêu bật sự khác biệt về kích thước mô hình, độ chính xác và độ trễ được đo trên một phiên bản AWS EC2 P4d .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Như đã trình bày ở trên, YOLO26 thiết lập sự cân bằng hiệu năng vượt trội. Mô hình YOLO26x đạt độ chính xác cao nhất ( 57,5 mAP ), vượt trội hơn đáng kể so với EfficientDet-d7 nặng nhất. Hơn nữa, các mô hình YOLO26 có yêu cầu bộ nhớ thấp hơn đáng kể và tốc độ nhanh hơn nhiều. GPU tốc độ suy luận (thấp nhất là 1,7 ms trên TensorRT ), nhấn mạnh những lợi ích của một NMS - Thiết kế miễn phí.

Hiệu quả đào tạo và lợi thế hệ sinh thái

Một điểm khác biệt chính giữa hai kiến ​​trúc nằm ở môi trường phát triển của chúng. EfficientDet được tích hợp sâu bên trong... Google AutoML và TensorFlow Hệ sinh thái này, dù mạnh mẽ, nhưng có thể dẫn đến những khó khăn trong việc học hỏi và cấu hình cứng nhắc đối với các tập dữ liệu tùy chỉnh như DOTAv1 .

Ngược lại, Ultralytics Nền tảng này cung cấp một hệ sinh thái được duy trì cực kỳ tốt, được xây dựng trên PyTorch . Việc sử dụng bộ nhớ trong quá trình huấn luyện được tối ưu hóa nghiêm ngặt, cho phép các kỹ sư huấn luyện các mô hình mạnh mẽ mà không cần phân bổ quá nhiều VRAM như thường thấy trong các mạng dựa trên Transformer.

Tích hợp nền tảng thống nhất

Thông qua Nền tảng Ultralytics , các nhà phát triển có quyền truy cập vào quy trình làm việc MLOps toàn diện. Điều này bao gồm chú thích dữ liệu liền mạch, điều chỉnh siêu tham số tự động và huấn luyện trên đám mây chỉ với một cú nhấp chuột, giúp tăng tốc đáng kể quá trình từ tạo mẫu đến sản xuất.

Ví dụ triển khai

Sự dễ sử dụng được cung cấp bởi Ultralytics API cho phép bạn huấn luyện và kiểm định mô hình YOLO26 hiện đại chỉ với vài dòng mã.

from ultralytics import YOLO

# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")

# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Train on GPU
)

# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")

Các trường hợp sử dụng lý tưởng

Khi nào nên sử dụng YOLO26:

  • Điện toán biên và thiết bị di động: Nhanh hơn tới 43% CPU suy luận và không NMS Xét về chi phí vận hành, YOLO26 hoạt động xuất sắc trên các thiết bị có ngân sách tính toán bị hạn chế nghiêm ngặt như Raspberry Pi hoặc điện thoại di động.
  • Đa nhiệm: Khi một quy trình xử lý dữ liệu duy nhất yêu cầu hộp giới hạn, mặt nạ phân đoạn và theo dõi, tính linh hoạt của YOLO26 là không gì sánh kịp.
  • Hình ảnh từ máy bay không người lái và trên không: Sự kết hợp giữa ProgLoss và STAL giúp tăng cường đáng kể khả năng phát hiện các vật thể cực nhỏ từ độ cao lớn.

Khi nào nên sử dụng EfficientDet:

  • Các Pipeline TensorFlow cũ: Nếu cơ sở hạ tầng của bạn được lập trình cứng để chỉ hỗ trợ... TensorFlow SavedModels hoặc yêu cầu cụ thể TensorFlow EfficientDet cung cấp khả năng tương thích gốc, phục vụ cho các đường dẫn xử lý dữ liệu.
  • TPU có tài nguyên hạn chế: EfficientDet đã được tối ưu hóa rất nhiều cho Google phong tục của Tensor Các đơn vị xử lý ( TPU ).

Khám phá các lựa chọn thay thế khác

Mặc dù hướng dẫn này tập trung chủ yếu vào mô hình YOLO26 so với EfficientDet , nhưng phạm vi rộng hơn của nó cũng bao gồm vấn đề này. Ultralytics Hệ sinh thái này còn chứa đựng nhiều kiến ​​trúc tuyệt vời khác. Nếu ứng dụng của bạn phụ thuộc nhiều vào các bộ chuyển đổi (transformer), RT-DETR cung cấp khả năng phát hiện dựa trên bộ chuyển đổi theo thời gian thực. Hoặc nếu bạn đang hỗ trợ các hệ thống cũ, YOLO11 vẫn được hỗ trợ đầy đủ và hoạt động hiệu quả cao. Để có cái nhìn tổng quan hơn, hãy truy cập Trung tâm So sánh Mô hình Ultralytics .

Tóm lại, đối với bất kỳ hệ thống xử lý hình ảnh máy tính hiện đại nào được xây dựng ngày nay, tốc độ vượt trội, tính dễ sử dụng và độ chính xác hàng đầu của YOLO26 khiến nó trở thành lựa chọn không thể bàn cãi dành cho cả các nhà nghiên cứu và nhà phát triển.


Bình luận