Chuyển đến nội dung

YOLO26 so với EfficientDet: Tiêu chuẩn mới trong phát hiện đối tượng

Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn kiến ​​trúc mô hình phù hợp là rất quan trọng để cân bằng độ chính xác, tốc độ và hiệu quả tính toán. Hai ứng cử viên nổi bật trong lĩnh vực này là Ultralytics YOLO26 , đại diện cho công nghệ phát hiện thời gian thực tiên tiến nhất, và EfficientDet , một kiến ​​trúc được đánh giá cao nhờ hiệu quả có thể mở rộng. Bài so sánh kỹ thuật này sẽ đi sâu vào các cải tiến kiến ​​trúc, điểm chuẩn hiệu năng và các trường hợp sử dụng lý tưởng của chúng để giúp các nhà phát triển lựa chọn công cụ tốt nhất cho các ứng dụng cụ thể của họ.

Tóm tắt điều hành

Trong khi EfficientDet giới thiệu khái niệm mạnh mẽ về mở rộng quy mô phức hợp vào lĩnh vực này, YOLO26 đại diện cho thế hệ AI thị giác tiếp theo, ưu tiên không chỉ hiệu quả tham số mà còn cả tính thực tiễn trong triển khai. Được phát hành vào đầu năm 2026, YOLO26 cung cấp thiết kế hoàn chỉnh không cần NMS , tốc độ suy luận nhanh hơn đáng kể trên các thiết bị biên và một hệ sinh thái toàn diện hỗ trợ nhiều tác vụ khác nhau ngoài việc phát hiện hộp giới hạn đơn giản.

Ultralytics Tổng quan về YOLO26

YOLO26 là phiên bản mới nhất trong dòng sản phẩm nổi tiếng. YOLO Dòng sản phẩm (You Only Look Once), được thiết kế bởi Ultralytics . Dựa trên sự thành công của các mẫu như YOLO11YOLOv10 , nó đẩy mạnh giới hạn của những gì có thể thực hiện được trên phần cứng dành cho người tiêu dùng và các thiết bị biên.

Tác giả: Glenn Jocher và Jing Qiu
Tổ chức:Ultralytics
Ngày: 2026-01-14
GitHub:Kho lưu trữ Ultralytics
Tài liệu:Tài liệu YOLO26

Tìm hiểu thêm về YOLO26

Các Đổi Mới Kiến Trúc Chính

YOLO26 giới thiệu một số tính năng đột phá giúp nó khác biệt so với các máy dò truyền thống:

  • Thiết kế không cần NMS từ đầu đến cuối: Không giống như EfficientDet, vốn phụ thuộc rất nhiều vào việc triệt tiêu cực đại cục bộ (Non-Maximum Suppression) NMS (Không cần xử lý hậu kỳ để lọc các hộp chồng chéo, YOLO26 vốn là phần mềm mã nguồn mở hoàn chỉnh. Điều này giúp loại bỏ...) NMS Hoàn toàn đơn giản hóa quy trình triển khai và giảm sự biến động độ trễ, điều này rất quan trọng đối với suy luận thời gian thực .
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện Mô hình Ngôn ngữ Lớn (LLM) như Kimi K2 của Moonshot AI, YOLO26 sử dụng bộ tối ưu hóa lai kết hợp SGD và Muon. Sự đổi mới này đảm bảo động lực huấn luyện ổn định hơn và hội tụ nhanh hơn, giảm chi phí huấn luyện các mô hình lớn.
  • ProgLoss + STAL: Sự kết hợp giữa Progressive Loss và Soft Target Anchor Loss (STAL) mang lại những cải tiến đáng kể trong việc phát hiện các vật thể nhỏ , một thách thức phổ biến trong các ứng dụng như ảnh chụp từ trên không và nông nghiệp chính xác .
  • Xuất dữ liệu đơn giản: Bằng cách loại bỏ Distribution Focal Loss (DFL), YOLO26 tối ưu hóa đồ thị mô hình, giúp dễ dàng xuất sang các định dạng như ONNXTensorRT để tối đa hóa khả năng tương thích với các thiết bị biên công suất thấp.

Tổng quan về EfficientDet

EfficientDet được phát triển bởi Google Nhóm nghiên cứu Brain đã giải quyết nhu cầu về phát hiện đối tượng có khả năng mở rộng. Họ sử dụng phương pháp mở rộng phức hợp, giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng của mạng xương sống, mạng đặc trưng và mạng dự đoán.

Tác giả: Mingxing Tan, Ruoming Pang, và Quốc V. Lê
Tổ chức: Google
Ngày: 20/11/2019
Arxiv: Bài báo EfficientDet
GitHub: Kho lưu trữ Google AutoML

Các tính năng kiến trúc chính

  • BiFPN: Mạng lưới kim tự tháp đặc trưng hai chiều cho phép kết hợp các đặc trưng ở nhiều quy mô khác nhau một cách dễ dàng.
  • Điều chỉnh tỷ lệ phức hợp: Một hệ số phức hợp duy nhất $\phi$ kiểm soát việc điều chỉnh tỷ lệ của tất cả các chiều mạng, đảm bảo sự gia tăng cân bằng giữa độ chính xác và chi phí tính toán.

So sánh kỹ thuật

Bảng dưới đây nêu bật các chỉ số hiệu năng của YOLO26 so với EfficientDet. YOLO26 thể hiện tốc độ và độ chính xác vượt trội, đặc biệt trên phần cứng tiêu chuẩn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.2*3.923.92.54
EfficientDet-d164040.513.5*7.316.66.1
EfficientDet-d264043.017.7*10.928.111.0
EfficientDet-d364047.528.0*19.5912.024.9
EfficientDet-d464049.742.8*33.5520.755.2
EfficientDet-d564051.572.5*67.8633.7130.0
EfficientDet-d664052.692.8*89.2951.9226.0
EfficientDet-d764053.7122.0*128.0751.9325.0

*Lưu ý: EfficientDet CPU Tốc độ được ước tính dựa trên độ phức tạp tương đối của kiến ​​trúc và các tiêu chuẩn cũ hơn, vì các tiêu chuẩn hiện đại đã được chuẩn hóa. CPU Các tiêu chuẩn đánh giá cho nó ít phổ biến hơn.

Phân tích hiệu suất

  1. Tốc độ suy luận: YOLO26 cung cấp tốc độ suy luận nhanh hơn đáng kể, đặc biệt là trên CPU . Ví dụ, YOLO26n có khả năng hoạt động theo thời gian thực trên các thiết bị biên, nơi các biến thể EfficientDet có thể gặp khó khăn về độ trễ. Việc loại bỏ NMS Trong YOLO26, thời gian suy luận được ổn định hơn nữa, giúp nó trở nên xác định và đáng tin cậy hơn cho robot.
  2. Độ chính xác: YOLO26 đạt được mAP cao hơn ở số lượng tham số tương đương hoặc thấp hơn. YOLO26x đạt 57,5 mAP , vượt trội hơn cả EfficientDet-d7 lớn hơn nhiều (53,7). mAP ) đồng thời nhanh hơn đáng kể.
  3. Hiệu quả huấn luyện: Với thuật toán tối ưu hóa MuSGD, YOLO26 hội tụ nhanh hơn, giảm số lượng epoch cần thiết. Điều này giúp giảm chi phí điện toán đám mây và rút ngắn chu kỳ lặp lại cho nghiên cứu và phát triển.

Hiệu quả bộ nhớ

Ultralytics YOLO các mô hình thường có mức thấp hơn CUDA Yêu cầu bộ nhớ trong quá trình huấn luyện thấp hơn so với các kiến ​​trúc cũ hơn hoặc các mô hình dựa trên Transformer. Điều này cho phép các nhà phát triển huấn luyện các mô hình hiện đại trên GPU cấp độ người tiêu dùng với kích thước lô lớn hơn.

Các trường hợp và ứng dụng sử dụng

Ở đâu Ultralytics YOLO26 Xuất sắc

  • Trí tuệ nhân tạo biên thời gian thực: Nhờ khả năng suy luận CPU nhanh hơn 43% , YOLO26 là lựa chọn lý tưởng để triển khai trên Raspberry Pi, điện thoại di động hoặc camera thông minh .
  • Robot và Hệ thống Tự động: Độ trễ xác định được cung cấp bởi NMS Thiết kế không phụ thuộc vào phần mềm là yếu tố then chốt đối với các ứng dụng quan trọng về an toàn như điều hướng tự động và robot công nghiệp.
  • Các tác vụ thị giác đa dạng: Ngoài khả năng phát hiện, YOLO26 còn hỗ trợ phân đoạn đối tượng , ước tính tư thếOBB , biến nó thành một nền tảng linh hoạt cho các quy trình phức tạp.

Vị trí phù hợp của EfficientDet

EfficientDet vẫn là một lựa chọn khả thi cho các hệ thống cũ đã được tích hợp sẵn. TensorFlow hệ sinh thái hoặc Google Hệ thống xử lý AutoML của 's. Khả năng mở rộng theo cấp số nhân của nó có lợi cho các nhà nghiên cứu nghiên cứu các quy luật mở rộng kiến ​​trúc, nhưng đối với việc triển khai thực tế vào năm 2026, nó thường tụt hậu so với các công nghệ hiện đại. YOLO Các kiến ​​trúc trong sự đánh đổi giữa tốc độ và độ chính xác.

Lợi thế của Ultralytics

Việc lựa chọn Ultralytics YOLO26 thay vì EfficientDet không chỉ mang lại cho các nhà phát triển một mô hình mà còn mở ra cơ hội gia nhập một hệ sinh thái đang phát triển mạnh mẽ.

  • Dễ sử dụng: Ultralytics API được thiết kế để mang lại trải nghiệm "từ con số không đến chuyên gia". Bạn có thể tải, huấn luyện và triển khai mô hình chỉ với vài dòng mã. Python mã số.
  • Hệ sinh thái được duy trì tốt: Ultralytics Cung cấp các bản cập nhật thường xuyên, tài liệu đầy đủ và một cộng đồng đảm bảo các công cụ của bạn không bao giờ lỗi thời.
  • Tính linh hoạt: Trong khi EfficientDet chủ yếu là một công cụ phát hiện đối tượng, YOLO26 đóng vai trò là một khung thống nhất cho nhiều tác vụ thị giác máy tính, bao gồm phân loại và theo dõi.
  • Tích hợp liền mạch: Nền tảng Ultralytics cho phép quản lý tập dữ liệu, huấn luyện mô hình và triển khai chỉ bằng một cú nhấp chuột sang nhiều định dạng khác nhau một cách dễ dàng.

Ví dụ mã: Bắt đầu với YOLO26

Việc chuyển sang YOLO26 rất đơn giản. Dưới đây là cách bạn có thể thực hiện suy luận trên ảnh bằng cách sử dụng... Python API:

from ultralytics import YOLO

# Load the nano model for maximum speed
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Process results
for result in results:
    result.show()  # Display the image
    result.save(filename="output.jpg")  # Save the result

Đối với người dùng quan tâm đến việc khám phá các kiến ​​trúc hiện đại khác, tài liệu cũng đề cập đến YOLO11RT-DETR , cung cấp một loạt các công cụ cho mọi thách thức về thị giác máy tính.

Kết luận

Trong khi EfficientDet đóng vai trò then chốt trong lịch sử của các mạng nơ-ron hiệu quả, YOLO26 thiết lập một tiêu chuẩn mới cho những gì có thể đạt được vào năm 2026. Với độ chính xác vượt trội, tốc độ suy luận nhanh hơn trên CPU và NMS Với kiến ​​trúc không phụ thuộc vào ngôn ngữ lập trình, YOLO26 là lựa chọn tối ưu cho các nhà phát triển xây dựng thế hệ ứng dụng thông minh tiếp theo. Kết hợp với sự dễ sử dụng và hỗ trợ của hệ điều hành, YOLO26 là sự lựa chọn hoàn hảo cho những người muốn phát triển các ứng dụng thông minh thế hệ mới. Ultralytics Hệ sinh thái này giúp các nhóm chuyển từ ý tưởng sang sản phẩm nhanh hơn bao giờ hết.


Bình luận