Chuyển đến nội dung

So sánh EfficientDet với YOLO11 Đánh giá sự tiến hóa của phát hiện đối tượng

Việc lựa chọn kiến ​​trúc tối ưu cho các ứng dụng thị giác máy tính thường liên quan đến việc cân bằng giữa hiệu quả tính toán và độ chính xác phát hiện. Bài so sánh toàn diện này khám phá những khác biệt kỹ thuật giữa EfficientDet , Google Kiến trúc phát hiện có khả năng mở rộng của 's từ năm 2019, và YOLO11 , một bản phát hành năm 2024 của Ultralytics đã định nghĩa lại hiệu suất thời gian thực.

Trong khi EfficientDet giới thiệu những khái niệm đột phá về mở rộng mô hình, YOLO11 Phiên bản này đánh dấu một bước tiến vượt bậc về khả năng sử dụng, tốc độ suy luận và tính linh hoạt đa nhiệm. Đối với các nhà phát triển bắt đầu các dự án mới vào năm 2026, chúng tôi cũng khuyên bạn nên tìm hiểu YOLO26 mới nhất, được xây dựng dựa trên những cải tiến đã được thảo luận ở đây với khả năng xử lý đầu cuối nguyên bản.

Phân tích hiệu suất Benchmark

Lĩnh vực phát hiện đối tượng đã thay đổi đáng kể, từ việc tối ưu hóa cho số phép tính lý thuyết (FLOPs) sang tối ưu hóa cho độ trễ thực tế. Bảng dưới đây làm nổi bật sự khác biệt rõ rệt về tốc độ suy luận. Trong khi EfficientDet-d0 yêu cầu khoảng 10ms cho CPU Trong suy luận, các kiến ​​trúc hiện đại như YOLO11n thực hiện các tác vụ tương tự nhanh hơn đáng kể, thường dưới 2ms trên phần cứng tương đương, đồng thời duy trì độ chính xác trung bình ( mAP ) cạnh tranh.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.51.52.62.66.5
YOLO11s64047.02.59.49.421.5
YOLO11m64051.54.720.120.168.0
YOLO11l64053.46.225.325.386.9
YOLO11x64054.711.356.956.9194.9

EfficientDet: Người tiên phong về mở rộng hợp chất

EfficientDet, được phát triển bởi Google Nhóm Brain, được thành lập như một phương pháp tiếp cận có hệ thống để mở rộng quy mô mô hình, được xây dựng trên nền tảng EfficientNet và giới thiệu Mạng kim tự tháp đặc trưng hai chiều có trọng số (BiFPN), cho phép kết hợp đặc trưng đa quy mô dễ dàng và nhanh chóng.

Điểm đột phá cốt lõi là phương pháp mở rộng phức hợp ( compound scaling ), một phương pháp mở rộng đồng đều độ phân giải, độ sâu và độ rộng của mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp. Điều này cho phép dòng sản phẩm EfficientDet (D0 đến D7) nhắm đến nhiều hạn chế về tài nguyên, từ thiết bị di động đến các thiết bị có hiệu năng cao. GPU máy chủ.

Mặc dù đạt được thành công về mặt học thuật và hiệu suất cao về số phép tính FLOPs, EfficientDet thường gặp khó khăn về độ trễ trên phần cứng thực tế do chi phí truy cập bộ nhớ của các kết nối BiFPN phức tạp và các phép tích chập tách biệt theo chiều sâu, vốn không phải lúc nào cũng được tối ưu hóa bởi các bộ tăng tốc như TensorRT .

Siêu dữ liệu EfficientDet:

Tìm hiểu thêm về EfficientDet

Ultralytics YOLO11 Định nghĩa lại công nghệ tiên tiến trong thời gian thực

Ra mắt vào tháng 9 năm 2024, YOLO11 được thiết kế để phát hiện đối tượng tốc độ cao, thực tiễn và triển khai tức thì. Không giống như EfficientDet, vốn tập trung mạnh vào hiệu quả tham số, YOLO11 Tối ưu hóa việc sử dụng phần cứng, đảm bảo mô hình hoạt động cực nhanh trên cả CPU biên và GPU doanh nghiệp.

YOLO11 Giới thiệu những cải tiến về kiến ​​trúc như khối C3k2 và mô-đun SPPF (Spatial Pyramid Pooling - Fast) được cải tiến. Những thay đổi này nâng cao khả năng trích xuất đặc trưng ở nhiều tỷ lệ khác nhau của mô hình mà không gây ra độ trễ như trong các thiết kế kim tự tháp đặc trưng cũ hơn. Hơn nữa, YOLO11 Hỗ trợ một khung thống nhất cho nhiều tác vụ thị giác, bao gồm phân đoạn đối tượng , ước lượng tư thế và phát hiện hộp giới hạn định hướng (OBB) , những khả năng đòi hỏi các triển khai tùy chỉnh phức tạp với EfficientDet.

Lợi thế hệ sinh thái

Ultralytics Các mô hình được tích hợp hoàn toàn với Nền tảng Ultralytics , cho phép quản lý tập dữ liệu liền mạch, tự động chú thích và huấn luyện mô hình chỉ với một cú nhấp chuột trên đám mây.

YOLO11 Siêu dữ liệu:

Tìm hiểu thêm về YOLO11

Sự khác biệt kỹ thuật chính

Sự kết hợp giữa kiến ​​trúc và tính năng

EfficientDet dựa trên BiFPN , một lớp kết hợp đặc trưng có trọng số phức tạp, kết nối các bản đồ đặc trưng từ trên xuống và từ dưới lên một cách lặp đi lặp lại. Mặc dù về mặt lý thuyết là hiệu quả, nhưng các mô hình truy cập bộ nhớ không đều có thể làm chậm quá trình suy luận trên GPU.

Ngược lại, YOLO11 Sử dụng kiến ​​trúc PANet (Path Aggregation Network) được tinh giản dựa trên các khối C3k2. Thiết kế này ưu tiên các mô hình truy cập bộ nhớ dày đặc, đều đặn, phù hợp với... CUDA các lõi và kiến ​​trúc NPU hiện đại, dẫn đến sự tăng tốc đáng kể được quan sát thấy trong bảng điểm chuẩn (ví dụ: YOLO11x nhanh hơn nhiều so với EfficientDet-d7 trong khi vẫn duy trì độ chính xác cao hơn).

Hiệu quả đào tạo và dễ sử dụng

Việc huấn luyện mô hình EfficientDet thường bao gồm việc sử dụng... TensorFlow API nhận diện đối tượng hoặc thư viện AutoML, có thể đòi hỏi thời gian học hỏi lâu dài và cấu hình tệp tin phức tạp.

Ultralytics Ưu tiên trải nghiệm của nhà phát triển. Đào tạo YOLO11 có thể truy cập thông qua một cách đơn giản. Python API hoặc Giao diện dòng lệnh ( CLI Thư viện này tự động xử lý việc điều chỉnh siêu tham số, tăng cường dữ liệu và định dạng tập dữ liệu.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Tính linh hoạt và khả năng triển khai

EfficientDet chủ yếu là một kiến ​​trúc phát hiện đối tượng. Việc điều chỉnh nó cho các tác vụ như phân đoạn hình ảnh hoặc ước lượng tư thế đòi hỏi phải có những thay đổi đáng kể về kiến ​​trúc.

YOLO11 Vốn dĩ là đa phương thức. Cùng một nền tảng và quy trình huấn luyện hỗ trợ:

  • Detect: Hộp giới hạn tiêu chuẩn.
  • Phân đoạn: Mặt nạ cấp độ pixel để xác định ranh giới đối tượng chính xác.
  • Phân loại: Phân loại toàn bộ hình ảnh.
  • Tư thế: Phát hiện điểm mấu chốt để theo dõi chuyển động xương.
  • OBB: Các hộp xoay dùng cho ảnh chụp từ trên không và phát hiện văn bản.

Tính linh hoạt này tạo nên YOLO11 Một "công cụ đa năng" dành cho các kỹ sư AI, cho phép một kho lưu trữ duy nhất cung cấp năng lượng cho nhiều ứng dụng khác nhau, từ hình ảnh y tế đến robot tự hành .

Tại sao chọn Mô hình Ultralytics?

Khi so sánh hai kiến ​​trúc này dành cho các hệ thống sản xuất hiện đại, Ultralytics Các mô hình này mang lại những ưu điểm riêng biệt:

  1. Giảm dung lượng bộ nhớ sử dụng: YOLO Các mô hình được tối ưu hóa để huấn luyện trên phần cứng cấp độ người tiêu dùng. Không giống như các mô hình dựa trên Transformer hoặc các kiến ​​trúc cũ nặng nề đòi hỏi tài nguyên khổng lồ. CUDA bộ nhớ, hiệu quả YOLO Các kiến ​​trúc này dân chủ hóa việc tiếp cận đào tạo AI cao cấp.
  2. Triển khai tối ưu: Xuất sang ONNX , TensorRT , CoreML , hoặc TFLite là một lệnh một dòng trong Ultralytics thư viện.
  3. Hỗ trợ tích cực: Ultralytics Cộng đồng rất sôi nổi và năng động. Với các bản cập nhật thường xuyên, khung phần mềm đảm bảo khả năng tương thích với các phiên bản mới nhất của PyTorch Và CUDA .

Kết luận: Sự lựa chọn hiện đại

Mặc dù EfficientDet vẫn là một cột mốc quan trọng trong lịch sử nghiên cứu thị giác máy tính, chứng minh sức mạnh của việc mở rộng quy mô phức hợp, nhưng YOLO11YOLO26 mới hơn là những lựa chọn vượt trội hơn cho việc triển khai thực tế hiện nay. Chúng mang lại sự cân bằng tốt hơn giữa tốc độ và độ chính xác, trải nghiệm người dùng dễ dàng hơn đáng kể và tính linh hoạt để xử lý nhiều tác vụ thị giác máy tính trong một khung phần mềm duy nhất.

Đối với các nhà phát triển muốn luôn cập nhật những công nghệ tiên tiến nhất, chúng tôi khuyên bạn nên tìm hiểu về YOLO26 , một giải pháp toàn diện từ đầu đến cuối. NMS - Thiết kế không cần cấu hình đặc biệt giúp giảm độ trễ và đơn giản hóa quy trình triển khai.

Để tìm hiểu thêm các tùy chọn hiệu năng cao khác, hãy xem các bài so sánh của chúng tôi về YOLOv10 hoặc RT-DETR .


Bình luận