Chuyển đến nội dung

So sánh EfficientDet với YOLOv6 -3.0: Tìm hiểu sâu về các kiến ​​trúc phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng phù hợp thường là sự cân bằng giữa độ chính xác, độ trễ và các hạn chế về triển khai. Bài so sánh này khám phá hai cột mốc quan trọng trong lịch sử thị giác máy tính: EfficientDet , Google Kiến trúc có khả năng mở rộng của 's đã định nghĩa lại hiệu quả tham số vào năm 2019, và YOLOv6 -3.0 , bộ dò cấp công nghiệp của Meituan được tối ưu hóa cho thông lượng cao. GPU các đơn đăng ký vào năm 2023.

So sánh Các chỉ số Hiệu suất

Bảng sau đây nêu bật sự khác biệt về hiệu năng giữa hai kiến ​​trúc. Trong khi EfficientDet tập trung vào hiệu quả tham số (kích thước mô hình nhỏ hơn cho cùng độ chính xác), YOLOv6 - Phiên bản 3.0 ưu tiên tốc độ suy luận trên các bộ tăng tốc phần cứng như GPU.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

EfficientDet: Có khả năng mở rộng và tiết kiệm tham số

EfficientDet được giới thiệu bởi Google Nhóm nghiên cứu Brain đã giải quyết thách thức về việc mở rộng quy mô các mô hình phát hiện đối tượng một cách hiệu quả. Không giống như các mô hình trước đây chỉ đơn giản là làm cho mạng sâu hơn hoặc rộng hơn, EfficientDet đã giới thiệu phương pháp Mở rộng Kết hợp (Compound Scaling) giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng.

Các tính năng kiến trúc chính

  • BiFPN (Mạng kim tự tháp đặc trưng hai chiều có trọng số): EfficientDet tạo ra một đường dẫn kết hợp đặc trưng phức tạp. Không giống như FPN tiêu chuẩn, BiFPN cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng bằng cách đưa ra các trọng số có thể học được cho các đặc trưng đầu vào khác nhau, đảm bảo mạng ưu tiên thông tin quan trọng hơn.
  • Kiến trúc xương sống EfficientNet: Nó sử dụng EfficientNet làm kiến ​​trúc xương sống, được tối ưu hóa cao cho các phép toán dấu phẩy động (FLOPs) và số lượng tham số.
  • Điều chỉnh tỷ lệ phức hợp: Một hệ số đơn giản $\phi$ kiểm soát việc điều chỉnh tỷ lệ của mạng xương sống, BiFPN và mạng phân lớp/hộp đồng thời.

Cảnh báo phức tạp

Mặc dù BiFPN có cấu trúc toán học thanh lịch và hiệu quả về tham số, nhưng các mẫu truy cập bộ nhớ không đều của nó có thể khiến việc tối ưu hóa trên một số bộ tăng tốc phần cứng trở nên khó khăn hơn so với các khối tích chập đơn giản được tìm thấy trong các hệ thống khác. YOLO kiến trúc.

Siêu dữ liệu:

  • Tác giả: Mingxing Tan, Ruoming Pang, Quoc V. Le
  • Tổ chức:Google Research
  • Ngày: 20 tháng 11 năm 2019
  • Liên kết:Arxiv | GitHub

Tìm hiểu thêm về EfficientDet

YOLOv6 -3.0: Quỷ Tốc Độ Công Nghiệp

Được Meituan phát hành vào năm 2023. YOLOv6 -3.0 (thường được gọi là "Tải lại toàn diện") được thiết kế dành riêng cho các ứng dụng công nghiệp. Các tác giả ưu tiên tốc độ suy luận thực tế trên GPU hơn là số phép tính FLOPs lý thuyết, dẫn đến một mô hình vượt trội trong các kịch bản thông lượng cao như phân tích video .

Các tính năng kiến trúc chính

  • RepBi-PAN: Cấu trúc cổ được cập nhật này sử dụng các khối kiểu RepVGG. Trong quá trình huấn luyện, các khối này có cấu trúc đa nhánh để tối ưu hóa luồng gradient. Trong quá trình suy luận, chúng được tái cấu trúc thành một phép tích chập 3x3 duy nhất, giúp giảm đáng kể độ trễ.
  • Huấn luyện có hỗ trợ neo (AAT): Trong khi YOLOv6 Về cơ bản, đây là một bộ dò không cần anchor , phiên bản 3.0 đã giới thiệu một nhánh phụ trợ dựa trên anchor trong quá trình huấn luyện để ổn định sự hội tụ và cải thiện độ chính xác mà không ảnh hưởng đến tốc độ suy luận.
  • Đầu dò tách rời: Nhiệm vụ phân loại và hồi quy được tách thành các nhánh khác nhau, một lựa chọn thiết kế đã trở thành tiêu chuẩn trong các máy dò hiện đại để giải quyết mâu thuẫn giữa hai mục tiêu này.

Siêu dữ liệu:

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, et al.
  • Tổ chức:Meituan
  • Ngày: 13 tháng 1, 2023
  • Liên kết:Arxiv | GitHub

Tìm hiểu thêm về YOLOv6

Phân tích so sánh

Độ trễ và Thông lượng

YOLOv6 -3.0 nhanh hơn đáng kể trên GPU phần cứng. Như thể hiện trong bảng, YOLOv6 -3.0l đạt được mức độ mAP 52,8% với TensorRT Độ trễ chỉ 8,95ms . Ngược lại, EfficientDet-d6 đạt được độ trễ tương tự là 52,6%. mAP nhưng lại cần 89,29ms — chậm hơn gần một bậc độ lớn. Điều này khiến YOLOv6 là lựa chọn tối ưu nhất cho các ứng dụng yêu cầu xử lý thời gian thực. NVIDIA Các thiết bị T4 hoặc Jetson.

Hiệu quả tham số

EfficientDet hoạt động xuất sắc trong môi trường mà lưu trữ là nút thắt cổ chai chính. EfficientDet-d0 cung cấp hiệu suất đáng kể là 34,6%. mAP Chỉ với 3,9 triệu tham số . Con số này còn thấp hơn cả mức nhỏ nhất. YOLOv6 Biến thể. Đối với nghiên cứu học thuật hoặc môi trường lưu trữ cực kỳ hạn chế (ví dụ: nhúng trực tiếp mô hình vào một gói ứng dụng di động nhỏ), kích thước nhỏ gọn của EfficientDet vẫn rất phù hợp.

Huấn luyện và Khả năng sử dụng

EfficientDet dựa trên hệ thống cũ hơn. TensorFlow Hệ sinh thái AutoML, vốn có thể khó tích hợp vào các hệ thống hiện đại. PyTorch quy trình làm việc tập trung vào. Việc huấn luyện thường liên quan đến việc tinh chỉnh siêu tham số phức tạp để mở rộng quy mô hợp chất. YOLOv6 - Phiên bản 3.0 cung cấp một công thức huấn luyện hiện đại hơn nhưng tập trung chủ yếu vào phát hiện đối tượng , thiếu hỗ trợ gốc cho các tác vụ khác như phân đoạn hoặc ước tính tư thế trong phiên bản cốt lõi.

Lợi thế của Ultralytics

Mặc dù việc nghiên cứu các kiến ​​trúc này mang lại những hiểu biết quý giá, nhưng sự phát triển hiện đại đòi hỏi một nền tảng toàn diện. Ultralytics Nó cung cấp một hệ sinh thái toàn diện vượt trội so với các kiến ​​trúc mô hình riêng lẻ bằng cách tập trung vào toàn bộ vòng đời của máy học .

Tại sao nên chuyển sang Ultralytics ?

  • Tính linh hoạt vượt trội: Không giống như EfficientDet và YOLOv6 chủ yếu là các thiết bị phát hiện vật thể. Ultralytics Các mô hình hỗ trợ sẵn có các chức năng Phân đoạn đối tượng , Ước tính tư thế , Hộp giới hạn định hướng (OBB) và Phân loại.
  • Dễ sử dụng: Tính nhất quán Python API cho phép bạn chuyển đổi giữa các thế hệ mô hình (ví dụ: từ...) YOLO11 (đến YOLO26) bằng cách thay đổi một chuỗi duy nhất.
  • Hiệu quả bộ nhớ: Ultralytics Các mô hình được tối ưu hóa để giảm thiểu việc sử dụng VRAM trong quá trình huấn luyện, cho phép kích thước lô lớn hơn trên GPU dành cho người tiêu dùng so với các kiến ​​trúc ngốn bộ nhớ của EfficientDet.

Chào mừng YOLO26: Tiêu chuẩn mới

Đối với các nhà phát triển đang tìm kiếm công nghệ tiên tiến nhất, YOLO26 đại diện cho đỉnh cao về hiệu quả và hiệu năng. Được phát hành vào tháng 1 năm 2026, nó khắc phục những hạn chế của cả EfficientDet (tốc độ) và YOLOv6 ( CPU hiệu suất/độ phức tạp).

Những đột phá của YOLO26:

  • Giải pháp từ đầu đến cuối không cần NMS : Bằng cách loại bỏ Non-Maximum Suppression ( NMS ) , YOLO26 đơn giản hóa logic triển khai và giảm sự biến thiên độ trễ suy luận.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM, bộ tối ưu hóa lai này giúp ổn định quá trình huấn luyện và tăng tốc độ hội tụ.
  • Tối ưu hóa cho thiết bị biên: Với việc loại bỏ hiện tượng mất mát tiêu điểm phân tán (DFL) và những tinh chỉnh kiến ​​trúc cụ thể, YOLO26 nhanh hơn tới 43% về suy luận CPU so với các thế hệ trước, giúp nó vượt trội hơn cho Raspberry Pi và các triển khai trên thiết bị di động, nơi EfficientDet thường gặp khó khăn.
  • Các hàm mất mát nâng cao: Việc tích hợp ProgLossSTAL cải thiện đáng kể khả năng phát hiện vật thể nhỏ, một yêu cầu quan trọng đối với hình ảnh từ máy bay không người lái và cảm biến IoT .
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

Tìm hiểu thêm về YOLO26

Đề xuất Trường hợp Sử dụng

  • Hãy chọn EfficientDet nếu: Bạn đang thực hiện nghiên cứu học thuật về mở rộng quy mô hợp nhất đặc trưng hoặc đang làm việc với hệ thống cũ. TensorFlow các quy trình mà kích thước trọng lượng mô hình (MB) là ràng buộc nghiêm ngặt.
  • Chọn YOLOv6 -3.0 nếu: Bạn chỉ triển khai cho NVIDIA GPU (như T4 hoặc A10) và thông lượng thô (FPS) cho việc phát hiện đối tượng tiêu chuẩn là thước đo duy nhất của bạn.
  • Chọn Ultralytics YOLO26 nếu: Bạn cần một giải pháp sẵn sàng cho môi trường sản xuất, có khả năng cân bằng... CPU / GPU Tốc độ nhanh, không yêu cầu xử lý hậu kỳ phức tạp ( NMS -miễn phí), cần thực hiện các tác vụ vượt ra ngoài việc phát hiện đơn giản (như phân đoạn hoặc OBB), hoặc yêu cầu quy trình huấn luyện đơn giản hóa.

Để tìm hiểu sâu hơn về các bộ dò đối tượng hiện đại, hãy xem các bài so sánh của chúng tôi về YOLOv8 so với EfficientDet hoặc khả năng của Real-Time Detection Transformers ( RT-DETR ) .


Bình luận