Chuyển đến nội dung

So sánh EfficientDet với... YOLOv9 So sánh kiến ​​trúc và hiệu năng

Trong bối cảnh thị giác máy tính đang phát triển nhanh chóng, việc lựa chọn kiến ​​trúc phát hiện đối tượng phù hợp là một quyết định quan trọng, ảnh hưởng đến mọi thứ từ chi phí đào tạo đến độ trễ triển khai. Phân tích kỹ thuật này cung cấp sự so sánh toàn diện giữa EfficientDet , một kiến ​​trúc tiên phong từ... Google tập trung vào khả năng mở rộng hiệu quả, và YOLOv9 , một phiên bản hiện đại của YOLO Dòng sản phẩm này giới thiệu thông tin về độ dốc có thể lập trình để học các đặc trưng vượt trội.

Tóm tắt điều hành

Mặc dù EfficientDet đã giới thiệu những khái niệm đột phá trong việc mở rộng mô hình và kết hợp đặc trưng, ​​nhưng hiện nay nó được coi là một kiến ​​trúc lỗi thời. Việc dựa vào các lớp BiFPN phức tạp thường dẫn đến tốc độ suy luận chậm hơn trên phần cứng hiện đại so với các thiết kế được tối giản hóa của các kiến ​​trúc khác. YOLO gia đình.

YOLOv9 đánh dấu một bước tiến vượt bậc, mang lại độ chính xác cao hơn với tốc độ suy luận nhanh hơn đáng kể. Hơn nữa, là một phần của hệ sinh thái Ultralytics , YOLOv9 Những lợi ích mà nó mang lại bao gồm API thống nhất, triển khai đơn giản và hỗ trợ cộng đồng mạnh mẽ, khiến nó trở thành lựa chọn được khuyến nghị cho môi trường sản xuất.

EfficientDet: Phát hiện đối tượng hiệu quả và có khả năng mở rộng

EfficientDet được thiết kế để giải quyết vấn đề mở rộng quy mô các bộ dò đối tượng một cách hiệu quả. Các mô hình trước đây thường chỉ đơn giản là mở rộng quy mô bằng cách làm cho cấu trúc xương sống lớn hơn, điều này bỏ qua sự cân bằng giữa độ phân giải, chiều sâu và chiều rộng.

Các tính năng kiến trúc chính

  • Mở rộng tỷ lệ kết hợp: EfficientDet đề xuất một phương pháp mở rộng tỷ lệ kết hợp, giúp mở rộng đồng đều độ phân giải, độ sâu và chiều rộng cho tất cả các mạng xương sống, mạng đặc trưng và mạng dự đoán hộp/lớp.
  • BiFPN (Mạng kim tự tháp đặc trưng hai chiều): Một cải tiến quan trọng cho phép dễ dàng kết hợp các đặc trưng ở nhiều quy mô khác nhau. Không giống như các FPN truyền thống, BiFPN bổ sung các đường dẫn từ dưới lên và loại bỏ các nút chỉ có một đầu vào, tích hợp các trọng số có thể học được để hiểu tầm quan trọng của các đặc trưng đầu vào khác nhau.
  • Kiến trúc xương sống EfficientNet: Nó sử dụng EfficientNet làm kiến ​​trúc xương sống, được tối ưu hóa về hiệu quả tham số.

Tác giả: Mingxing Tan, Ruoming Pang, và Quốc V. Lê
Tổ chức: Google
Ngày: 20/11/2019
Liên kết: Arxiv | GitHub

Tìm hiểu thêm về EfficientDet

YOLOv9: Thông tin Gradient có thể lập trình

YOLOv9 giải quyết một vấn đề cơ bản trong học sâu: tắc nghẽn thông tin. Khi dữ liệu truyền qua các lớp của mạng nơ-ron sâu, thông tin chắc chắn sẽ bị mất đi. YOLOv9 Giải quyết vấn đề này thông qua Thông tin Độ dốc Lập trình được (PGI) và một kiến ​​trúc mới có tên là GELAN .

Các tính năng kiến trúc chính

  • GELAN (Generalized Efficient Layer Aggregation Network): Kiến trúc này kết hợp những ưu điểm tốt nhất của CSPNet và ELAN. Nó tối ưu hóa các đường dẫn giảm độ dốc , đảm bảo mô hình học được các đặc trưng nhẹ nhưng giàu thông tin.
  • PGI (Programmable Gradient Information): PGI cung cấp một nhánh giám sát phụ trợ hướng dẫn quá trình học tập, đảm bảo nhánh chính giữ lại thông tin quan trọng cần thiết cho việc phát hiện chính xác. Điều này đặc biệt hữu ích để phát hiện các mục tiêu khó trong môi trường phức tạp.
  • Tính đơn giản: Mặc dù có những phức tạp bên trong, cấu trúc suy luận vẫn được tinh gọn, tránh được chi phí tính toán lớn liên quan đến BiFPN được sử dụng trong EfficientDet.

Tác giả: Chien-Yao Wang và Hong-Yuan Mark Liao
Đơn vị tổ chức: Viện Khoa học Thông tin, Viện Hàn lâm Khoa học Đài Loan
Ngày: 21/02/2024
Liên kết: Arxiv | GitHub

Tìm hiểu thêm về YOLOv9

So sánh hiệu suất kỹ thuật

Khi so sánh các mô hình này, sự đánh đổi giữa hiệu quả tham số và độ trễ thời gian chạy thực tế trở nên rõ ràng. Mặc dù EfficientDet hiệu quả về tham số, cấu trúc đồ thị phức tạp của nó (BiFPN) lại kém thân thiện hơn với... GPU song song hơn so với các phép tích chập tiêu chuẩn được sử dụng trong YOLOv9 .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Phân tích hiệu suất

YOLOv9 Nó luôn vượt trội hơn EfficientDet về tỷ lệ tốc độ trên độ chính xác. Ví dụ, YOLOv9c đạt được tỷ lệ tương đương. mAP (53,0%) so với EfficientDet-d6 (52,6%) nhưng chạy nhanh hơn hơn 12 lần trên T4. GPU (7,16ms so với 89,29ms). Điều này làm cho YOLOv9 Sự lựa chọn tối ưu cho các ứng dụng thời gian thực.

Kinh nghiệm đào tạo và hệ sinh thái

Một điểm khác biệt chính giữa các kiến ​​trúc này là tính dễ sử dụng và sự hỗ trợ hệ sinh thái được cung cấp bởi... Ultralytics .

Thách thức của EfficientDet

Việc huấn luyện EfficientDet thường liên quan đến việc điều hướng API phát hiện đối tượng TensorFlow hoặc các kho lưu trữ cũ. Việc thiết lập có thể khó khăn do xung đột phụ thuộc và thường thiếu hỗ trợ cho các tính năng hiện đại như huấn luyện tự động với độ chính xác hỗn hợp hoặc tích hợp ghi nhật ký đám mây dễ dàng.

Lợi thế của Ultralytics

Sử dụng YOLOv9 trong Ultralytics Khung phần mềm này mang đến trải nghiệm liền mạch. Hệ sinh thái tự động xử lý việc tăng cường dữ liệu, phát triển siêu tham số và xuất dữ liệu.

  • Dễ sử dụng: Bạn có thể bắt đầu huấn luyện chỉ với vài dòng mã.
  • Hiệu quả bộ nhớ: Ultralytics Các mô hình được tối ưu hóa để sử dụng ít VRAM hơn trong quá trình huấn luyện, cho phép kích thước lô lớn hơn trên GPU dành cho người tiêu dùng so với các mạng đa nhánh phức tạp.
  • Tính linh hoạt: Vượt xa khả năng phát hiện, Ultralytics API hỗ trợ phân đoạn đối tượngước tính tư thế , những tính năng không có sẵn trong các triển khai EfficientDet tiêu chuẩn.
from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Các ứng dụng thực tế

Việc lựa chọn mô hình có tác động đáng kể đến tính khả thi của các ứng dụng khác nhau.

Các trường hợp sử dụng lý tưởng cho EfficientDet

  • Nghiên cứu học thuật: Hữu ích cho việc nghiên cứu các kỹ thuật kết hợp đặc trưng và lý thuyết tỷ lệ phức hợp.
  • Các trường hợp công suất thấp/tốc độ thấp: Trong những trường hợp đặc biệt, khi phần cứng cũ được lập trình sẵn cho các đường trục EfficientNet (ví dụ: một số TPU Coral đời cũ), các biến thể EfficientDet-Lite vẫn có thể phù hợp.

Các Trường hợp Sử dụng Lý tưởng cho YOLOv9

  • Điều hướng tự động: Tốc độ suy luận cao là yếu tố then chốt đối với xe tự lái , vốn phải xử lý dữ liệu đầu vào trong vòng mili giây để đảm bảo an toàn.
  • Phân tích dữ liệu bán lẻ: Dành cho các ứng dụng như quản lý hàng tồn kho , YOLOv9 Cung cấp độ chính xác cần thiết để phân biệt giữa các sản phẩm tương tự mà không làm chậm hệ thống thanh toán.
  • Y tế: Trong phân tích hình ảnh y tế , kiến ​​trúc PGI giúp giữ lại các chi tiết nhỏ cần thiết để phát hiện các bất thường nhỏ trong ảnh chụp X-quang hoặc MRI.

Tương lai: Nâng cấp lên YOLO26

Trong khi YOLOv9 là một công cụ mạnh mẽ, Ultralytics Tiếp tục vượt qua các giới hạn của trí tuệ nhân tạo thị giác. Đối với các nhà phát triển đang tìm kiếm công nghệ tiên tiến nhất, YOLO26 mang lại những cải tiến đáng kể so với cả EfficientDet và EfficientDet. YOLOv9 .

YOLO26 giới thiệu thiết kế không cần NMS từ đầu đến cuối , loại bỏ hoàn toàn nhu cầu xử lý hậu kỳ bằng phương pháp loại bỏ cực đại không tương thích (Non-Maximum Suppression). Điều này giúp đơn giản hóa quy trình triển khai và tăng tốc độ suy luận. Ngoài ra, với bộ tối ưu hóa MuSGD mới — một sự kết hợp giữa... SGD và Muon—YOLO26 cung cấp quá trình huấn luyện ổn định hơn và tốc độ hội tụ nhanh hơn.

Đối với triển khai ở biên, YOLO26 được tối ưu hóa để tăng tốc độ suy luận CPU lên đến 43% và bao gồm tính năng loại bỏ DFL nhằm cải thiện khả năng tương thích với các thiết bị tiêu thụ điện năng thấp. Cho dù bạn đang làm việc với robot hay phân tích video hiệu suất cao, YOLO26 đều đại diện cho tiêu chuẩn mới.

Khám phá sức mạnh của YOLO26

Đối với người dùng quan tâm đến các kiến ​​trúc tiên tiến khác, chúng tôi cũng khuyên bạn nên tìm hiểu thêm về YOLO11RT-DETR Ultralytics tài liệu.


Bình luận