Chuyển đến nội dung

So sánh EfficientDet với... YOLOv9 Kiến trúc, hiệu năng và triển khai tại biên

Lĩnh vực thị giác máy tính đã được định hình bởi những đột phá liên tục trong thiết kế mạng nơ-ron. Việc tìm ra sự cân bằng phù hợp giữa hiệu quả tính toán và độ chính xác phát hiện là rất quan trọng khi lựa chọn mô hình. Google EfficientDet của hãng này đã thiết lập một nền tảng vững chắc vào năm 2019 bằng cách giới thiệu các kiến ​​trúc có khả năng mở rộng, trong khi YOLOv9 , được phát hành vào năm 2024, đã đẩy mạnh giới hạn của việc phát hiện đối tượng bằng cách sử dụng Thông tin Gradient có thể lập trình (PGI).

Hướng dẫn này cung cấp sự so sánh kỹ thuật toàn diện giữa hai mô hình này và giới thiệu khung phần mềm Ultralytics YOLO26 hiện đại, cung cấp giải pháp mạnh mẽ, toàn diện được tối ưu hóa cho môi trường sản xuất.

Kiến trúc mô hình và những đổi mới

Hiểu rõ cơ chế hoạt động bên trong của EfficientDet và YOLOv9 Điều này rất cần thiết để xác định các trường hợp sử dụng tối ưu của chúng.

EfficientDet: Mở rộng hợp chất và BiFPN

Được phát triển bởi Google Trong nghiên cứu, EfficientDet tập trung vào việc mở rộng quy mô một cách có hệ thống và kết hợp các đặc trưng hiệu quả. Nó sử dụng EfficientNet làm nền tảng và giới thiệu một kiến ​​trúc mạng đặc trưng mới.

  • Tác giả: Mingxing Tan, Ruoming Pang, và Quoc V. Le
  • Tổ chức:Google
  • Ngày: 20 tháng 11 năm 2019
  • Liên kết: Arxiv , GitHub

Các đặc điểm kiến ​​trúc chính: EfficientDet dựa nhiều vào Mạng kim tự tháp đặc trưng hai chiều (BiFPN), cho phép kết hợp đặc trưng đa tỷ lệ dễ dàng và nhanh chóng. Bên cạnh đó, nó sử dụng phương pháp mở rộng tỷ lệ phức hợp để mở rộng đồng đều độ phân giải, độ sâu và chiều rộng của mạng. Mặc dù có độ chính xác cao so với thời điểm đó, EfficientDet lại phụ thuộc nhiều vào các môi trường TensorFlow cũ hơn, khiến các quy trình triển khai hiện đại trở nên phức tạp.

Tìm hiểu thêm về EfficientDet

YOLOv9: Giải quyết nút thắt thông tin

Được phát triển bởi các nhà nghiên cứu tại Viện Hàn lâm Khoa học Trung Quốc, YOLOv9 Giải quyết vấn đề suy giảm chất lượng thông tin khi dữ liệu truyền qua mạng nơ-ron sâu.

  • Tác giả: Chien-Yao Wang và Hong-Yuan Mark Liao
  • Tổ chức: Viện Khoa học Thông tin, Academia Sinica
  • Ngày: 21 tháng 2, 2024
  • Liên kết:Arxiv, GitHub, Docs

Các đặc điểm kiến ​​trúc chính: YOLOv9 Nó giới thiệu Thông tin Độ dốc Lập trình được (PGI) để cung cấp sự giám sát bổ trợ, đảm bảo dữ liệu quan trọng được lưu giữ để cập nhật trọng số mạng một cách đáng tin cậy. Nó cũng tích hợp Mạng Tổng hợp Lớp Hiệu quả Tổng quát (GELAN) để tối đa hóa hiệu quả tham số. Mặc dù có những cải tiến này, YOLOv9 vẫn yêu cầu Không triệt tiêu tối đa ( NMS ) trong quá trình xử lý hậu kỳ, điều này làm tăng độ trễ.

Tìm hiểu thêm về YOLOv9

So sánh hiệu suất

Khi đánh giá các mô hình này, việc phân tích dữ liệu thực nghiệm giúp xác định kiến ​​trúc nào mang lại sự cân bằng tốt nhất cho các yêu cầu phần cứng cụ thể của bạn.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Phân tích chuyên sâu

YOLOv9 Mang lại bước nhảy vọt về tốc độ giữa các thế hệ. Ví dụ, YOLOv9e đạt được mAP 55,6% với... TensorRT Độ trễ là 16,77ms. Ngược lại hoàn toàn, EfficientDet-d7 cung cấp độ trễ thấp hơn. mAP với độ chính xác 53,7% nhưng lại gặp phải độ trễ rất lớn (128,07ms) — khiến việc triển khai cho các luồng video thời gian thực trở nên vô cùng khó khăn.

Xuất mô hình để sản xuất

Việc xuất kiến ​​trúc của bạn sang các định dạng được tối ưu hóa như TensorRT hoặc OpenVINO giúp giảm đáng kể thời gian suy luận so với việc xuất trực tiếp. PyTorch chạy.

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa EfficientDet và YOLOv9 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn EfficientDet

EfficientDet là một lựa chọn mạnh mẽ cho:

  • Google Cloud và TPU Pipelines: Các hệ thống tích hợp sâu rộng với Google API Cloud Vision hoặc TPU cơ sở hạ tầng nơi EfficientDet có khả năng tối ưu hóa gốc.
  • Nghiên cứu về mở rộng quy mô phức hợp: Nghiên cứu chuẩn mực học thuật tập trung vào việc nghiên cứu tác động của việc mở rộng quy mô cân bằng về độ sâu, độ rộng và độ phân giải của mạng.
  • Triển khai trên thiết bị di động thông qua TFLite : Các dự án yêu cầu xuất sang TensorFlow Lite . Android hoặc các thiết bị Linux nhúng.

Khi nào nên chọn YOLOv9

YOLOv9 được khuyến nghị cho:

  • Nghiên cứu về tắc nghẽn thông tin: Các dự án học thuật nghiên cứu kiến ​​trúc Thông tin Gradient có thể lập trình (PGI) và Mạng tổng hợp lớp hiệu quả tổng quát (GELAN).
  • Nghiên cứu tối ưu hóa dòng gradient: Nghiên cứu tập trung vào việc hiểu và giảm thiểu sự mất mát thông tin trong các lớp mạng sâu trong quá trình huấn luyện.
  • Đánh giá hiệu năng phát hiện độ chính xác cao: Các kịch bản trong đó YOLOv9 mạnh mẽ COCO Hiệu năng chuẩn là cần thiết để làm điểm tham chiếu cho việc so sánh kiến ​​trúc.

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Cái Ultralytics Ưu điểm: Lựa chọn YOLO26

Trong khi YOLOv9 Và EfficientDet đã mở đường, các nhà phát triển đang tìm kiếm một framework hiện đại, sẵn sàng cho môi trường sản xuất thực sự nên xem xét các mô hình YOLO Ultralytics , đặc biệt là YOLO26 mới được phát hành.

Nền tảng Ultralytics mang đến sự dễ sử dụng chưa từng có, kết hợp các kịch bản huấn luyện cục bộ mạnh mẽ với giao diện hỗ trợ đám mây. YOLO26 đại diện cho một cuộc cải tiến lớn trong thiết kế mô hình, khiến các kiến ​​trúc cũ trở nên lỗi thời đối với nhiều ứng dụng thương mại.

Điểm nổi bật về kỹ thuật của YOLO26

  • Thiết kế không cần NMS từ đầu đến cuối: YOLO26 loại bỏ hoàn toàn các nút thắt cổ chai trong quá trình xử lý hậu kỳ. Bằng cách loại bỏ Non-Maximum Suppression, đồ thị triển khai được thống nhất và hoạt động nhanh hơn trên các chip AI biên.
  • Suy luận CPU nhanh hơn tới 43%: Được tối ưu hóa mạnh mẽ cho các thiết bị nhúng, giúp nó nhanh hơn đáng kể so với cả hai phương pháp kia. YOLOv9 và EfficientDet khi GPU không khả dụng.
  • Bộ tối ưu hóa MuSGD: Tích hợp những cải tiến của LLM vào trí tuệ nhân tạo thị giác, bộ tối ưu hóa lai này giúp ổn định các quá trình huấn luyện, cho phép các mô hình hội tụ nhanh hơn với ít tài nguyên hơn.
  • Yêu cầu bộ nhớ thấp: Không giống như các kiến ​​trúc nặng về transformer hoặc các mạng CNN chưa được tối ưu hóa, YOLO26 giảm thiểu... CUDA mức tiêu thụ bộ nhớ trong quá trình huấn luyện, cho phép bạn sử dụng kích thước lô lớn hơn trên phần cứng cấp người tiêu dùng.
  • ProgLoss + STAL: Thiết kế hàm mất mát vượt trội giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể nhỏ, khiến YOLO26 trở nên lý tưởng cho ảnh chụp từ trên không và mạng IoT.
  • Loại bỏ DFL: Thiết kế cấu trúc đơn giản cho phép chuyển đổi liền mạch sang các định dạng triển khai trên thiết bị di động.

Tìm hiểu thêm về YOLO26

Các lựa chọn mạnh mẽ khác trong Ultralytics Hệ sinh thái này bao gồm YOLO11YOLOv8 , cũng cung cấp tính linh hoạt đa nhiệm như phân đoạn đối tượngước tính tư thế .

Đào tạo đơn giản hóa với Python SDK

Ultralytics Các mô hình ưu tiên trải nghiệm của nhà phát triển. Việc huấn luyện một mô hình hiện đại được gói gọn chỉ trong vài dòng mã Python .

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Các ứng dụng thực tế

Việc lựa chọn giữa các kiến ​​trúc này phụ thuộc rất nhiều vào mục tiêu triển khai của bạn.

  • Các triển khai đám mây truyền thống: EfficientDet phổ biến cho việc xử lý hàng loạt ngoại tuyến trên nền tảng đám mây, nơi cần độ chính xác cao và không có các ràng buộc nghiêm ngặt về thời gian thực.
  • Nghiên cứu học thuật: YOLOv9 Đây vẫn là một lựa chọn thú vị đối với các nhà nghiên cứu đang nỗ lực vượt qua các giới hạn lý thuyết của mạng CNN và phân tích dòng chảy gradient qua các lớp mạng.
  • Điện toán biên và IoT: YOLO26 thống trị các ứng dụng thực tế. NMS - Khả năng xử lý dữ liệu tự do và hộp giới hạn định hướng (OBB) khiến nó trở thành lựa chọn vượt trội cho việc phân tích giao thông thành phố thông minh, giám sát hàng tồn kho bán lẻ và kiểm tra bằng máy bay không người lái, mang lại sự cân bằng tuyệt vời giữa độ chính xác cao và tốc độ suy luận nhanh.

Bình luận