YOLOv9 EfficientDet: アーキテクチャと性能の技術的比較
進化を続けるコンピュータビジョンの分野において、適切な物体検出アーキテクチャの選択は、システムのレイテンシ、精度、導入の複雑性に影響を与える重要な決定事項です。本ガイドでは、 YOLOv9(2024年初頭に発表された最先端モデル)と、効率的なスケーリングでGoogle 影響力のあるアーキテクチャであるEfficientDetを Google 。両者の構造的差異、性能指標、実世界アプリケーションへの適性を分析します。
パフォーマンスメトリクス分析
以下の表は、様々なモデルスケールの性能を比較したものです。 YOLOv9 一般的に、旧式のEfficientDetアーキテクチャと比較して、最新のハードウェア上で優れた精度対パラメータ比率と高速な推論速度を示します。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
モデルの概要
YOLOv9
著者:王建耀, 廖宏源
所属機関:台湾中央研究院 情報科学研究所
日付:2024-02-21
リンク:Arxiv|GitHub|Docs
YOLOv9 、深層ネットワークにおける「情報ボトルネック」問題に対処するため、重要なアーキテクチャ革新YOLOv9 。中核となる貢献はプログラマブル勾配情報(PGI)であり、補助的な監督ブランチを通じて信頼性の高い勾配を生成し、深層が重要な特徴情報を保持することを保証する。さらに、パラメータ効率を最大化する軽量アーキテクチャである汎用効率的層集約ネットワーク(GELAN)を採用している。
EfficientDet
著者:Mingxing Tan, Ruoming Pang, Quoc V. Le
所属:Google
日付:2019-11-20
リンク:Arxiv|GitHub
EfficientDetはAutoMLにおける先駆的な研究であり、双方向特徴ピラミッドネットワーク(BiFPN)を導入した。従来のFPNとは異なり、BiFPNは学習可能な重みを導入することで、容易なマルチスケール特徴融合を実現する。本モデルはまた、解像度・深度・幅を均一にスケーリングする手法である複合スケーリングを採用しており、幅広いリソース制約(D0からD7まで)において優れた性能を達成できる。
アーキテクチャの詳細
特徴融合:GELAN対BiFPN
これらのモデルの主な差別化要因は、特徴量を集約する方法にあります。EfficientDetは複雑なBiFPN構造に依存しており、理論的にはFLOPs効率に優れる一方、メモリ集約的であり、TensorRTのような特定のハードウェアアクセラレータ向けに最適化するのが困難です。 TensorRTなどの特定のハードウェアアクセラレータ向けに最適化するのが困難になる可能性があります。
対照的に、YOLOvYOLOv9のGELANアーキテクチャはCSPNetとELANの優れた点を融合している。複雑な融合接続よりも勾配経路計画を優先させることで、パラメータ数が少ないだけでなく「ハードウェアに優しい」ネットワークを実現し、学習時とGPU につながっている。
勾配流と情報損失
EfficientDetは、非常に深いEfficientNetバックボーンを通じた標準的なバックプロパゲーションに依存している。YOLOv9 、深層ネットワークが入力データの詳細を「忘れる」YOLOv9 。PGIを通じて、YOLOv9 学習プロセスを導く補助的な可逆分岐YOLOv9 、推論時にそれらの補助分岐を維持する計算コストをかけずに、主分岐が頑健な意味的特徴を確実に捕捉することを保証する。
警告:PGIの利点
プログラマブル勾配情報(PGI)により、YOLOv9 より少ないデータで優れた収束YOLOv9 、アノテーション付き例が不足しがちなカスタムデータセットにおいて特に効果を発揮する。
エコシステムと使いやすさ
開発者にとって最も根本的な違いの一つは、これらのモデルを取り巻くエコシステムである。
EfficientDetは主にTensorFlow に根ざしています。強力ではありますが、利用するには複雑な依存関係チェーンや、頻繁な更新が不足している可能性のある古いリポジトリを扱う必要がある場合が多くあります。
YOLOv9は、Ultralytics 統合され、効率的な体験を提供します。開発者はPython 介してモデルにアクセスでき、数分でトレーニング、検証、デプロイが可能です。Ultralytics データ拡張、ロギング(例:MLflowやCometへの出力)、モデル管理を処理します。 Cometなどへの出力)を自動的に処理します。
from ultralytics import YOLO
# Load a pretrained YOLOv9c model
model = YOLO("yolov9c.pt")
# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for deployment
model.export(format="onnx")
このスニペットは、Ultralytics に内在する使いやすさを実証しています。このフレームワークはまた、自動混合精度(AMP)GPU 標準でサポートし、トレーニング効率を確保します。
汎用性と展開
タスクサポート
EfficientDetは基本的に物体検出向けに設計されています。セグメンテーションや姿勢推定などのタスクに適応させるには、大幅なアーキテクチャの変更とカスタムコードが必要です。
Ultralytics (YOLOv9 その後継モデルを含む)Ultralytics 、以下をネイティブにサポートする汎用性の高いコードベースで構築されています:
エッジ互換性とメモリ
EfficientDet-D0は小型である一方、D7へのスケールアップでは解像度拡張(最大1536x1536)により膨大なメモリコストが発生する。YOLOv9 ほとんどのベンチマークで標準的な640x640入力をYOLOv9 、優れた精度を達成している。この低い入力解像度はVRAMのメモリ要件を大幅に削減し、コンシューマーGPU上でより大きなバッチサイズと高速な実験を可能にする。
さらに、Ultralytics ワンクリックで以下の形式へのエクスポートをサポートしています TFLite などの形式へのワンクリックエクスポートをサポートしています。 OpenVINO (Intel 、CoreML )などへのワンクリックエクスポートをサポートし、幅広いエッジ互換性を確保しています。
実際のユースケース
モデルの選択は、特定のアプリケーションの成功を左右することが多い:
- 小売分析:棚上の商品数をカウントするため、 YOLOv9 は、PGIが微細なディテールを保持する能力に支えられ、小さな物体に対する高い精度(mAP)により優れている。
- 自律型ドローン:組み込みハードウェア(例:Jetson Orin)でのリアルタイム推論が必要なシナリオにおいて、YOLOv9、EfficientDetの複雑なBiFPN層がしばしば達成困難な必要なFPSを提供する。
- レガシーシステム:特定のモデルアーキテクチャがハードウェアパイプラインにハードコードされている研究比較やレガシーなGoogle TPU においては、EfficientDetは依然として有用である。
未来:YOLO26
YOLOv9 卓越した性能YOLOv9 、AI分野は急速に進化しています。Ultralytics YOLO26で革新をUltralytics 、新規プロジェクトにはYOLO26を推奨します。
YOLO26は YOLO の強みを継承しつつ、ネイティブなNMSを導入し、非最大抑制(NMS)後処理に伴う遅延と複雑性を排除しました。SGD ハイブリッドであるMuSGDオプティマイザーを採用し、より簡素なエクスポートを実現するため分布焦点損失(DFL)を削除しています。これらの変更により、 CPU 最大43%向上し、トレーニングの安定性も改善されました。
さらに、YOLO26はProgLoss + STAL(ソフトターゲットアンカー損失)を組み込み、ロボット工学や航空画像において重要な小型物体認識において顕著な改善を実現しています。速度、精度、導入の容易さの究極のバランスを求める開発者にとって、YOLO26は新たな標準となります。
結論
両アーキテクチャはコンピュータビジョン史において確固たる地位を築いた。EfficientDetは複合スケーリングの威力を実証し、一方 YOLOv9 はプログラマブル勾配が深層ネットワーク内で情報を回復する手法を実証した。しかし現代の実稼働環境においては、YOLOv9 新世代YOLOv9 Ultralytics 、保守性・学習速度・展開柔軟性の面で明確な優位性を提供する。
参照
- YOLOv10 EfficientDet: 最初のNMSYYOLOとの比較
- YOLO26 vsYOLOv9:最新世代のアップグレードを徹底検証
- Ultralytics : モデルをトレーニングしデプロイする最もシンプルな方法。