EfficientDet vs.YOLOv9: アーキテクチャと性能の比較
コンピュータビジョンの急速に進化する環境において、適切な物体検出アーキテクチャの選択は、トレーニングコストからデプロイメントのレイテンシに至るまであらゆる要素に影響を与える重要な決定である。本技術分析では、効率的なスケーリングにGoogle 先駆的アーキテクチャであるEfficientDetとYOLOv9を包括的にYOLO する。
概要
EfficientDetはモデルスケーリングと特徴融合において画期的な概念を導入したものの、現在ではレガシーアーキテクチャと見なされている。複雑なBiFPN層への依存により、YOLO の合理化された設計と比較して、現代のハードウェア上では推論速度が低下する傾向がある。
YOLOv9 は大幅な飛躍を遂げ、高い精度と圧倒的に優れた推論速度を実現しています。さらに、Ultralytics の一部として、YOLOv9 統一されたAPI、簡素化されたデプロイ、そして強力なコミュニティサポートのYOLOv9 、本番環境における推奨選択肢となっています。
EfficientDet:スケーラブルで効率的な物体検出
EfficientDetは、物体検出器を効率的にスケーリングする問題を解決するために設計されました。従来のモデルはバックボーンを単純に大きくすることでスケーリングすることが多く、解像度、深さ、幅のバランスを無視していました。
主要なアーキテクチャ機能
- 複合スケーリング:EfficientDetは、全てのバックボーン、特徴ネットワーク、およびボックス/クラス予測ネットワークに対して、解像度、深度、幅を均一にスケーリングする複合スケーリング手法を提案する。
- 双方向特徴ピラミッドネットワーク(BiFPN):多階層の特徴融合を容易にする重要な革新技術。従来のFPNとは異なり、BiFPNはボトムアップ経路を追加し、単一入力のみのノードを除去。学習可能な重みを取り入れることで、異なる入力特徴の重要性を理解する。
- EfficientNetバックボーン:パラメータ効率に最適化されたEfficientNetをバックボーンとして利用する。
著者:Mingxing Tan, Ruoming Pang, Quoc V. Le
組織:Google
日付:2019-11-20
リンク:Arxiv|GitHub
YOLOv9: プログラマブル勾配情報
YOLOv9 深層学習における根本的な問題である情報ボトルネックに対処します。データが深層ニューラルネットワークの各層を通過する過程で、情報は必然的に失われます。YOLOv9 、プログラマブル勾配情報(PGI) とGELANと呼ばれる新たなアーキテクチャを通じて、この問題をYOLOv9 。
主要なアーキテクチャ機能
- GELAN(汎用効率的層集約ネットワーク):このアーキテクチャはCSPNetとELANの優れた点を組み合わせたものである。勾配降下経路を最適化し、モデルが軽量でありながら情報量の豊富な特徴を学習することを保証する。
- PGI(プログラマブル勾配情報):PGIは学習プロセスを導く補助的な監視分岐を提供し、主分岐が正確な検出に必要な重要な情報を保持することを保証します。これは複雑な環境における困難なターゲットの検出に特に有用です。
- 簡潔性:こうした内部的な複雑性にもかかわらず、推論構造は合理化されたままであり、EfficientDetで使用されるBiFPNに伴う重い計算コストを回避している。
著者:王千耀、廖宏源
所属機関:台湾中央研究院 情報科学研究所
日付:2024-02-21
リンク:Arxiv|GitHub
技術的パフォーマンス比較
これらのモデルを比較すると、パラメータ効率と実際の実行時レイテンシのトレードオフが明らかになる。EfficientDetはパラメータ効率に優れる一方、その複雑なグラフ構造(BiFPN)は、YOLOv9で使用される標準的な畳み込みに比べてGPU への適応性が低い。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
パフォーマンス分析
YOLOv9 速度と精度のバランスにおいてYOLOv9 EfficientDetを上回ります。例えば、YOLO v9 c はEfficientDet-d6(52.6%)と同等のmAP 53.0%)を達成しながら、T4GPU 12倍以上の高速処理を実現しますGPU 7.16ms 対 89.29ms)。 この特性により、YOLOv9 リアルタイムアプリケーションにおいて優れた選択肢となります。
トレーニングとエコシステム体験
これらのアーキテクチャ間の主な差別化要因は、Ultralyticsが提供する使いやすさとエコシステムサポートである。
効率的な課題
EfficientDetのトレーニングには通常、TensorFlow Detection APIやレガシーリポジトリの操作が必要です。これらは依存関係の競合により設定が困難な場合があり、自動混合精度トレーニングや簡単なクラウドロギング統合といった最新機能のサポートが不足していることが多々あります。
Ultralyticsの利点
Ultralytics YOLOv9 を使用すると、シームレスな体験が得られます。このエコシステムはデータ拡張、ハイパーパラメータ進化、エクスポートを自動的に処理します。
- 使いやすさ:わずか数行のコードでトレーニングを開始できます。
- メモリ効率: Ultralytics トレーニング中のVRAM使用量を削減するよう最適化されており、複雑なマルチブランチネットワークと比較して、コンシューマー向けGPU上でより大きなバッチサイズを実現します。
- 汎用性:検出機能に加え、Ultralytics はインスタンスセグメンテーションと姿勢推定をサポートします。これらは標準的なEfficientDet実装ではネイティブに利用できない機能です。
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
現実世界のアプリケーション
モデルの選択は、様々なアプリケーションの実現可能性に大きく影響する。
EfficientDetの理想的なユースケース
- 学術研究:特徴融合技術や複合スケーリング理論の研究に有用である。
- 低電力/低速シナリオ:レガシーハードウェアがEfficientNetバックボーン用にハードコードされている非常に特殊なエッジケース(例:特定の旧型Coral TPU)では、EfficientDet-Liteのバリエーションが依然として有用となる可能性がある。
YOLOv9の理想的な使用例
- 自律走行: 自動運転車は安全性を確保するため、ミリ秒単位で入力を処理する必要があるため、高い推論速度が極めて重要である。
- 小売分析: 在庫管理などの用途において、YOLOv9 類似製品を区別するのに必要な精度YOLOv9 、決済システムの遅延を引き起こしません。
- 医療分野: 医療画像解析において、PGIアーキテクチャはX線やMRIスキャンにおける微小な異常を検出するために必要な微細な詳細情報を保持するのに役立ちます。
未来:YOLO26へのアップグレード
YOLOv9 強力なツールYOLOv9 、Ultralytics 視覚AIの限界を押しUltralytics 。最先端を求める開発者にとって、YOLO26はEfficientDetとYOLOv9の両方に対して大幅な進歩をもたらします。
YOLO26はエンドツーエンドNMSを導入し、非最大抑制(NMS)後処理を完全に不要にしました。これにより、デプロイメントパイプラインが簡素化され、推論速度が向上します。さらに、SGD 融合した新たなMuSGDオプティマイザーにより、YOLO26はより安定したトレーニングと高速な収束を実現します。
エッジデプロイメント向けに最適化されたYOLO26は、 CPU 最大43%高速化し、低電力デバイスとの互換性を高めるDFL除去機能を搭載しています。ロボティクスから高スループット動画解析まで、あらゆる分野においてYOLO26は新たな基準を確立します。
他の最先端アーキテクチャに関心のあるユーザーには、以下の調査も推奨します YOLO11 および RT-DETR の調査Ultralytics 。