YOLOv9 EfficientDetの比較:包括的な技術比較
適切な物体検出モデルの選択は、コンピュータビジョン開発において極めて重要な決定であり、アプリケーションの速度、精度、リソース効率に直接影響します。このガイドでは Ultralytics YOLOv9とEfficientDetの詳細な技術比較を行い、アーキテクチャの革新性、パフォーマンス指標、最新のデプロイメントシナリオへの適合性を分析します。
パフォーマンス分析
物体検出の進化は急速で、新しいアーキテクチャは以前のアーキテクチャを大幅に上回っている。以下の表は、YOLOv9とYOLOv9の主要なメトリクスを直接比較したもので、YOLOv9の進化を浮き彫りにしている。 YOLOv9の推論速度とパラメータ効率に関する進歩を強調しています。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
重要なポイント
- スピードの優位性: YOLOv9 モデルは、GPU ハードウェア上で圧倒的に優れた推論速度を示しています。例えば、YOLOv9c(53.0%mAP)は、同等の精度を持つEfficientDet-d6(52.6%mAP)よりも12倍以上高速です。
- パラメータ効率: YOLOv9 アーキテクチャは、より少ないパラメータでより高い精度を達成することを可能にしている。YOLOv9sはわずか7.1Mのパラメータで46.8%のmAP 達成しているのに対し、EfficientDetは同レベルの47.5%の精度を達成するために、より大きなD3バリアント(12.0Mのパラメータ)を必要とする。
- 最先端の精度:最大のモデルであるYOLOv9eは、55.6%のmAP高い水準を設定し、EfficientDet-d7の最も重いモデルを凌駕する一方で、レイテンシは数分の一に抑えられている。
YOLOv9:プログラム可能な勾配情報の新時代
2024年初頭に発表されたYOLOv9、YOLO シリーズの大きな飛躍を意味する。Chien-Yao WangとHong-Yuan Mark Liaoによって開発されたこのYOLOv9は、特徴伝送中の情報損失に関するディープラーニングの基本的な問題に取り組んでいる。
技術詳細:
- 著者: Chien-Yao Wang、Hong-Yuan Mark Liao
- 組織台湾中央研究院情報科学研究所
- Date: 2024-02-21
- Arxiv:YOLOv9: Programmable Gradient Informationを使用して学びたいものを学習
- GitHubWongKinYiu/yolov9
- ドキュメントUltralytics YOLOv9 ドキュメント
建築イノベーション
YOLOv9 、"情報のボトルネック "問題に対処するために2つのコアコンセプトを導入している:
- プログラム可能な勾配情報(PGI):ネットワークの重みを更新するための信頼性の高い勾配を生成する補助的な監視フレームワーク。
- 一般化された効率的なレイヤ集約ネットワーク(GELAN):CSPNetとELANの長所を組み合わせた新しい軽量アーキテクチャ。勾配経路計画を優先し、精度を犠牲にすることなく、より高いパラメータ効率と推論速度の高速化を可能にする。
ご存知でしたか?
GELANアーキテクチャはハードウェアにとらわれないように設計されており、ハイエンドGPUだけでなく、計算リソースが限られているエッジデバイスにも推論を最適化する。
強みと使用例
- パフォーマンス・バランス: YOLOv9 、速度と精度の間で卓越したトレードオフを提供し、自律走行やビデオ解析のようなリアルタイム推論アプリケーションに理想的です。
- Ultralytics エコシステム: Ultralytics 統合は、合理化されたPython APIと CLI提供し、トレーニング、検証、デプロイメントを簡素化します。
- トレーニング効率:効率的なアーキテクチャにより、YOLOv9 通常、トランスフォーマーベースの代替品と比較してトレーニング中に必要なメモリが少なく、コンシューマーグレードのGPUでカスタムトレーニングを容易に行うことができます。
コード例:YOLOv9 Ultralytics併用
Ultralytics パッケージを使えば、簡単に推論を実行したり、YOLOv9 訓練したりすることができる。
from ultralytics import YOLO
# Load a pre-trained YOLOv9c model
model = YOLO("yolov9c.pt")
# Run inference on an image
results = model.predict("path/to/image.jpg")
# Train the model on a custom dataset (e.g., COCO8)
model.train(data="coco8.yaml", epochs=100, imgsz=640)
EfficientDet:スケーラブルなアーキテクチャの先駆者
Google 2019年後半に発表した「EfficientDet」は、物体検出器をスケールアップする体系的な方法を導入した画期的なモデルだ。幅広いリソース制約の中で効率を最適化することに焦点を当てている。
技術詳細:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織Google リサーチ
- Date: 2019-11-20
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHubgoogle
建築ハイライト
EfficientDetはEfficientNetのバックボーンの上に構築され、いくつかの重要な機能を導入している:
- 双方向特徴ピラミッドネットワーク(BiFPN):従来のFPNとは異なり、BiFPNでは、異なる入力特徴に学習可能な重みを導入することで、マルチスケール特徴の融合が容易に行える。
- 複合スケーリング:この方法は、バックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深さ、幅を一様にスケーリングし、さまざまなリソース予算に合わせたモデルファミリー(D0~D7)を可能にする。
長所と短所
- スケーラビリティ:D0-D7ファミリーの構造により、ユーザーは特定のFLOPs予算に合ったモデルを選択できます。
- 歴史的意義2020年における効率性の基準を設定し、その後のニューラル・アーキテクチャ探索の研究に大きな影響を与えた。
- レガシー・パフォーマンス:EfficientDetは当時としては効率的でしたが,現在ではGPU上のレイテンシという点で,YOLOv9 ような最新の検出器に遅れをとっています.その深さ方向に分離可能な畳み込みの多用は、FLOP効率は高いものの、YOLO アーキテクチャで使用される最適化された密な畳み込みに比べて、NVIDIA T4のようなハードウェア上での推論が遅くなることがよくあります。
詳細な比較分析
YOLOv9 EfficientDetのどちらかを選択する場合、生のmAP 以外にもいくつかの要素が絡んでくる。ここでは、実用的な開発環境における両者の比較について説明する。
スピードとレイテンシー
最も明確な違いは推論速度にある。YOLOv9 、GPU上での大規模な並列化に最適化されたGELANアーキテクチャを利用している。対照的に、EfficientDetは複雑な特徴融合(BiFPN)と深さ方向に分離可能な畳み込みに依存しているため、アクセラレータ上でメモリアクセスのボトルネックが発生する可能性があります。性能表に見られるように、YOLOv9 モデルは、一貫して TensorRTでは、同程度の精度のEfficientDetモデルよりも常に2倍から10倍高速です。
エコシステムと使いやすさ
Ultralytics エコシステムは、YOLOv9大きなアドバンテージとなる。EfficientDetがTensorFlow 環境としばしば複雑なセットアップスクリプトを必要とするのに対し、YOLOv9 ユーザーフレンドリーなパッケージに統合され、サポートしている:
- 一列設置:
pip install ultralytics - 幅広い輸出支援: へのシームレスなエクスポート ONNX、TensorRT、CoreML、OpenVINO などを介して
model.export()関数。 - アクティブなメンテナンス: 頻繁なアップデート、コミュニティサポート、およびオブジェクト追跡やデプロイメントなどのタスクに関する広範なガイド。
展開の柔軟性
Ultralytics トレーニングされたYOLOv9 モデルは、TFLite EdgeTPUフォーマットを使用して、エッジデバイスに簡単にデプロイできます。詳しくはTFLite インテグレーションガイドをご覧ください。
トレーニングの効率と記憶力
最新のコンピュータビジョンモデルのトレーニングは、リソースを大量に消費します。Ultralytics YOLO モデルは、GPU メモリを効率的に使用することで有名です。これにより、開発者は、古いアーキテクチャや重いトランスフォーマーベースのモデルと比較して、民生用ハードウェアでより大きなバッチサイズを訓練することができます。さらに、Ultralytics 、すぐに利用可能な事前学習済みの重みを提供し、ゼロからEfficientDetを学習するよりもはるかに速く収束する転移学習を可能にします。
汎用性
EfficientDetは厳密にはオブジェクト検出器ですが、YOLOv9 (およびより広範なUltralytics YOLO ファミリー)の背後にあるアーキテクチャ原理は、複数のタスクに拡張されます。Ultralytics フレームワークは以下をサポートする:
この汎用性により、開発者は多様なコンピュータ・ビジョンの課題に単一の統一されたAPIを使用することができる。
結論
大半の新規プロジェクトでは、YOLOv9 優れた選択肢となる。YOLOv9は、最先端の精度と大幅に速い推論速度を提供し、リアルタイムアプリケーションに適しています。Ultralytics エコシステムに統合されているため、データ準備からモデル展開までスムーズな開発体験が保証されます。
EfficientDetは、複合スケーリングとフィーチャー・フュージョンを理解するための貴重なリファレンスであることに変わりはないが、一般的に、最新のハードウェアにおけるワットあたりのパフォーマンスとレイテンシの指標では不十分である。
最新のコンピュータ・ビジョン技術をお探しの開発者の方は、こちらもご覧ください。 YOLO11をご検討ください。YOLO11は、これらの進歩の上に構築され、さらに優れた効率と性能を提供します。
その他のモデルを見る
さらなる比較にご興味があれば、以下の関連モデルをご検討ください:
- YOLO11 vs. YOLOv9: 最新世代がYOLOv9からどのように改善されたかをご覧ください。
- RT-DETR: リアルタイムシナリオ向けに高精度を提供するTransformerベースのdetectorです。
- YOLOv8: detect、segment、姿勢推定をサポートする汎用性の高いモデルファミリー。