YOLOv9 YOLO11:アーキテクチャ革新と実用化準備の架け橋
リアルタイム物体検出の技術は急速に進化しており、各世代が精度・速度・効率の限界を押し広げています。本比較では YOLOv9(勾配情報の理論的ブレークスルーで知られる)と YOLO11を比較検討する。Ultralytics提供する実運用レベルの強力なソリューションであり、シームレスな導入と汎用性を追求して設計されている。
両モデルとも伝説的なYOLO 由来するものの、コンピュータビジョン分野においてそれぞれ異なる目的を果たします。本ガイドでは、開発者が特定のニーズに最適なツールを選択できるよう、両モデルのアーキテクチャ、性能指標、および理想的なユースケースを分析します。
エグゼクティブサマリー:イノベーション対エコシステム
YOLOv9 深層ネットワークにおける情報損失という根本的な課題に対処するため、プログラマブル勾配情報(PGI)などの革新的なアーキテクチャ概念に焦点を当てています。学術研究や、複雑なデータセットにおいて最大限の特徴保持が求められるシナリオにおいて、優れた選択肢となります。
YOLO11一方、YOLO11は現実世界向けに設計されています。Ultralytics 構成要素として、比類のない使いやすさ、エッジハードウェア上での優れた推論速度、そして単純な検出を超えた多様なタスクへのネイティブサポートを提供します。商用アプリケーションを開発する開発者にとって、YOLO11 トレーニングからデプロイメントまでのより効率的な道筋YOLO11 。
技術仕様と性能
以下の表は、COCO 各モデルの性能差を比較したものです。YOLOv9 理論上高い性能YOLOv9 、YOLO11 速度とパラメータ効率において顕著な優位YOLO11 、特にエッジAIで重要な小型モデルバリエーションにおいてその差が顕著です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv9: プログラマブル勾配の深層解析
YOLOv9 、深層ニューラルネットワークにおける「情報ボトルネック」問題を解決するために導入YOLOv9 。ネットワークが深くなるにつれ、入力データは予測層に到達する前に重要な情報を失うことが多い。
- 著者: Chien-Yao Wang、Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024年2月21日
- Arxiv:YOLOv9: Programmable Gradient Informationを使用して学びたいものを学習
主要なアーキテクチャ機能
- プログラマブル勾配情報(PGI):PGIは補助的な教師付き学習ブランチを介して信頼性の高い勾配を生成し、非常に深いアーキテクチャにおいても主ブランチが頑健な特徴量を学習することを保証する。これは特に勾配降下法のダイナミクス研究において有用である。
- GELAN(汎用効率的層集約ネットワーク):CSPNetとELANの長所を組み合わせ、パラメータ利用率を最適化する新規アーキテクチャ。YOLOv9 、従来のUltralytics と比較して比較的軽量な構造でありながら高精度を達成YOLOv9
YOLO11:生産性と汎用性を追求した設計
YOLO11 Ultralytics数百万のAI実践者を支援してきた経験のYOLO11 。実用性を最優先し、モデルがベンチマークで正確であるだけでなく、NVIDIA GPUからRaspberry Piデバイスに至る多様なハードウェア上で、容易にトレーニング、エクスポート、実行できることを保証します。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024年9月27日
- リポジトリ:Ultralytics
Ultralyticsの利点
YOLO11 、より広範なUltralytics との統合を通じてYOLO11 。これには以下が含まれます:
- メモリ効率: YOLO11 、トランスフォーマーを多用するアーキテクチャや非最適化されたリポジトリと比較して、トレーニングCUDA 大幅に削減するようYOLO11 。これによりトレーニングへのアクセスが民主化され、RTX 3060や4070といったコンシューマー向けGPUでも最先端モデルの微調整が可能になります。
- 広範なタスクサポート: YOLOv9ベースリポジトリで主に検出に焦点を当てているのとは異なり、YOLO11 以下をサポートします:
- エクスポート機能:ワンクリックで ONNX、TensorRT、CoreML、TFLite などの形式へのワンクリックエクスポートにより、YOLO11 モバイルおよび組み込みデプロイメントの最適なYOLO11 TFLite 。
Ultralyticsによる効率化されたトレーニング
YOLO11 トレーニングには最小限の定型コードYOLO11 。Python を使用すれば、カスタムデータセットでのトレーニングを数秒で開始できます:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
実際のユースケース
これらの2つのモデルから選択するには、導入上の制約とプロジェクトの目標が大きく影響します。
YOLOv9の理想的なシナリオ
- 学術的ベンチマーキング:ネットワークトポロジーと情報の流れを研究する研究者にとって、YOLOv9 におけるPGIの概念はニューラルアーキテクチャ探索においてYOLOv9 ものである。
- 高忠実度特徴抽出:高解像度医療画像における微細な特徴の捕捉が重要なタスクにおいて、GELANバックボーンは強力な表現力を提供する。
- 標準GPU 展開:レイテンシよりもmAP最後の0.1%を絞り出すことが重要でない環境では、より大規模なYOLOv9eモデルが有力な選択肢となる。
YOLO11の理想的なシナリオ
- エッジAIとIoT:優れたCPU 速度(例:T4GPU上でのYOLO11nが1.5ms、YOLOv9tが2.3ms、CPUではさらに差が開く)により、YOLO11 ドローンナビゲーションやスマートカメラにYOLO11
- 商用SaaS: Ultralytics 安定性と積極的なメンテナンスにより、商用アプリケーションは最新のPyTorch に対応した安全な状態を維持します。
- マルチタスクパイプライン: スポーツ分析など、同時検出と追跡を必要とするアプリケーションは、基盤となるフレームワークを変更せずにタスクを切り替えられるYOLO11能力から恩恵を受ける。
- リソース制約下でのトレーニング:ハードウェアが限られているスタートアップや学生でも、より重いアーキテクチャに伴う高額なクラウドコストを負担することなく、効果的なYOLO11 トレーニングできます。
未来:YOLO26を見据えて
YOLO11 優れたYOLO11 、コンピュータビジョン分野は常に進化を続けています。Ultralytics 最近、2026年以降に向けた効率性を再定義するモデル「YOLO26」 Ultralytics 。
YOLO26は両アーキテクチャから得られた知見を基盤としつつ、 NMSネイティブエンドツーエンド設計を導入する。この設計は YOLOv10で初めて導入されたネイティブなエンドツーエンドのNMSフリー設計を基盤としています。これにより、ノンマキシマム抑制(NMS)の後処理が不要となり、デプロイメントパイプラインが大幅に簡素化されます。
なぜYOLO26を検討すべきか?
- 速度:前世代と比較して最大43%高速CPU を実現。ディストリビューションフォーカルロス(DFL)の削除と最適化されたグラフ実行により達成。
- 安定性: 新しいMuSGDオプティマイザーを採用。SGD (LLMトレーニングに着想を得た)のハイブリッドであり、大規模バッチトレーニングの安定性をビジョンタスクに提供します。
- 精度: 衛星画像解析における共通の課題である微小物体認識を劇的に改善するProgLoss + STAL機能を搭載。
新規プロジェクトを開始する開発者には、将来を見据えたアプリケーション構築のため、YOLO11 と並行してYOLO26の評価を強く推奨YOLO11 。
結論
YOLOv9 YOLO11 、いずれも物体検出の歴史における重要なマイルストーンYOLO11 。YOLOv9 深層ネットワークにおける情報保持に関して重要な理論的改善YOLOv9 。しかし、 YOLO11 (およびより新しいYOLO26)は、統合されたUltralytics 、優れた速度対精度比、そして導入の容易さにより、多くのユーザーにとってより実用的なパッケージを提供しています。
Ultralytics を活用することで、開発者は両モデルを簡単に試行し、カスタムデータセットでのパフォーマンスを比較し、勝者モデルをわずか数クリックで本番環境にデプロイできます。
参考資料
- モデル比較:これらのモデルが YOLOv8 および RT-DETRと比較した場合の性能を比較します。
- データ管理: Ultralytics 、これらのモデル向けにデータを効率的にアノテーションする方法について学びます。
- デプロイ:モデルを TensorRT へのエクスポートガイドを参照し、GPU 最大化してください。