YOLOv9 vs YOLO11: 技術比較
リアルタイム物体検出の分野は常に進化しており、新しいモデルが可能性の限界を押し広げています。このページでは、2つの強力な候補、つまりアーキテクチャの革新で知られるYOLOv9と、Ultralyticsの最新の最先端モデルであるUltralytics YOLO11の間の詳細な技術比較を提供します。アーキテクチャ、パフォーマンス指標、理想的なユースケースを分析して、コンピュータビジョンプロジェクトに最適なモデルを選択できるようにします。
YOLOv9:斬新なアーキテクチャによる精度向上
YOLOv9は、オブジェクト検出における重要な進歩として導入され、主に深層ニューラルネットワークにおける情報損失の問題を解決することに重点を置いています。その斬新なアーキテクチャコンポーネントは、モデル全体でより多くのデータを保持することにより、より高い精度を達成することを目指しています。
技術詳細:
- 著者: Chien-Yao Wang、Hong-Yuan Mark Liao
- 組織: 台湾 Academia Sinica 情報科学研究所
- Date: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Docs: https://docs.ultralytics.com/models/yolov9/
アーキテクチャと主な機能
YOLOv9の中核となるイノベーションは、Programmable Gradient Information (PGI)とGeneralized Efficient Layer Aggregation Network (GELAN)です。PGIは、非常に深いネットワークでパフォーマンスを低下させる可能性のある情報のボトルネックの問題を軽減し、損失関数に完全な入力情報を提供するように設計されています。GELANは、パラメータの利用率と計算効率を最適化する、軽量で効率的なネットワークアーキテクチャです。これらの機能により、YOLOv9はCOCOのようなデータセットで高い精度ベンチマークを設定できます。
長所
- 高精度: COCOデータセットで最高水準の結果を達成し、最大のバリアントであるYOLOv9-Eは高いmAPに達しています。
- 情報保持: PGIは、情報のボトルネックの問題に効果的に対処し、深く複雑なモデルをトレーニングするために不可欠です。
- 効率的な設計: GELANアーキテクチャは、高い精度対パラメータ比を提供します。
弱点
- タスクの汎用性: 元のYOLOv9の研究は主に物体検出に焦点を当てています。Ultralyticsモデルで標準となっているインスタンスセグメンテーション、姿勢推定、および分類のような他のタスクに対する組み込みの統合サポートがありません。
- エコシステムとユーザビリティ: 別の研究グループのモデルであるため、そのエコシステムは成熟していません。本番環境のワークフローへの統合はより複雑になる可能性があり、Ultralyticsが提供する合理化されたユーザーエクスペリエンス、広範なドキュメント、および活発なコミュニティサポートがありません。
- 学習リソース: ドキュメントに記載されているように、YOLOv9の学習は、Ultralyticsのモデルのような高度に最適化されたモデルと比較して、より多くのリソースを消費し、時間がかかる場合があります。
Ultralytics YOLO11:パフォーマンスとユーザビリティの頂点
Ultralytics YOLO11は、Ultralyticsの最新のフラッグシップモデルであり、速度、精度、汎用性の優れたバランスを提供するように設計されています。YOLOv8などの前身の成功に基づいて構築されたYOLO11は、幅広い現実世界のアプリケーション向けに設計されており、さまざまなハードウェアプラットフォームでの使いやすさと展開に最適化されています。
技術詳細:
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は、以前のUltralyticsモデルの実証済みのアーキテクチャを改良し、高度な特徴抽出と合理化されたネットワーク設計を組み込んでいます。これにより、より少ないパラメータと計算要件で、より高い精度を実現します。YOLO11の主な利点は、その性能だけでなく、包括的なUltralyticsエコシステムへの統合にもあります。これにより、いくつかの重要な利点が得られます。
- 使いやすさ: シンプルで直感的なPython APIとCLIにより、初心者と専門家の両方がモデルのトレーニング、検証、およびデプロイを簡単に行うことができます。
- 充実したエコシステム: YOLO11は、活発な開発、頻繁なアップデート、および強力なコミュニティサポートによって支えられています。ノーコードトレーニングとMLOpsのためのUltralytics HUBのようなツールとシームレスに統合されています。
- 多様性: YOLO11は、単一の統合フレームワーク内で物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および傾斜バウンディングボックス(OBB)をサポートするマルチタスクモデルです。
- Training and Memory Efficiency: YOLO11は効率的なトレーニングのために高度に最適化されており、事前にトレーニングされた重みがすぐに利用できます。特に大規模なトランスフォーマーベースのモデルと比較して、トレーニングと推論に必要なメモリが少なくなります。
長所
- 優れたパフォーマンスバランス: 速度と精度の間で優れたトレードオフを提供し、リアルタイム推論に最適です。
- マルチタスク対応: 単一のモデルで多岐にわたるコンピュータビジョンタスクを処理できるため、その有用性が向上し、開発の複雑さが軽減されます。
- ハードウェアの最適化: エッジデバイスからクラウドサーバーまで、多様なハードウェアへのデプロイメントに最適化されており、CPUとGPUの両方で優れたパフォーマンスを発揮します。
- 堅牢かつ成熟: 長年の研究開発の恩恵を受けており、本番環境での安定性と信頼性を保証します。
弱点
- ワンステージ検出器として、一部の特殊なツーステージ検出器と比較して、極端に小さいオブジェクトや混雑したオブジェクトに対して課題が生じる可能性があります。
- 最大のYOLO11モデルは、効率的でありながら、最高の性能を発揮するには依然としてかなりの計算能力が必要です。
性能の直接対決:YOLOv9 vs. YOLO11
パフォーマンスを比較すると、どちらのモデルも非常に有能であることは明らかです。YOLOv9-EはCOCOデータセットで最高のmAPを達成していますが、これはより高い遅延を伴います。対照的に、Ultralytics YOLO11ファミリーは、よりバランスの取れた実用的なオプションを提供します。たとえば、YOLO11lはYOLOv9cと同等のmAPを達成しますが、GPU推論速度がより高速です。さらに、YOLO11nやYOLO11sなどの小型モデルは、優れたリアルタイムパフォーマンスを提供し、リソースが限られたアプリケーションにはるかに適しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
理想的なユースケース
YOLOv9
YOLOv9は、研究に重点を置いたプロジェクトや、絶対的な最大検出精度を達成することが主な目標であり、使いやすさ、マルチタスク機能、トレーニング時間などの要素が二次的なアプリケーションに最適です。
Ultralytics YOLO11
YOLO11は、迅速なプロトタイピングから大規模な本番環境へのデプロイまで、現実世界のアプリケーションの大部分にとって理想的な選択肢です。その性能、汎用性、使いやすさの組み合わせにより、優れたオールラウンドソリューションとなっています。
- スマートシティ: リアルタイムの交通管理と公共安全監視。
- 産業オートメーション: 生産ラインでの品質管理と欠陥検出。
- 小売分析: 在庫管理と顧客行動分析。
- 農業: 作物の健康状態の監視と自動収穫。
結論: YOLO11が推奨される理由
YOLOv9は称賛に値するモデルであり、重要な学術的概念を紹介していますが、Ultralytics YOLO11は、開発者や研究者にとって、より実用的で、強力で、汎用性の高い選択肢として際立っています。
YOLOv9は純粋な精度に重点を置いている点が印象的ですが、YOLO11は、はるかに優れたユーザーエクスペリエンス、マルチタスク機能、および堅牢で十分にサポートされたエコシステムを提供しながら、非常に競争力のあるパフォーマンスを提供します。コンセプトから本番環境に効率的に移行する必要があるプロジェクトの場合、YOLO11の合理化されたワークフロー、豊富なドキュメント、および活発なコミュニティは、比類のない利点を提供します。速度と精度のバランスの取れたアプローチにより、軽量エッジデバイスから強力なクラウドサーバーまで、あらゆるアプリケーションに最適なモデルを見つけることができます。
これらの理由から、Ultralytics YOLO11は、次世代のAI搭載コンピュータビジョンソリューションを構築するための決定的な選択肢です。
その他のモデルを見る
YOLO11とYOLOv9がエコシステム内の他のモデルとどのように比較されるかに関心がある場合は、必ず他の比較ページを確認してください。YOLOv10やRT-DETRのようなモデルは、特定のニーズに関連する可能性のあるパフォーマンスとアーキテクチャにおいて異なるトレードオフを提供します。完全な概要については、メインのモデル比較ページをご覧ください。