Link to this sectionYOLOv9 と YOLOv7 の比較#
リアルタイムの物体検出の進化は、計算効率と高精度の両立を追求する絶え間ない取り組みによって推進されてきました。この旅路における2つの画期的なアーキテクチャが YOLOv9 と YOLOv7 です。どちらも台湾の中央研究院情報科学研究所の研究者によって開発されました。YOLOv7 が革命的なトレーニング可能な「bag-of-freebies」を導入したのに対し、新しい YOLOv9 はディープラーニングにおける情報のボトルネックに真正面から取り組んでいます。
この包括的な技術比較では、両モデルのアーキテクチャ上の違い、パフォーマンスメトリクス、および最適なデプロイシナリオについて解説します。これにより、MLエンジニアや研究者が自身のコンピュータビジョンパイプラインに適したツールを選択できるよう支援します。
Link to this sectionパフォーマンスと指標の比較#
これらのモデルを比較する際、生のパフォーマンスと効率は重要な要素です。以下の表では、標準的な COCO データセットベンチマークにおける平均適合率(mAP)と計算要件を詳細に示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv9c は、YOLOv7x(53.1 mAP)とほぼ同等の精度(53.0 mAP)を達成しつつ、パラメーター数(25.3M 対 71.3M)と FLOPs が大幅に少ないことに注目してください。これは、最新のアーキテクチャにおけるパフォーマンスバランスの改善を示しています。
Link to this sectionYOLOv9: 情報ボトルネックの解決#
2024年初頭に発表された YOLOv9 は、ディープニューラルネットワークがレイヤー全体でデータを保持する方法を根本的に変えました。
- 著者: Chien-Yao Wang および Hong-Yuan Mark Liao
- 組織: 中央研究院 情報科学研究所
- 日付: 2024年2月21日
- リソース: Arxiv Paper | GitHub Repository
Link to this sectionアーキテクチャの革新#
YOLOv9 は、Generalized Efficient Layer Aggregation Network (GELAN) と Programmable Gradient Information (PGI) を導入しています。GELAN は CSPNet と ELAN の長所を組み合わせ、パラメーター効率と計算コストを最適化し、より少ないパラメーター数で高い精度を確保します。PGI は、ディープネットワークにおけるデータ損失を防ぐために設計された補助的な教師ありフレームワークであり、トレーニングプロセス中に重みを更新するための信頼性の高い勾配を生成します。
Link to this section強みと制限#
YOLOv9 の主な強みは、膨大な計算オーバーヘッドなしに微細な特徴を抽出できる点であり、医療画像解析のように高い特徴忠実度が求められるタスクに非常に適しています。しかし、トレーニング中の複雑な PGI 構造により、初心者にとっては、より統一されたフレームワークと比較してアーキテクチャのカスタム修正が難しくなる場合があります。
Link to this sectionYOLOv7: Bag-of-Freebies の先駆者#
2022年にリリースされた YOLOv7 は、コンシューマーハードウェアで何が可能かという新たなベンチマークを打ち立て、リアルタイム推論速度を劇的に向上させる構造的な革新を導入しました。
- 著者: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 組織: 中央研究院 情報科学研究所
- 日付: 2022年7月6日
- リソース: Arxiv Paper | GitHub Repository
Link to this sectionアーキテクチャの革新#
YOLOv7 の核心的な貢献は、Extended Efficient Layer Aggregation Network (E-ELAN) です。このアーキテクチャにより、モデルはより多様な特徴を継続的に学習できます。さらに、YOLOv7 は「trainable bag-of-freebies」(計画的な再パラメーター化畳み込みや動的なラベル割り当てなどの手法)を採用しています。これらの手法は、デプロイ時の推論コストを追加することなく、トレーニング中のモデルの精度を向上させます。
Link to this section強みと制限#
YOLOv7 はリアルタイムのエッジ処理向けに高度に最適化されており、レガシーシステムや古い CUDA 環境で現在も主流です。現在の主な制限は、新しいモデルと比較してパラメーターサイズが大きいことです。パフォーマンス表に示されているように、最高レベルの精度を達成するには重量級の YOLOv7x モデルが必要であり、同等の最新アーキテクチャよりも大幅に多くの GPU メモリを消費します。
Link to this sectionUltralytics の強み: 合理化されたデプロイ#
YOLOv9 と YOLOv7 のオリジナルの研究リポジトリは優れた学術的基盤を提供していますが、これらのモデルを本番環境にデプロイするのは複雑な場合があります。ultralytics パッケージを通じてこれらを統合することで、比類のない 使いやすさ (Ease of Use) を提供します。
統合された Ultralytics Platform を利用することで、開発者は直感的な Python API、アクティブなコミュニティサポート、そして堅牢な 実験追跡機能を備えた、適切にメンテナンスされたエコシステムの恩恵を受けることができます。
Link to this sectionYOLO26 で将来を見据える#
新しいコンピュータビジョンプロジェクトを開始する場合、YOLOv9 と YOLOv7 の両方よりも、新たにリリースされた YOLO26 を検討することを強くお勧めします。新しい最先端標準としてリリースされた YOLO26 は、画期的な進歩をもたらします:
- エンドツーエンドの NMS フリー設計: Non-Maximum Suppression(非最大値抑制)のポストプロセスを排除し、デプロイの複雑さとレイテンシを劇的に削減します。
- 最大 43% 高速な CPU 推論: エッジコンピューティング環境向けに最適化されており、専用の GPU がなくてもアプリケーションがスムーズに実行されます。
- MuSGD オプティマイザー: LLM トレーニングに触発されたハイブリッドオプティマイザーで、非常に安定した収束を実現し、トレーニング時間を短縮します。
- DFL の削除: Distribution Focal Loss を削除することでモデルのエクスポートを簡素化し、低電力のモバイルデバイスとの互換性を強化しました。
- ProgLoss + STAL: 小さな物体の検出性能を飛躍的に向上させ、航空写真や監視に最適な選択肢となりました。
エコシステム内の他の一般的な代替案には Ultralytics YOLOv8 や YOLO11 があり、どちらもインスタンスセグメンテーションや姿勢推定などのタスク全体で非常に高い汎用性を提供します。
Link to this section実装例#
これらのアーキテクチャのトレーニングとエクスポートは、統合 API を使用することで非常に簡単です。以下のコードは、Ultralytics ツールが持つ合理化された トレーニング効率 (Training Efficiency) を示しています。
from ultralytics import YOLO
# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt") # Swap with "yolo26n.pt" for faster edge performance
# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")コンシューマーグレードのハードウェアでトレーニングする場合、メモリ効率が不可欠です。YOLOv9 および YOLO26 の Ultralytics 実装は、VRAM スパイクを抑えるために高度に最適化されています。これは、トレーニング中に深刻なメモリ肥大化に悩まされることが多い Transformer ベースのモデル(RT-DETR など)とは対照的です。
Link to this section実環境での応用と理想的なユースケース#
これらのアーキテクチャを選択するかどうかは、多くの場合、本番環境の特定の制約によって決まります。
YOLOv9 を使用すべき場合: YOLOv9 は、微細な詳細の保持が必要な環境で優れています。その堅牢な特徴抽出機能は、棚に密集した商品をカウントする小売分析や、小さな葉の初期段階の作物病害を特定することが重要な農業用途に最適です。
YOLOv7 を使用すべき場合: YOLOv7 は、レガシーなデプロイパイプラインにとって強力な候補であり続けます。(Google Coral Edge TPU の特定の世代のような)古いハードウェアシステムに統合する場合、YOLOv7 の単純な CNN アーキテクチャは、新しいモデルの複雑な勾配ブランチよりもコンパイルしやすい可能性があります。
YOLO26 を使用すべき場合 (推奨): 自律型ドローンからスマートシティの交通管理まで、あらゆる現代的なデプロイにおいて、YOLO26 が優れた選択肢です。その NMS フリーのアーキテクチャは確定的な推論時間を保証するため、安全性重視のロボティクスに不可欠であり、その高精度は YOLOv9 と YOLOv7 の両方を全面的に凌駕しています。