YOLOv5 YOLOv9:詳細な技術比較
コンピュータビジョンとリアルタイム物体検出の分野では、ここ数年で目覚ましい進歩が見られた。実績のある実戦テスト済みモデルと新しい研究アーキテクチャのどちらを選ぶかは、機械学習エンジニアにとって共通の課題だ。本ガイドでは、YOLO の2つの非常に影響力のあるモデル、 YOLOv5 と YOLOv9について包括的な技術比較を行います。
制約のあるエッジデバイスへの展開、高精度の特徴抽出の研究、複雑な物体検出パイプラインの構築のいずれにおいても、これらのモデルのアーキテクチャ上の微妙な差異、性能指標、エコシステムの違いを理解することが極めて重要です。
モデルの概要
アーキテクチャの比較に入る前に、各モデルの起源と主な目的を理解しておくと役立つ。
Ultralytics YOLOv5
グレン・ジョチャーによって開発され、 Ultralytics によってリリースされたYOLOv5 、開発者がビジョンモデルと対話する方法にパラダイムシフトYOLOv5 。 PyTorch フレームワークを完全に採用したことで、YOLOv5 従来のDarknetベースモデルにおける複雑なコンパイル手順を、直感的でPythonユーザー体験へとYOLOv5 。
- Author: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:YOLOv5 リポジトリ
- ドキュメント:YOLOv5 概要
YOLOv5 、多様なハードウェア環境における使いやすさと安定した性能でYOLOv5 検出だけでなく、画像分類やインスタンスセグメンテーションもサポートしています。
YOLOv9
台湾・中央研究院情報科学研究所の王建耀(Chien-Yao Wang)と廖宏源(Hong-Yuan Mark Liao)によって発表YOLOv9 、深層ニューラルネットワークにおける情報ボトルネック問題を緩和するため、アーキテクチャ理論にYOLOv9 。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024-02-21
- Arxiv:2402.13616
- GitHub:YOLOv9 リポジトリ
- ドキュメント:YOLOv9 ドキュメント
YOLOv9 の中核は、2つの主要な理論的革新にYOLOv9 :プログラマブル勾配情報(PGI)と汎用効率的層集約ネットワーク(GELAN)である。これらの概念により、モデルは深層ネットワーク層を通じても重要な空間特徴を保持できる。
将来を見据えたデプロイメントを実現する
YOLOv5 YOLOv9 、新たにリリースされたYOLO26は速度と精度の究極のバランスを実現しています。エンドツーエンドNMS設計を採用し、CPU 最大43%高速化されたYOLO26は、現代のエッジコンピューティングや実稼働環境での導入に強く推奨されます。
建築的および技術的な差異
これらのビジョンモデルを駆動する内部の仕組みを理解することは、モデル展開戦略を最適化するために極めて重要である。
特徴抽出と情報保持
YOLOv5 クロスステージ部分ネットワーク(CSPNet)バックボーンYOLOv5 、バックプロパゲーション時の正確な勾配流れを維持しつつ、計算オーバーヘッドを効果的に低減します。この設計はGPU 向けに高度に最適化されており、重厚なトランスフォーマー系手法と比較して、学習時のメモリ要件を低く抑えます。
YOLOv9 、CSPNetの原理を拡張した汎用アーキテクチャ「GELAN」YOLOv9 。補助的な可逆分岐PGIと組み合わせることで、YOLOv9 深層が精密な目的関数に必要な意味的データを失わないことをYOLOv9 。これにより、特に小型物体において高い精度 YOLOv9 、複雑な補助分岐が、制約の厳しいエッジハードウェアへのエクスポートパイプラインを時に複雑化させる可能性がある。
メモリ要件とトレーニング効率
トレーニング効率に関しては、YOLOv5 非常にYOLOv5 。よく整備Ultralytics により、YOLOv5 CUDA 大幅に消費せず、研究者がコンシューマー向けGPUでバッチサイズを最大化できるようになります。一方、YOLOv9 優れたパラメータ効率(サイズに対する高い精度)YOLOv9 、最適化されたフレームワークを利用しない場合、トレーニングプロセスはより多くのリソースを消費する可能性があります。 幸いなことに、YOLOv9 Ultralytics YOLOv9 統合することで、YOLOv5効率化されたリソース管理に近づけることが可能となります。
パフォーマンスとメトリクス
これらのアーキテクチャを客観的に評価するため、COCOなどの標準データセットにおける性能を比較します。以下に、mAP 平均精度)、推論速度、パラメータ数などの指標の詳細な内訳を示します。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
表が示すように、YOLOv9 同等の性能レベルにおいてより高い基本精度YOLOv9 、その新しいアーキテクチャを反映しています。しかし、YOLOv5nは1.12msという驚異的に低いTensorRT を維持しており、高速な局所的なエッジコンピューティングアプリケーションにおける持続的な強みを強調しています。
トレーニング手法と使いやすさ
今日のコンピュータービジョン活用の真の利点は、ツールチェーンの入手容易性にあります。
Ultralyticsの利点
YOLOv9 モデルのオリジナル研究リポジトリYOLOv9 、複雑な依存関係マトリクスや定型スクリプトが伴うことがよくYOLOv9 。Ultralytics Python はこの複雑さを完全に抽象化します。Ultralytics では、同一の統一YOLOv9 YOLOv5 トレーニング、評価、エクスポートできます。
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for fast deployment
model_v5 = YOLO("yolov5s.pt")
# Or leverage a YOLOv9 model for high-fidelity accuracy
model_v9 = YOLO("yolov9c.pt")
# Train seamlessly on custom data with automatic MLflow logging
results = model_v9.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX
model_v9.export(format="onnx")
この単一APIアプローチは膨大な汎用性を提供し、検出だけでなく、選択したモデルに応じて姿勢推定や 方向付きバウンディングボックス(OBB)もサポートします。さらに、Comet Biasesなどのツールとの堅牢な統合を実現します。 Weights & Biases といったツールとの堅牢な連携が、トレーニングループに直接組み込まれています。
理想的な使用例と実世界の応用例
これらのアーキテクチャの選択は、主にハードウェアの制約とアプリケーション領域で要求される精度に依存します。
YOLOv5を選択すべき時
YOLOv5 、安定性、低メモリ消費、そして極めて高いエクスポート互換性を優先する展開において真価を発揮する、戦場で鍛えられたYOLOv5 。
- モバイル展開: YOLOv5 エクスポート TFLite またはCoreML へのエクスポートは、旧型スマートフォンでのデバイス内推論CoreML 驚くほどシームレスです。
- レガシーエッジハードウェア:Raspberry Piや初期世代NVIDIA Nanoなどのデバイスでは、YOLOv5 のシンプルな畳み込み処理により、スマート駐車管理などのアプリケーションで安定したフレームレートがYOLOv5 。
- ラピッドプロトタイピング:コミュニティチュートリアルの豊富な提供、カスタム事前学習済み重み、大規模データセットとの互換性により、概念実証を検証する最速の方法となる。
YOLOv9を選択すべき時
YOLOv9 、複雑な細部の捕捉と偽陰性の最小化が絶対的に重要なシナリオにおいてYOLOv9 、多少の計算オーバーヘッドが必要であってもその価値がある。
- 航空写真および衛星画像:PGIフレームワークは微小物体の忠実度維持に極めて優れており、YOLOv9 ドローンによる農業モニタリングにYOLOv9 である。
- 医療画像診断:高解像度スキャンにおける微小な異常や病変の検出において、GELANの正確な勾配流れは再検査率向上に不可欠な優位性を提供する。
- ハイエンド小売分析:密集した棚上の重複商品を追跡する際に、YOLOv9優れた特徴保持能力が大きな効果を発揮する。
視野を広げる
YOLOv5 YOLOv9 比較することで、2020年から2024年にかけてのアーキテクチャの進化を明確にYOLOv9 、AI分野はかつてない速さで進歩しています。 性能の絶対的な最先端を求める開発者には、最新のYOLO26モデルを強く推奨します。従来の非最大抑制(NMS)をネイティブなエンドNMS設計に置き換え、高度なMuSGDオプティマイザーを活用することで、YOLO26は研究レベルの精度と実運用レベルの速度のギャップを埋めます。DFL除去(簡素化されたエクスポートとエッジ/低電力デバイス互換性向上のため分布焦点損失を除去)により、YOLO26 CPU 最大43%高速化し、エッジコンピューティングに最適です。さらにProgLoss + STALは損失関数を改善し、IoT・ロボティクス・航空画像処理に不可欠な小物体認識性能を顕著に向上させます。
これらのアーキテクチャを、他の最先端モデルと比較することにも興味があるかもしれません。例えば RT-DETR や高性能な YOLO11といった最先端モデルとの比較にも興味があるかもしれません。統一されたUltralytics を活用することで、どのモデルを選択しても、開発パイプラインはクリーンで効率的、かつスケーリング可能な状態を維持できます。