YOLOv9とYOLOv5詳細比較
このページでは、YOLO シリーズの2つの人気モデルであるYOLOv9とYOLOv5、物体検出機能に焦点を当てて技術的に比較します。アーキテクチャの違い、パフォーマンスメトリクス、トレーニング方法、適切なユースケースを掘り下げ、コンピュータビジョンのタスクに適したモデルを選択できるようにします。
YOLOv9:プログラム可能なグラデーション情報
YOLOv9は、台湾の中央研究院情報科学研究所のChien-Yao Wang氏とHong-Yuan Mark Liao氏によって2024年2月に発表されたもので、リアルタイムの物体検出における大きな進歩である。このモデルの詳細は彼らの論文「YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information」に記載されており、コードはGitHubで公開されている。
アーキテクチャーとイノベーションYOLOv9は、2つの重要な革新技術を導入している:プログラム可能な勾配情報(PGI)と一般化された効率的なレイヤ集約ネットワーク(GELAN)です。PGIはディープネットワークにおける情報ロスに対処し、モデルがより効果的に学習できるようにする一方、GELANはパラメータ利用と計算効率を改善するためにネットワークアーキテクチャを最適化します。この組み合わせにより、計算コストを比例して増加させることなく、精度を向上させることができる。
パフォーマンスYOLOv9は、MS COCOデータセットで最先端の性能を達成し、以前のYOLO バージョンや他のリアルタイム物体検出器と比較して、優れた精度と効率を実証しています。例えば、YOLOv9cは、25.3Mのパラメータで53.0mAPval50-95を達成しています。
使用例YOLOv9は、以下のような高い精度と効率を要求されるアプリケーションに最適です:
- 高精度の物体検出:自律走行、高度な監視、ロボットビジョンなど、精度が最優先されるシーン。
- リソースに制約のある環境:トレーニングはYOLOv5多くのリソースを必要とするが、効率的なアーキテクチャにより、最適化された推論速度でエッジデバイスに展開することができる。
強みだ:
- 高い精度:特にYOLOv9eのようなモデルで優れたmAPスコアを達成。
- 効率的な設計:GELANとPGIは、同程度の精度を持つ従来のモデルと比較して、より優れたパラメータと計算効率に貢献している。
弱点がある:
- トレーニング・リソースの需要の増加:YOLOv9モデルのトレーニングには、YOLOv5比較してより多くの計算リソースと時間が必要です。
- 比較的新しいモデル:新しいモデルであるため、より確立されたYOLOv5比べると、コミュニティやドキュメントはまだ発展途上である。
YOLOv5:多用途性とスピード
Glenn Jocherが執筆し、2020年6月にリリースされたUltralytics YOLOv55は、そのスピード、使いやすさ、多様性で有名である。特定のarXiv論文はないが、詳細な情報はUltralytics YOLOv5 ドキュメントと GitHubリポジトリで入手できる。
アーキテクチャと特徴: YOLOv5 5は、CSP BottleneckやPANetのようなアーキテクチャを利用し、スピードとアクセシビリティに重点を置いて構築されている。様々な計算予算や性能ニーズに対応するため、様々なモデルサイズ(YOLOv5n, s, m, l, x)を提供しています。YOLOv5 5はPyTorch実装されており、ユーザーフレンドリーで適応性が高い。
パフォーマンス YOLOv5 、速度と精度のバランスを提供し、実世界の幅広いアプリケーションに適しています。小型のYOLOv5sは、推論速度が速く、37.4mAPval50-95を達成しています。
使用例 YOLOv5 5は非常に汎用性が高く、スピードと導入の容易さが重要なシナリオに適している:
- リアルタイムアプリケーション:ライブ映像処理、ロボット工学、ドローンビジョンなど、高速推論を必要とするアプリケーションに最適。
- エッジへの展開:小型モデル(YOLOv5n、YOLOv5s)は、計算負荷が低いため、エッジデバイスやモバイルプラットフォームへの展開に適している。
- 迅速なプロトタイピングと開発: YOLOv5 、その使いやすさと豊富なドキュメントにより、迅速な開発サイクルや教育目的に最適です。
強みだ:
- 高速:特に小さなモデルバリエーションで高速推論を実現。
- 使いやすさ:ドキュメントが充実しており、活発なコミュニティがあるため、使いやすく実装しやすい。
- 汎用性:複数のサイズがあり、検出、セグメンテーション、分類を含む様々なタスクに適応可能。
弱点がある:
- YOLOv9に比べて精度が低い:一般的に、YOLOv5 モデルは、特に要求の厳しいシナリオにおいて、最新のYOLOv9と同レベルの精度を達成していない。
- YOLOv9より革新的でないアーキテクチャ:YOLOv9のアーキテクチャは効果的ではあるが、YOLOv9に見られるようなPGIとGELANの斬新な革新は取り入れられていない。
モデル | サイズ(ピクセル) | mAPval50-95 | スピードCPU ONNX(ms) | スピードT4テンソルRT10(ms) | params(M) | フロップス(B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
結論
YOLOv9とYOLOv5 どちらを選ぶかは、プロジェクトの優先順位による。精度を最優先し、トレーニングのためのリソースを確保できる場合は、YOLOv9の方が優れている。スピード、使いやすさ、展開の柔軟性を優先するアプリケーション、特にエッジ・デバイスでは、YOLOv5 依然として優れた選択肢であり、広く採用されている。
Ultralytics 、YOLOv8、YOLOv7、YOLOv6、そして新しくリリースされたYOLO11提供しており、それぞれ独自の強みと最適化を備えています。Ultralytics Modelsのドキュメントをご覧になり、あらゆるオプションをご確認ください。