コンテンツへスキップ

YOLOv9とYOLOv5詳細比較

このページでは、YOLO シリーズの2つの人気モデルであるYOLOv9とYOLOv5、物体検出機能に焦点を当てて技術的に比較します。アーキテクチャの違い、パフォーマンスメトリクス、トレーニング方法、適切なユースケースを掘り下げ、コンピュータビジョンのタスクに適したモデルを選択できるようにします。

YOLOv9:プログラム可能なグラデーション情報

YOLOv9は、台湾の中央研究院情報科学研究所のChien-Yao Wang氏とHong-Yuan Mark Liao氏によって2024年2月に発表されたもので、リアルタイムの物体検出における大きな進歩である。このモデルの詳細は彼らの論文「YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information」に記載されており、コードはGitHubで公開されている。

アーキテクチャーとイノベーションYOLOv9は、2つの重要な革新技術を導入している:プログラム可能な勾配情報(PGI)と一般化された効率的なレイヤ集約ネットワーク(GELAN)です。PGIはディープネットワークにおける情報ロスに対処し、モデルがより効果的に学習できるようにする一方、GELANはパラメータ利用と計算効率を改善するためにネットワークアーキテクチャを最適化します。この組み合わせにより、計算コストを比例して増加させることなく、精度を向上させることができる。

パフォーマンスYOLOv9は、MS COCOデータセットで最先端の性能を達成し、以前のYOLO バージョンや他のリアルタイム物体検出器と比較して、優れた精度と効率を実証しています。例えば、YOLOv9cは、25.3Mのパラメータで53.0mAPval50-95を達成しています。

使用例YOLOv9は、以下のような高い精度と効率を要求されるアプリケーションに最適です:

  • 高精度の物体検出:自律走行、高度な監視、ロボットビジョンなど、精度が最優先されるシーン。
  • リソースに制約のある環境:トレーニングはYOLOv5多くのリソースを必要とするが、効率的なアーキテクチャにより、最適化された推論速度でエッジデバイスに展開することができる。

強みだ:

  • 高い精度:特にYOLOv9eのようなモデルで優れたmAPスコアを達成。
  • 効率的な設計:GELANとPGIは、同程度の精度を持つ従来のモデルと比較して、より優れたパラメータと計算効率に貢献している。

弱点がある:

  • トレーニング・リソースの需要の増加:YOLOv9モデルのトレーニングには、YOLOv5比較してより多くの計算リソースと時間が必要です。
  • 比較的新しいモデル:新しいモデルであるため、より確立されたYOLOv5比べると、コミュニティやドキュメントはまだ発展途上である。

YOLOv9についてもっと知る

YOLOv5:多用途性とスピード

Glenn Jocherが執筆し、2020年6月にリリースされたUltralytics YOLOv55は、そのスピード、使いやすさ、多様性で有名である。特定のarXiv論文はないが、詳細な情報はUltralytics YOLOv5 ドキュメントと GitHubリポジトリで入手できる。

アーキテクチャと特徴: YOLOv5 5は、CSP BottleneckやPANetのようなアーキテクチャを利用し、スピードとアクセシビリティに重点を置いて構築されている。様々な計算予算や性能ニーズに対応するため、様々なモデルサイズ(YOLOv5n, s, m, l, x)を提供しています。YOLOv5 5はPyTorch実装されており、ユーザーフレンドリーで適応性が高い。

パフォーマンス YOLOv5 、速度と精度のバランスを提供し、実世界の幅広いアプリケーションに適しています。小型のYOLOv5sは、推論速度が速く、37.4mAPval50-95を達成しています。

使用例 YOLOv5 5は非常に汎用性が高く、スピードと導入の容易さが重要なシナリオに適している:

  • リアルタイムアプリケーション:ライブ映像処理、ロボット工学、ドローンビジョンなど、高速推論を必要とするアプリケーションに最適。
  • エッジへの展開:小型モデル(YOLOv5n、YOLOv5s)は、計算負荷が低いため、エッジデバイスやモバイルプラットフォームへの展開に適している。
  • 迅速なプロトタイピングと開発: YOLOv5 、その使いやすさと豊富なドキュメントにより、迅速な開発サイクルや教育目的に最適です。

強みだ:

  • 高速:特に小さなモデルバリエーションで高速推論を実現。
  • 使いやすさ:ドキュメントが充実しており、活発なコミュニティがあるため、使いやすく実装しやすい。
  • 汎用性:複数のサイズがあり、検出、セグメンテーション、分類を含む様々なタスクに適応可能。

弱点がある:

  • YOLOv9に比べて精度が低い:一般的に、YOLOv5 モデルは、特に要求の厳しいシナリオにおいて、最新のYOLOv9と同レベルの精度を達成していない。
  • YOLOv9より革新的でないアーキテクチャ:YOLOv9のアーキテクチャは効果的ではあるが、YOLOv9に見られるようなPGIとGELANの斬新な革新は取り入れられていない。

YOLOv5もっと知る


モデル サイズ(ピクセル) mAPval50-95 スピードCPU ONNX(ms) スピードT4テンソルRT10(ms) params(M) フロップス(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

結論

YOLOv9とYOLOv5 どちらを選ぶかは、プロジェクトの優先順位による。精度を最優先し、トレーニングのためのリソースを確保できる場合は、YOLOv9の方が優れている。スピード、使いやすさ、展開の柔軟性を優先するアプリケーション、特にエッジ・デバイスでは、YOLOv5 依然として優れた選択肢であり、広く採用されている。

Ultralytics 、YOLOv8、YOLOv7、YOLOv6、そして新しくリリースされたYOLO11提供しており、それぞれ独自の強みと最適化を備えています。Ultralytics Modelsのドキュメントをご覧になり、あらゆるオプションをご確認ください。

📅作成:1年前 ✏️更新:1ヶ月前

コメント