YOLOv5 YOLOv9:包括的な技術比較
リアルタイム物体検出の進化は、精度と効率の急速な進歩によって特徴づけられてきた。この旅における2つの重要なマイルストーンは Ultralytics YOLOv5であり、ユーザビリティとデプロイメントの業界標準を設定したモデルである。 YOLOv9は、ディープラーニング理論の限界を押し広げる研究に特化したアーキテクチャである。
この技術比較では、開発者や研究者がコンピュータビジョンプロジェクトに適したツールを選択できるよう、それぞれのアーキテクチャ、性能指標、理想的な使用例を分析している。
Ultralytics YOLOv5:汎用性の業界標準
発売以来 YOLOv5は、世界的に最も人気のあるビジョンAIモデルの一つとなっています。Ultralytics開発されたYOLOv5は、卓越したエンジニアリング、使いやすさ、実世界でのパフォーマンスを最優先しています。スピードと精度のバランスを保ちながら、堅牢なエコシステムを通じてシームレスなユーザー体験を提供します。
技術詳細:
- 著者: Glenn Jocher
- 組織Ultralytics
- Date: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- ドキュメントhttps://docs.ultralytics.com/models/yolov5/
アーキテクチャと設計
YOLOv5 、CSPDarknetバックボーンとPANetネックを組み合わせ、効率的な特徴抽出と集約を実現している。そのアンカーベースの検出ヘッドは、スピードのために高度に最適化されており、幅広いハードウェアに適している。純粋に学術的なモデルとは異なり、YOLOv5 5は配備を念頭に置いて設計されており、以下のネイティブ・サポートを提供している。 iOS, Androidおよびエッジ・デバイスのネイティブ・サポートを提供する。
主な強み
- 整備されたエコシステム: YOLOv5 、長年にわたる積極的な開発により、広範なドキュメント、コミュニティサポート、Ultralytics HUBのようなツールとの統合を実現しています。
- トレーニング効率:トランスフォーマーベースのアーキテクチャに比べ、トレーニング時間が速く、メモリ要件が低いことで知られており、標準的なコンシューマー向けGPUで利用可能です。
- 汎用性:検出だけでなく、YOLOv5 5はインスタンスのセグメンテーションと 画像の分類をネイティブにサポートしており、開発者は1つのフレームワークで複数のビジョンタスクに取り組むことができます。
- 配備準備完了:へのエクスポート機能が組み込まれています。 ONNX, TensorRTCoreML、TFLiteエクスポート機能を内蔵しているため、研究から生産への移行が効率化されます。
YOLOv9:最高の精度を実現する建築的革新
2024年発売 YOLOv9は、ディープネットワークにおける情報損失の問題の解決に焦点を当てている。YOLOv9は、データがモデルをどのように伝播するかを改善する新しいコンセプトを導入し、以下のようなベンチマークで最先端の結果を達成している。 COCO.
技術詳細:
- 著者: Chien-Yao Wang、Hong-Yuan Mark Liao
- 組織台湾中央研究院情報科学研究所
- Date: 2024-02-21
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
- ドキュメントhttps://docs.ultralytics.com/models/yolov9/
アーキテクチャとイノベーション
YOLOv9 、2つの主要なアーキテクチャーの進歩を導入している:
- プログラム可能な勾配情報(PGI):情報ボトルネック問題を緩和するために設計された手法で、損失関数の計算に完全な入力情報が利用できるようにする。
- 一般化された効率的なレイヤ集約ネットワーク(GELAN):パラメータ効率を最適化する軽量ネットワークアーキテクチャで、従来のモデルよりも少ないパラメータで高い精度を達成できる。
主な強み
- 高精度: YOLOv9 、特に大型構成YOLOv9、物体検出精度の素晴らしいベンチマークを設定しています。
- パラメータ効率:GELANアーキテクチャは、モデルがパラメータを効果的に使用することを保証し、強力な精度対重量比を提供する。
- 理論的進歩:深層学習における、深層における情報保存に関する基本的な問題に取り組んでいる。
パフォーマンス比較
これら2つのモデルを比較する場合、通常、速度と 絶対精度の間でトレードオフが生じる。YOLOv9 COCO データセットでより高いmAPvalスコアを達成し、PGIとGELANの有効性を実証した。しかし Ultralytics YOLOv5は、推論速度、特に最適化されたアーキテクチャが光るCPUやエッジデバイス上では、依然として手ごわい競争相手である。
パフォーマンス・バランス
YOLOv9 精度チャートでトップであるのに対して、 YOLOv5は、ロバストな検出機能を維持しながら、標準的なハードウェアで推論速度(ms)を大幅に高速化し、リアルタイム・アプリケーションにより実用的なバランスを提供することが多い。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
トレーニングとリソース
開発者にとって、トレーニングの効率は推論スピードと同じくらい重要です。Ultralytics YOLOv5 5は、"train and go "のシンプルさで知られています。新しい、より複雑なアーキテクチャー、特に変換器ベースのモデル(RT-DETRのような)と比較して、通常、トレーニング中に必要なメモリが少なくて済みます。 RT-DETR).このように参入障壁が低いため、ユーザーは控えめなハードウェア・セットアップでカスタム・モデルをトレーニングすることができます。
YOLOv9、パラメータは効率的であるが、PGIに使用される補助分岐が複雑であるため、学習にはリソースを消費する可能性がある。
コード例:統一インターフェース
Ultralytics エコシステムの大きな利点の一つは、統一されたPython APIである。1行のコードでYOLOv5 YOLOv9 切り替えることができ、特定のデータセットで両方のベンチマークを取るのが驚くほど簡単になる。
from ultralytics import YOLO
# Load an Ultralytics YOLOv5 model (pre-trained on COCO)
model_v5 = YOLO("yolov5su.pt")
# Train the model on your custom data
results_v5 = model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a YOLOv9 model for comparison
model_v9 = YOLO("yolov9c.pt")
# Train YOLOv9 using the exact same API
results_v9 = model_v9.train(data="coco8.yaml", epochs=100, imgsz=640)
理想的なユースケース
これらのモデルのどちらを選ぶかは、プロジェクトの優先順位による:
Ultralytics YOLOv5選ぶとき
- エッジ・デプロイメント: Raspberry Pi、モバイルアプリ、組み込みシステムなど、1ミリ秒単位のレイテンシが重要なシステムに最適です。
- 迅速なプロトタイピング:使いやすさ、充実したチュートリアル、コミュニティのサポートにより、驚くほど速い開発サイクルを実現します。
- マルチタスク要件:プロジェクトが検出と同時にセグメンテーションや分類を必要とする場合、YOLOv5 5は統合されたソリューションを提供します。
- リソースの制約:トレーニング用のGPU メモリーが限られているプロジェクトは、YOLOv55の効率性の恩恵を受ける。
YOLOv9選ぶとき
- 最高の精度: 医療用画像診断や高精度の工業用検査など、検出ミスがコストに直結するアプリケーションに不可欠。
- 学術研究: 勾配情報の流れとネットワークアーキテクチャ設計の最新情報を調査する研究者に最適です。
- 強力なハードウェア:トレーニングや推論に十分な計算リソースが利用可能な場合に、その潜在能力を最大限に活用できる。
結論
どちらのモデルも、コンピュータ・ビジョンの分野における卓越性を象徴している。 Ultralytics YOLOv5は、スピード、信頼性、エコシステムのサポートにおいて比類のない組み合わせを提供し、ほとんどの開発者にとって実用的な選択肢であり続けています。YOLOv5は、実世界でのデプロイメントに耐えうる製品です。 YOLOv9一方、YOLOv9は、アーキテクチャー効率の未来を垣間見ることができ、それを必要とする人々にトップクラスの精度を提供する。
最新のパフォーマンスと多用途性をお求めの方には、次の製品もお勧めします。 YOLO11は、YOLOv5 YOLOv8 8の長所をさらに強化し、すべての指標において最先端の結果を提供します。
その他のモデルを見る
さらに詳しく知りたい方は、Ultralytics エコシステムの関連モデルをご覧ください:
- YOLO11: 優れた性能と汎用性を実現する最新のSOTAモデルです。
- YOLOv8: detect、segment、姿勢、obbをサポートする強力なアンカーフリーモデル。
- RT-DETR: 高精度アプリケーション向けのリアルタイムTransformerベースのdetector。