モデルの比較:物体検出におけるYOLOv7とYOLOv8 比較
適切な物体検出モデルを選択することは、コンピュータビジョンのタスクで最適なパフォーマンスを達成するために非常に重要です。このページでは、この分野で人気のある2つのモデル、YOLOv7とUltralytics YOLOv88の技術比較を行います。それぞれのアーキテクチャーのニュアンス、性能ベンチマーク、理想的なアプリケーションを分析し、モデル選択プロセスの指針とします。
YOLOv7:高いパフォーマンスと効率性
YOLOv7は、台湾中央研究院情報科学研究所のChien-Yao Wang氏、Alexey Bochkovskiy氏、Hong-Yuan Mark Liao氏によって2022-07-06に発表された、高速かつ高精度な物体検出を目的としたソフトウェアである。YOLOv7は、arXiv論文で詳述されているように、「学習可能なbag-of-freebies」に焦点を当てており、推論コストを増加させることなく、学習効率と検出精度を向上させている。
強みだ:
- 高精度と高速性:YOLOv7は、COCOデータセットのベンチマークで実証されているように、最先端のリアルタイム物体検出性能を達成しています。
- 効率的なアーキテクチャ:モデルの再パラメータ化や動的なラベル割り当てなどのテクニックを活用し、学習と推論の効率を向上させる。
- 柔軟性:さまざまな計算リソースと精度のニーズに対応するため、さまざまなモデル構成(YOLOv7、YOLOv7-X、YOLOv7-W6、YOLOv7-E6、YOLOv7-D6、YOLOv7-E6E)を提供。
弱点がある:
- 複雑さ:アーキテクチャとトレーニングプロセスは、単純なモデルに比べて複雑になる可能性があり、微調整と最適化にはより多くの専門知識が必要になる可能性がある。
- リソース集約型:大きなYOLOv7モデルは、トレーニングと展開に大きな計算リソースを必要とするため、リソースに制約のある環境での使用が制限される。
理想的な使用例
YOLOv7は、以下のようなトップレベルのリアルタイム物体検出を必要とするアプリケーションに適している:
- 高い精度とスピードを必要とする高度なビデオ監視システム。
- 正確で高速な物体認識が重要な自律走行やロボット工学。
- 高スループットで欠陥を検出する工業用検査。
YOLOv8:多用途性と使いやすさ
Ultralytics YOLOv8UltralyticsGlenn Jocher、Ayush Chaurasia、Jing Qiuによって2023-01-10にリリースされたYOLO 8は、YOLO シリーズの最先端を行くものである。YOLOv8 、使いやすさ、柔軟性、そして、物体検出、セグメンテーション、ポーズ推定など、様々なビジョンタスクにおける強力なパフォーマンスを強調しています。
強みだ:
- バランスの取れたパフォーマンス: YOLOv8 、精度とスピードのバランスに優れ、様々な用途に対応します。
- ユーザーフレンドリーなエコシステム: Ultralytics 、包括的なドキュメント、トレーニング済みモデル、Ultralytics HUBとのシームレスな統合を提供し、トレーニングから展開までのワークフローを簡素化します。
- マルチタスク機能:物体検出、インスタンス分割、姿勢推定、指向性物体検出、分類をサポートし、コンピュータビジョンの多様なニーズに対応する統合ソリューションを提供します。
- 活発な開発とコミュニティサポート: Ultralytics プロジェクトでは、継続的なアップデートと大規模で活発なオープンソースコミュニティが提供されます。
弱点がある:
- 若干低いピーク性能:特定のベンチマーク、特に純粋な物体検出速度では、構成によってはYOLOv7がYOLOv8 わずかに上回ることがある。
- モデルサイズ:効率的とはいえ、リソースが極端に限られたエッジ・デバイスでは、次のような高度に専門化されたモデルと比べると、モデル・サイズが大きくなる可能性がある。 YOLOv5ナノ。
理想的な使用例
YOLOv8 非常に汎用性が高く、以下のような幅広い用途に適合する:
- セキュリティアラームシステムや ロボット工学など、速度と精度のバランスを必要とするリアルタイムアプリケーション。
- 農業、製造業、ヘルスケアなどの産業にわたる汎用ビジョンAIソリューション。
- Ultralytics エコシステム内の使いやすさと包括的なツールにより、迅速なプロトタイピングと展開が可能。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Ultralytics 、他のモデルを検討したいユーザーのために、効率的なYOLO モデルも提供しています。 YOLOv5や、汎用性の高いYOLOv6、YOLOv9などのYOLOモデルも提供しています。さらに、インスタンスのセグメンテーションが必要なタスクには、YOLOv8ご検討ください。
結論として、YOLOv7とYOLOv8 どちらも強力な物体検出モデルである。YOLOv7は、最高のリアルタイム検出性能を必要とするシナリオに優れている一方、YOLOv8 、様々なビジョン・タスクや展開環境において、より汎用的でユーザーフレンドリーな体験を提供する。精度、スピード、使いやすさ、利用可能なリソースのバランスを考慮し、アプリケーションの特定のニーズによって選択する必要があります。