モデル比較:オブジェクト検出におけるYOLOv7とYOLOv8
適切な物体検出モデルの選択は、コンピュータビジョンタスクで最適なパフォーマンスを達成するために不可欠です。このページでは、この分野で重要な2つのモデルであるYOLOv7とUltralytics YOLOv8の技術的な比較を提供します。アーキテクチャのニュアンス、パフォーマンスのベンチマーク、理想的なアプリケーションを分析して、モデル選択のプロセスをガイドし、Ultralyticsエコシステムが提供する利点を強調します。
YOLOv7:リアルタイム検出におけるベンチマーク
YOLOv7は、推論コストを増加させることなく、トレーニング効率と精度を最適化することに重点を置いた、リアルタイム物体検出における重要な進歩として発表されました。リリース時には、リアルタイム検出器の新たな最先端技術を確立しました。
著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
所属: Institute of Information Science, Academia Sinica, Taiwan
日付: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
ドキュメント: https://docs.ultralytics.com/models/yolov7/
アーキテクチャと主な機能
YOLOv7 は、いくつかの重要な技術革新を導入することで、従来の YOLO アーキテクチャを基に構築されています。バックボーンに Extended Efficient Layer Aggregation Networks (E-ELAN) などの技術を採用し、特徴抽出の効率を向上させています。主な貢献として、「trainable bag-of-freebies」の概念があり、これは、推論時の計算量を増やすことなく、最終的なモデル精度を向上させるために、トレーニング中に適用される最適化戦略(補助ヘッドや粗から密へのガイダンスなど)を含みます。YOLOv7 は主にアンカーベースの検出器であり、物体検出タスクに焦点を当てていますが、コミュニティの拡張機能により、姿勢推定などの他のタスクにも適用されています。
長所
- High Accuracy and Speed Balance: mAPと推論速度の強力な組み合わせを提供し、リアルタイム推論タスクに非常に効果的です。
- 効率的な学習: 高度な学習テクニック("bag-of-freebies")を利用して、最終的な推論コストを増加させることなく精度を向上させます。
- 確立されたパフォーマンス: MS COCOデータセットのような標準的なベンチマークで実績のある結果を出しています。
弱点
- Architectural Complexity: アーキテクチャと斬新なトレーニング手法は、完全に把握し、カスタムユースケースに合わせて最適化するには複雑になる可能性があります。
- リソース集約的: 大規模なYOLOv7モデルは、学習にかなりのGPUリソースを必要とします。
- 限定的なタスクの多様性: 主に物体検出に焦点が当てられています。インスタンスセグメンテーションや画像分類のような他のタスクを実装するには、YOLOv8の統一されたアプローチとは異なり、個別の非統合実装が必要です。
Ultralytics YOLOv8:最先端の効率と適応性
Ultralytics YOLOv8は、Ultralyticsからの次期メジャーリリースであり、これまでのYOLOバージョンの成功を基に構築されています。優れたパフォーマンス、柔軟性、そして効率性を実現するように設計された最先端のモデルです。YOLOv8は、アンカーフリー設計とより合理化されたアーキテクチャを導入し、パフォーマンスと使いやすさの両方を向上させています。
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
長所
- 最先端のパフォーマンス: YOLOv8は、精度と速度の卓越したバランスを実現し、エッジAIからクラウドベースのサービスまで、幅広いアプリケーションに適しています。
- ユーザーフレンドリーな設計: Ultralyticsはシンプルさを優先し、包括的なドキュメント、簡単なワークフロー、およびトレーニングとデプロイメントのためのシンプルなPythonおよびCLIインターフェースを提供します。
- 比類なき汎用性: 検出、セグメンテーション、分類、ポーズ推定、指向性オブジェクト検出(OBB)など、複数のビジョンタスクをネイティブにサポートし、多様なコンピュータビジョンのニーズに対応する統合ソリューションを提供します。
- 優れたメンテナンス体制: ノーコードトレーニングとデプロイメントのためにUltralytics HUBとシームレスに統合されています。活発な開発、頻繁なアップデート、強力なコミュニティサポート、そして豊富なリソースから恩恵を受けています。
- Training and Memory Efficiency: すぐに利用できる事前学習済みの重みを使用した効率的なトレーニングプロセスを提供します。そのアーキテクチャは、トレーニングに時間がかかり、より多くのCUDAメモリを必要とする可能性があるトランスフォーマーのような他の複雑なアーキテクチャと比較して、トレーニング中により低いメモリ使用量を必要とすることがよくあります。
弱点
- 大型モデルは、かなりの計算リソースを必要としますが、リソースが限られた環境向けには、YOLOv8nのような小型で高効率なバリアントも利用可能です。
理想的なユースケース
YOLOv8はその汎用性から、リアルタイム性能と高精度が求められるアプリケーションに最適です。例:
- セキュリティアラームシステムや自動運転車におけるリアルタイム物体検出。
- 農業やヘルスケアなど、さまざまな業界にわたる汎用性の高い Vision AI ソリューション。
- Ultralytics エコシステム内での使いやすさと堅牢なツールにより、迅速なプロトタイピングとデプロイメントが可能です。
性能とベンチマーク:YOLOv7 vs. YOLOv8
性能を比較すると、YOLOv8はそのモデル範囲全体で、精度と効率の両方において明らかな利点を示しています。たとえば、YOLOv8xモデルは、YOLOv7xよりも高いmAPを達成しながら、より効率的です。小型のYOLOv8モデルも、エッジ展開に優れたトレードオフを提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
結論: どのモデルを選ぶべきか?
YOLOv7 はリアルタイムパフォーマンスの限界を押し広げた手ごわいオブジェクト検出器ですが、Ultralytics YOLOv8 は最新のアプリケーションの大部分にとって、より魅力的な選択肢となります。
YOLOv8の主な利点は次のとおりです。
- 優れた汎用性: より広範なタスクに対するネイティブサポートにより、複雑なコンピュータビジョンプロジェクトに対応するワンストップソリューションになります。
- 使いやすさ: 効率化されたAPI、広範なドキュメント、およびUltralyticsエコシステムとの統合により、初心者と専門家の両方の参入障壁が大幅に低下します。
- Better Performance-Efficiency Trade-off: YOLOv8モデルは一般に、特定のパラメータ数と計算コストに対してより優れた精度を提供するため、さまざまなハードウェア制約への適応性が高くなっています。
- 活発な開発とサポート: Ultralyticsのフラッグシップモデルとして、YOLOv8は継続的なアップデート、堅牢なコミュニティ、およびプロフェッショナルなサポートの恩恵を受け、プロジェクトの長期的な実行可能性を保証します。
強力で柔軟性があり、使いやすいフレームワークを求める開発者や研究者にとって、最先端のAIソリューションを構築するには、Ultralytics YOLOv8が推奨される選択肢です。
その他のモデルを見る
さらに検討を深めるには、Ultralyticsドキュメント内のYOLOv7、YOLOv8、およびその他の関連モデルを含むこれらの比較をご検討ください。
- YOLOv7 vs YOLOv5
- YOLOv8 vs. YOLOv5
- YOLOv8 vs RT-DETR
- YOLOv10やYOLO11のような最新モデルをご覧ください。