モデル比較:YOLOv8とYOLOv7のオブジェクト検出
適切な物体検出モデルの選択は、コンピュータビジョンタスクで最適なパフォーマンスを達成するために不可欠です。このページでは、この分野で重要な2つのモデルであるUltralytics YOLOv8とYOLOv7の技術的な比較を提供します。アーキテクチャのニュアンス、パフォーマンスのベンチマーク、理想的なアプリケーションを分析して、モデル選択のプロセスをガイドし、Ultralyticsエコシステムが提供する利点を強調します。両方のモデルが最先端技術を進歩させていますが、YOLOv8は、その強化されたパフォーマンス、汎用性、および卓越した使いやすさにより、最新のアプリケーションにとって優れた選択肢として登場しています。
YOLOv8:最先端の効率と適応性
Ultralytics YOLOv8は、2023年にリリースされたUltralyticsの最新のフラッグシップモデルです。前モデルの成功を基に、新たなレベルのパフォーマンス、柔軟性、効率性を導入しています。最先端モデルとして、YOLOv8は幅広いコンピュータビジョンタスクで優れた性能を発揮するように設計されています。
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
アーキテクチャと設計
YOLOv8は、強力かつユーザーフレンドリーな洗練されたアーキテクチャを特徴としています。主なアーキテクチャの改善点としては、新しいアンカーフリーの検出ヘッドと、より効率的なバックボーンが挙げられます。アンカーフリー設計により、ボックス予測の数が減り、Non-Maximum Suppression (NMS)のような後処理ステップが簡素化され、推論速度が向上します。これにより、YOLOv8は手動でのアンカー調整なしに、さまざまなオブジェクトの形状やサイズにより適応できるようになります。
長所
- 最先端のパフォーマンス: YOLOv8は、精度と速度の卓越したバランスを実現し、すべてのスケールで以前のモデルを凌駕します。より小型のモデルは、同等のYOLOv7バリアントよりも高速かつ高精度であり、より大型のモデルは、精度に関する新たな基準を打ち立てます。
- 比類なき汎用性: 主に物体検出器であるYOLOv7とは異なり、YOLOv8は、物体検出、インスタンスセグメンテーション、ポーズ推定、画像分類、指向性物体検出(OBB)といった複数のタスクをすぐにサポートする統合フレームワークです。
- 使いやすさ: Ultralyticsは、効率化された開発者エクスペリエンスを重視しています。YOLOv8には、シンプルなPython APIとCLI、包括的なドキュメント、およびノーコードでのトレーニングとデプロイメントのためのUltralytics HUBのようなツールとのシームレスな統合が付属しています。
- 充実したエコシステム: 公式Ultralyticsモデルとして、YOLOv8は活発な開発、頻繁なアップデート、そして強力なオープンソースコミュニティの恩恵を受けています。これにより、信頼性、最新機能へのアクセス、そして広範なサポートが確保されます。
- Training and Memory Efficiency: YOLOv8モデルは効率的なトレーニング用に設計されており、多くの場合、トランスフォーマーのような他のアーキテクチャよりもCUDAメモリの使用量が少なくなります。COCOのようなデータセットで事前にトレーニングされた重みがすぐに利用できるため、カスタムデータでの収束が高速化されます。
弱点
- 非常に高度なモデルとして、最大のYOLOv8バリアントはトレーニングにかなりの計算リソースを必要としますが、そのパフォーマンスレベルに対して非常に効率的です。
理想的なユースケース
YOLOv8は、優れた性能と汎用性により、エッジデバイスからクラウドサーバーまで、幅広い用途に最適な選択肢です。
- リアルタイム産業オートメーション: 高速かつ正確な検出により、製造業における品質管理とプロセス監視を強化します。
- 高度なAIソリューション: 作物モニタリングのための農業や、医用画像解析のためのヘルスケアにおける複雑なアプリケーションを可能にします。
- 自律システム: 自動運転車やロボティクスに堅牢な認識機能を提供。
YOLOv7:リアルタイム検出におけるベンチマーク
YOLOv7は2022年に、リアルタイム物体検出における重要な進歩として発表され、リリース当時、新たな最先端技術を確立しました。推論コストを増加させることなく、精度を向上させるためにトレーニングプロセスの最適化に重点を置いていました。
著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
所属: Institute of Information Science, Academia Sinica, Taiwan
日付: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
ドキュメント: https://docs.ultralytics.com/models/yolov7/
アーキテクチャと設計
YOLOv7 は、学習効率を向上させるために、バックボーンに Extended Efficient Layer Aggregation Network (E-ELAN) を含む、いくつかのアーキテクチャの革新を導入しました。最も注目すべき貢献は、「trainable bag-of-freebies」の概念であり、これは推論のオーバーヘッドを追加することなくモデルの精度を高めるトレーニング戦略です。これらには、補助ヘッドや粗から密へのラベル割り当てなどのテクニックが含まれます。
長所
- リリース時の高いパフォーマンス: YOLOv7は、当時利用可能だった他の検出器を上回る、速度と精度の優れた組み合わせを提供しました。
- 効率的な学習: "bag-of-freebies"の概念により、最適化された学習ルーチンで高い精度を達成できました。
- 確立されたベンチマーク: MS COCOのような標準的なデータセットで広範にテストされた、定評のあるモデルです。
弱点
- 汎用性の制限: YOLOv7は主に物体検出器です。セグメンテーションや姿勢推定のような他のタスクに拡張するには、YOLOv8の統合アプローチとは異なり、多くの場合コミュニティ主導の個別の実装が必要です。
- アーキテクチャの複雑さ: 学習テクニックとアーキテクチャの構成要素は、YOLOv8の合理化された設計と比較して、理解および修正が複雑になる可能性があります。
- 新しいモデルに性能で劣る: YOLOv7は強力でしたが、速度と精度の両方でYOLOv8に上回られています。Ultralyticsのエコシステムは、よりユーザーフレンドリーで包括的なエクスペリエンスも提供します。
理想的なユースケース
YOLOv7は、より新しい代替モデルがリリースされる前に統合されたアプリケーションにとって、依然として有能なモデルです。
- リアルタイムセキュリティシステム: 高速かつ正確な検出が重要な盗難防止などのアプリケーションに適しています。
- レガシープロジェクト: YOLOv7アーキテクチャ上に構築された既存のシステムの維持または拡張のための実行可能なオプションです。
性能とベンチマーク:YOLOv8 vs. YOLOv7
この性能比較は、YOLOv8によって達成された進歩を明確に示しています。全体的に、YOLOv8モデルは、精度と速度のより良いトレードオフを提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
データから、いくつかの重要な洞察が得られます。
- 優れた精度: 最大のモデルであるYOLOv8xは、53.9 mAPを達成し、YOLOv7xモデルの53.1 mAPを上回っています。
- 比類なき速度: YOLOv8モデルは、特にCPU上で大幅に高速化されています。YOLOv8nモデルは、ONNXを使用した場合、CPU上でわずか80.4msという推論時間を誇ります。これはYOLOv7では利用できない指標ですが、実際にはより高速であることが実証されています。GPU上では、YOLOv8nはTensorRTで1.47msという驚異的な速度を達成し、YOLOv7の効率をはるかに上回ります。
- より高い効率性: YOLOv8モデルは、同等またはそれ以上のパフォーマンスに対して、より少ないパラメータとFLOPsを備えています。例えば、YOLOv8lはYOLOv7xとほぼ同じmAP(52.9 vs. 53.1)を達成していますが、パラメータ(43.7M vs. 71.3M)とFLOPs(165.2B vs. 189.9B)は大幅に少なくなっています。
結論: YOLOv8が推奨される理由
YOLOv7 は手ごわいモデルでしたが、YOLOv8 は新しいプロジェクトと開発にとって明らかな勝者です。その優れたアーキテクチャ、最先端のパフォーマンス、および信じられないほどの汎用性により、オブジェクト検出やその他のコンピュータビジョンタスクに利用できる最も強力でユーザーフレンドリーなツールとなっています。
統合されたUltralyticsエコシステムは、トレーニングからデプロイメントまでシームレスなエクスペリエンスを提供し、大きな利点をもたらします。堅牢で、十分にサポートされ、高性能なモデルを求める開発者や研究者にとって、YOLOv8は決定的な選択肢です。
その他のモデルを見る
さらに詳しく知りたい方のために、Ultralytics はさまざまなモデルと比較を提供しています。以下をご覧ください。
- YOLOv8 vs. YOLOv5: YOLOv8を、広く採用されているもう一つの効率的なモデルと比較します。
- YOLOv8 vs. RT-DETR: YOLOv8がTransformerベースのアーキテクチャにどのように匹敵するかをご覧ください。
- YOLO11 vs. YOLOv8:最新のUltralyticsモデル、YOLO11の進歩を探求してください。