YOLOv8 vs YOLOv5:詳細な比較
物体検出のためのUltralytics YOLOv8とUltralytics YOLOv5を比較すると、YOLOアーキテクチャの一貫した進化と各モデルの明確な強みが明らかになります。Ultralyticsによって開発された両方のモデルは、速度と精度の優れたバランスで有名です。ただし、コンピュータビジョンの分野では、異なる優先順位に対応しています。このページでは、開発者と研究者がプロジェクトの要件に基づいて情報に基づいた意思決定を行うのに役立つ詳細な技術的な比較を提供し、Ultralyticsエコシステムの利点を強調しています。
YOLOv8:最先端のソリューション
著者: Glenn Jocher, Ayush Chaurasia, Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8は、YOLOシリーズにおける最新のメジャーリリースであり、幅広いビジョンAIタスクをサポートするための統合フレームワークとして設計されています。これには、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、そしてOriented Bounding Boxes(OBB)が含まれます。YOLOv8は、アンカーフリー検出器や洗練されたC2fネックなど、パフォーマンスと柔軟性を向上させる重要なアーキテクチャの革新を導入しています。
長所
- 優れた精度とパフォーマンス: YOLOv8は、すべてのモデルサイズにおいてYOLOv5よりも一貫して高い精度(mAP)を提供しながら、競争力のある推論速度を維持しています。これにより、要求の厳しいアプリケーションに優れたパフォーマンスバランスを提供します。
- 汎用性の向上: 包括的なフレームワークとして設計されたYOLOv8は、複数のビジョンタスクをネイティブにサポートします。この汎用性により、開発者は複雑で多面的なプロジェクトに単一の一貫したモデルアーキテクチャを使用でき、開発とデプロイメントを効率化できます。
- 最新のアーキテクチャ: YOLOv8 のアンカーフリー設計により、トレーニングプロセスの複雑さと調整するハイパーパラメータの数が減り、多くの場合、多様なデータセットでの汎化が向上します。更新された C2f モジュールは、YOLOv5 の C3 モジュールと比較して、より効率的な特徴融合を提供します。
- 合理化されたユーザーエクスペリエンス: すべてのUltralyticsモデルと同様に、YOLOv8は、シンプルなPython APIとCLI、広範なドキュメント、および十分に管理されたエコシステムの恩恵を受けています。これには、ノーコードトレーニング用のUltralytics HUBおよびMLOps管理との統合が含まれます。
- メモリ効率: Ultralytics YOLOモデルは、トレーニングと推論の両方で低メモリ使用向けに最適化されており、Transformerのような多くのリソースを消費するアーキテクチャよりもアクセスしやすくなっています。
弱点
- 計算要件: 効率的ではありますが、大規模な YOLOv8 モデル(L/X)はかなりの計算能力を必要とするため、リソースが著しく限られたエッジデバイスでのデプロイメントには制約となる可能性があります。
理想的なユースケース
YOLOv8は、最先端のパフォーマンスと柔軟性を必要とする新しいプロジェクトに推奨される選択肢です。
- 高度なロボティクス: 高い精度が重要な、複雑なシーン理解と物体インタラクションのため。
- 高解像度画像解析: 医療画像解析のように、きめ細かい詳細の検出が重要なアプリケーションに優れています。
- マルチタスクビジョンシステム: スマートリテール分析など、検出、セグメンテーション、ポーズ推定を同時に実行する必要があるシステムに最適です。
YOLOv5:確立された汎用性の高い標準
Author: Glenn Jocher
Organization: Ultralytics
Date: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Docs: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5は、リリース後すぐに業界標準となり、その卓越したスピード、精度、そして驚くほどの使いやすさで高く評価されています。PyTorch上に構築されており、CSPDarknet53バックボーンとPANetネックを備えています。そのアンカーベースの検出ヘッドは非常に効率的で、モデルはさまざまな計算予算に合わせてさまざまなサイズ(n、s、m、l、x)にスケールします。
長所
- 卓越した推論速度: YOLOv5は高速推論のために高度に最適化されており、特にCPUとエッジデバイス上のリアルタイムシステムに最適です。
- 成熟した安定したエコシステム: YOLOv5 は、長年にわたりこの分野に存在しており、広大なユーザーベース、広範なコミュニティサポート、および豊富なチュートリアルとサードパーティ統合を備えています。その安定性により、本番環境に最適な選択肢となっています。
- 使いやすさ: YOLOv5は、そのシンプルなAPIとわかりやすいトレーニングパイプラインで知られており、初心者と専門家の両方にとって非常に人気があります。Ultralyticsエコシステムは、トレーニングからデプロイまでスムーズなユーザーエクスペリエンスを保証します。
- 学習効率: このモデルは、すぐに利用できる事前学習済みの重みを備えた効率的な学習プロセスを提供し、迅速なプロトタイピングと開発を可能にします。
弱点
- 精度が低い:YOLOv8と比較して、YOLOv5モデルは一般的に、特定のサイズに対してmAPスコアが低くなります。パフォーマンスの差は、より大きなモデルほど顕著になります。
- Anchor-Based Detection: 事前に定義されたアンカーボックスに依存するため、形状やスケールが通常と異なるオブジェクトを含むデータセットでは、最適なパフォーマンスを得るために手動での調整が必要になる場合があります。
理想的なユースケース
YOLOv5 は、特に速度と安定性が最重要視されるアプリケーションにとって、依然として強力で関連性の高いモデルです。
- エッジコンピューティング: 小型バリアント(n/s)は、Raspberry PiやNVIDIA Jetsonのようなリソース制約のあるデバイスへの実装に最適です。
- リアルタイム監視: 低遅延性が不可欠なセキュリティシステムやライブビデオ監視に最適です。
- モバイルアプリケーション: 計算リソースが限られているオンデバイスオブジェクト検出タスクに適しています。
性能対決:YOLOv8 vs. YOLOv5
COCOデータセットでの性能ベンチマークは、YOLOv8で行われた進歩を明確に示しています。全体的に、YOLOv8モデルは、同等または改善された性能特性で優れた精度を提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
表から、YOLOv8モデルが大幅なmAPの向上を提供していることは明らかです。たとえば、YOLOv8sは44.9 mAPを達成し、パラメータとレイテンシがわずかに増加しただけで、YOLOv5sの37.4 mAPをはるかに上回っています。同様に、YOLOv8xは53.9 mAPに達し、YOLOv5xの50.7 mAPを上回りながら、計算効率が向上しています。
結論: どのモデルを選ぶべきか?
YOLOv5とYOLOv8はいずれも優れたモデルですが、それぞれ異なるニーズに対応しています。
-
YOLOv5は、最大の推論速度と成熟した安定したプラットフォームが最優先事項であるアプリケーションにとって、素晴らしい選択肢です。リソースが限られたデバイスへの展開や、その広範なエコシステムの恩恵を受けるプロジェクトにとっても、依然として強力な候補です。
-
YOLOv8は、次世代のYOLOテクノロジーを代表するものです。新しいプロジェクトで、複数のビジョンタスクにわたる最高の精度と多様性を求める場合に推奨される選択肢です。その最新のアンカーフリーアーキテクチャと統合フレームワークにより、研究から生産まで、幅広いアプリケーションに対応できる、より強力で柔軟なソリューションとなっています。
ほとんどのユースケースにおいて、YOLOv8の優れた性能と柔軟性により、YOLOv8が推奨されるオプションとなります。
その他のモデルを見る
Ultralyticsは、コンピュータビジョンの分野で革新を続けています。他の最先端のオプションを検討しているユーザーのために、YOLOv9、YOLOv10、最新のYOLO11のようなモデルも提供しており、それぞれが独自の利点を提供します。詳細な分析は、モデル比較ページでご覧いただけます。