YOLOv8 vs. PP-YOLOE+:技術比較
物体検出モデルを選択する場合、開発者は精度、推論速度、実装の容易さの間のトレードオフを考慮する必要があります。このページでは、2つの強力なモデル間の詳細な技術比較を提供します。Ultralytics YOLOv8(Ultralyticsの汎用性が高く広く採用されているモデル)とPP-YOLOE+(Baiduの高精度モデル)です。アーキテクチャの違い、パフォーマンスベンチマーク、および理想的なユースケースを掘り下げて、コンピュータビジョンプロジェクトに最適なものを判断するのに役立てます。
Ultralytics YOLOv8:汎用性と性能
Ultralytics YOLOv8は、Ultralyticsによって開発された最先端のモデルであり、これまでのYOLOバージョンの成功を基に構築されています。物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定などのモデルをトレーニングするための統合フレームワークとして設計されています。そのパフォーマンス、柔軟性、そして使いやすさの組み合わせにより、開発者や研究者の間で人気を博しています。
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
アーキテクチャと主な機能
YOLOv8は、軽量でありながら特徴抽出能力を高める新しいC2fバックボーンを備えたアンカーフリー設計を特徴としています。PyTorchでネイティブに構築されているため、非常にアクセスしやすく、変更も容易です。
YOLOv8の主な利点は、十分にメンテナンスされたUltralyticsエコシステムにあります。シンプルなPython APIとCLI、広範なドキュメント、および活発なコミュニティサポートを通じて、合理化されたユーザーエクスペリエンスを提供します。このモデルは非常に汎用性が高く、単一のフレームワーク内で複数のビジョンタスクをサポートしており、これはより特殊なモデルではしばしば欠けている機能です。さらに、YOLOv8は、多くの代替手段と比較して、より高速なトレーニング時間とより低いメモリ要件で、優れたトレーニング効率を示しています。Ultralytics HUBとの統合により、データラベリングからデプロイメントまでのMLOpsパイプライン全体が簡素化されます。
長所
- 優れたパフォーマンスバランス: 高い速度と精度のバランスを実現しており、エッジデバイスからクラウドサーバーまで、幅広いアプリケーションに適しています。
- 多様性: 単一のモデルフレームワークで、検出、セグメンテーション、分類、ポーズ推定、傾斜バウンディングボックスをサポートし、比類のない柔軟性を提供します。
- 使いやすさ: ユーザーフレンドリーなAPI、包括的なドキュメント、そして大規模で活発なコミュニティにより、簡単に開始して問題をトラブルシューティングできます。
- 優れた維持管理体制のエコシステム: 継続的なアップデート、新機能、Weights & BiasesやCometのようなMLOpsツールとのシームレスな統合の恩恵を受けています。
- Deployment Flexibility: ONNX、TensorRT、OpenVINOなどのさまざまな形式に簡単にエクスポートでき、多様なハードウェアでの最適化された推論が可能です。
弱点
- 非常に競争力がありますが、最大のPP-YOLOE+モデルはCOCOデータセットでわずかに高いmAPを達成できますが、パラメータが大幅に増加し、推論が遅くなるというコストがかかります。
ユースケース
YOLOv8は、バランスの取れた性能と汎用性により、以下のような用途に最適です。
- リアルタイムビデオ分析: セキュリティシステム、交通監視、および群集管理を強化します。
- 産業オートメーション: 製造業における品質管理の自動化と倉庫ロジスティクスの改善。
- 小売分析: 在庫管理の強化と顧客行動の分析。
- Healthcare: 腫瘍検出などのタスクのために、医療画像解析を支援します。
PP-YOLOE+:PaddlePaddleエコシステムにおける高精度
PP-YOLOE+は、BaiduがPaddleDetectionスイートの一部として開発した物体検出モデルです。これは、妥当な効率を維持しながら高い精度を達成することに重点を置いた、アンカーフリーのシングルステージ検出器です。このモデルは、PaddlePaddle深層学習フレームワーク上に構築されています。
著者: PaddlePaddle Authors
組織: Baidu
日付: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
ドキュメント: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
アーキテクチャと主な機能
PP-YOLOE+は、分類と回帰のための分離されたヘッドや、Task Alignment Learning(TAL)と呼ばれる特殊な損失関数など、いくつかのアーキテクチャの機能拡張を導入しています。効果的な特徴融合のために、ResNetまたはCSPRepResNetのようなバックボーンとPath Aggregation Network(PAN)ネックを組み合わせて使用します。これらの設計上の選択肢は、特に大規模なモデルバリアントにおいて、その高い精度に貢献しています。
長所
- 高精度: 最大モデルであるPP-YOLOE+xは、COCOベンチマークで非常に高いmAPスコアを達成しています。
- 効率的なアンカーフリー設計: 事前定義されたアンカーボックスの必要性をなくすことで、検出パイプラインを簡素化します。
- PaddlePaddle向けに最適化: PaddlePaddleエコシステムと緊密に統合されており、このフレームワークをすでに使用している開発者にとっては利点となる可能性があります。
弱点
- フレームワークの依存関係: PaddlePaddleフレームワークへの依存度が高いため、主にPyTorchを使用しているより広範なコミュニティにとって、アクセスが制限されます。
- 汎用性の制限: PP-YOLOE+は主に物体検出器であり、YOLOv8にあるセグメンテーション、分類、ポーズ推定に対する組み込みのマルチタスクサポートがありません。
- 高いリソース使用率: パフォーマンスの表に示すように、PP-YOLOE+ モデルは一般に、同等の精度レベルの YOLOv8 よりも多くのパラメータと高い FLOPs を持っています。
- エコシステムが限定的: コミュニティサポート、ドキュメント、およびサードパーティの統合は、Ultralytics YOLOv8で利用できるほど包括的ではありません。
ユースケース
PP-YOLOE+ は、最大の精度を達成することが最優先事項であり、開発チームが PaddlePaddle フレームワークで標準化されているアプリケーションに最適です。
- 産業用欠陥検出: 精度が重要な製造業において、微細な欠陥を特定します。
- 特殊な科学研究: 特定のデータセットで可能な限り最高の検出精度を必要とするプロジェクト。
- 小売自動化: 自動チェックアウトシステムのような高精度タスク。
性能とベンチマーク分析
以下の性能比較は、YOLOv8とPP-YOLOE+の主な違いを強調しています。PP-YOLOE+xは最高のmAPを達成していますが、YOLOv8xよりも44%多いパラメーターを使用しています。対照的に、YOLOv8モデルは一貫して優れた効率を示し、より優れた速度とより低いリソース要件を提供します。たとえば、YOLOv8nは、CPUとGPUでPP-YOLOE+モデルよりも大幅に高速でありながら、使用するパラメーターとFLOPが最も少なくなっています。この効率により、YOLOv8は、特にリソースが制約されたエッジデバイスでの現実世界のデプロイメントにとって、より実用的な選択肢となります。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
結論: どのモデルを選ぶべきか?
圧倒的多数の開発者とアプリケーションにとって、Ultralytics YOLOv8が優れた選択肢です。打ち負かすのが難しい、速度、精度、およびリソース効率の優れたバランスを提供します。しかし、その真の強みは、その汎用性とそれを取り巻く堅牢なエコシステムにあります。単一の使いやすいフレームワーク内で複数のコンピュータビジョンタスクを処理できる機能は、広範なドキュメント、活発なコミュニティサポート、およびシームレスなMLOps統合と組み合わされ、YOLOv8を信じられないほど強力で実用的なツールにしています。
PP-YOLOE+は、PaddlePaddleフレームワーク内で精度の限界を押し広げる、称賛に値するモデルです。Baiduエコシステムにすでに投資しているチームや、モデルサイズとフレームワークの柔軟性のコストに関係なく、mAPの最後のパーセントの端数を絞り出すことが唯一の目的であるニッチなアプリケーションにとっては、実行可能なオプションです。
結局のところ、柔軟性、高速性、使いやすさを備え、十分なサポートがあり、さまざまなタスクに適応できるモデルをお探しなら、YOLOv8が間違いなく最適です。
その他のモデルを見る
他の最先端モデルの調査に関心がある場合は、必ず他の比較ページをご確認ください。