YOLO11 vs PP-YOLOE+:詳細なモデル比較
適切な物体検出モデルの選択は、精度、速度、デプロイメント効率の要求のバランスを取る上で重要な決定です。このページでは、Ultralyticsの最新の最先端モデルであるUltralytics YOLO11と、BaiduのPaddlePaddleエコシステムの強力なモデルであるPP-YOLOE+との包括的な技術比較を提供します。どちらのモデルも非常に有能ですが、YOLO11は優れたパフォーマンスバランス、卓越した使いやすさ、汎用性が高く、適切にメンテナンスされたエコシステムへの統合により際立っており、幅広いコンピュータビジョンアプリケーションに推奨される選択肢となっています。
Ultralytics YOLO11:最先端のパフォーマンスと汎用性
Ultralytics YOLO11は、Glenn JocherとJing Qiuによって設計された、Ultralyticsの最新のフラッグシップモデルです。2024年9月27日にリリースされ、YOLOv8のような非常に成功した前モデルの遺産を基に、リアルタイム物体検出などの分野で新たな標準を打ち立てます。YOLO11は、最大限の効率、汎用性、およびユーザーフレンドリーさを実現するように設計されており、高度なコンピュータビジョンを世界中の開発者や研究者が利用できるようにします。
著者: Glenn Jocher、Jing Qiu
所属: Ultralytics
日付: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は、速度と精度のトレードオフを最適化する洗練されたシングルステージ、アンカーフリーアーキテクチャを特徴としています。その効率化されたネットワーク設計により、パラメータ数と計算負荷が削減され、より高速な推論速度とより低いメモリ要件につながります。この効率性により、YOLO11は、NVIDIA Jetsonのようなリソースに制約のあるエッジデバイスから強力なクラウドサーバーまで、多様なハードウェアへの展開に最適です。
YOLO11の最大の強みの1つは、その汎用性です。これは単なる物体検出モデルではなく、インスタンスセグメンテーション、画像分類、姿勢推定、および傾斜バウンディングボックス(OBB)をサポートする包括的なビジョンフレームワークです。このマルチタスク機能は、使いやすさで知られるUltralyticsエコシステムにシームレスに統合されています。シンプルなPython APIとCLI、豊富なドキュメント、および支援的なコミュニティにより、開発者はすぐに始めることができます。このエコシステムには、ノーコードでトレーニングとデプロイメントを行うためのUltralytics HUBなどのツールも含まれており、参入障壁をさらに下げています。
長所
- 優れたパフォーマンスバランス: 速度と精度の優れたトレードオフを実現し、多くの場合、より少ないパラメータで競合製品を上回ります。
- 卓越した効率性: CPUとGPUの両方での高速推論に最適化されており、トレーニングとデプロイメント中のメモリ使用量が少なくなっています。
- 比類なき汎用性: 単一のフレームワークが幅広いビジョンタスクをサポートし、複雑なプロジェクトに統合されたソリューションを提供します。
- 使いやすさ: シンプルなAPI、包括的なドキュメント、および豊富なチュートリアルにより、ユーザーエクスペリエンスが効率化されています。
- 優れた維持管理体制のエコシステム: 活発な開発、頻繁なアップデート、強力なコミュニティサポート、MLOpsツールとのシームレスな統合の恩恵を受けています。
- Efficient Training: 事前学習済みの重みと最適化されたトレーニングルーチンが付属しているため、開発サイクルを高速化できます。
弱点
- ワンステージ検出器として、特殊なツーステージ検出器と比較して、密集したシーンで極端に小さいオブジェクトに対して課題が生じる可能性があります。
- YOLO11xのような最大のモデルは、リアルタイム性能を達成するためにかなりの計算リソースを必要としますが、これは高精度なモデルに共通する特徴です。
ユースケース
YOLO11は、速度、精度、汎用性を兼ね備えているため、幅広い要求の厳しいアプリケーションに最適です。
- 産業オートメーション: 製造業における品質管理とロボティクス。
- スマートシティ: リアルタイムの交通監視と公共セキュリティシステムを強化します。
- 小売分析: 在庫管理の強化と盗難防止。
- Healthcare: より迅速な診断のために、医療画像解析を支援します。
PP-YOLOE+: PaddlePaddleエコシステム内での高精度
PP-YOLOE+は、Baiduによって開発され、PaddleDetectionスイートの一部として2022年にリリースされた物体検出モデルです。これは、特にPaddlePaddle深層学習フレームワーク内で、妥当な効率を維持しながら高い精度を達成することに重点を置いた、アンカーフリーのシングルステージ検出器です。
著者: PaddlePaddle Authors
組織: Baidu
日付: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
ドキュメント: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
アーキテクチャと主な機能
PP-YOLOE+は、検出ヘッドを簡素化するために、アンカーフリー設計も採用しています。そのアーキテクチャは、多くの場合、CSPRepResNetのようなバックボーンを使用し、Varifocal Lossや効率的なET-Headなどの手法を組み込んで、パフォーマンスを向上させます。このモデルは、PaddlePaddleエコシステム向けに高度に最適化されており、それがコアな設計上の考慮事項となっています。
長所と短所
PP-YOLOE+は、特に大型モデルバリアントで高いmAPスコアを実現する、優れた性能を発揮します。ただし、主な弱点はエコシステムへの依存です。PyTorchを使用している大多数の開発者や研究者にとって、PaddlePaddleに縛られることは、大きな学習コストと統合の課題をもたらす可能性があります。さらに、パフォーマンスの表に示すように、そのモデルはYOLO11と同等の精度を達成するために、より多くのパラメータとFLOPを必要とすることが多く、計算効率が低下します。
ユースケース
PP-YOLOE+ は、高い精度が最も重要であり、開発環境がすでに PaddlePaddle に基づいているアプリケーションに最適です。
- 産業検査: 製造ラインにおける欠陥の検出。
- 小売: 在庫チェックと分析の自動化。
- リサイクル: 自動選別のための材料を識別します。
性能分析:YOLO11 vs. PP-YOLOE+
パフォーマンス指標を比較すると、Ultralytics YOLO11は、最先端の精度を提供しながら、効率と速度において明確な優位性を示しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
- 精度 vs. 効率性: YOLO11は、同程度のモデル規模(例:YOLO11m vs. PP-YOLOE+m)において、PP-YOLOE+よりも一貫して高いmAPスコアを達成しています。重要なのは、それをより少ないパラメータとFLOPsで実現していることです。例えば、YOLO11xはPP-YOLOE+xのmAPに匹敵しますが、パラメータはわずか58%、FLOPsも少ないため、はるかに効率的なモデルとなっています。
- 推論速度: YOLO11は全体的に大幅に高速です。T4 GPUでは、すべてのYOLO11バリアントがPP-YOLOE+の対応するものより優れています。YOLO11のCPUベンチマークが利用可能であることは、専用GPUのないアプリケーションにとって重要な利点である、そのデプロイメントの柔軟性をさらに強調しています。
トレーニング、ユーザビリティ、およびエコシステム
生の性能だけでなく、開発者の体験もUltralytics YOLO11が真価を発揮する点です。Ultralyticsのエコシステムは、最も人気のある深層学習フレームワークであるPyTorch上に構築されており、大規模なコミュニティ、豊富なリソース、幅広いハードウェアサポートを保証します。トレーニング、検証、デプロイメントは、シンプルで直感的なコマンドに集約されています。
対照的に、PP-YOLOE+はPaddlePaddleフレームワークに限定されています。強力ではありますが、このエコシステムはあまり普及しておらず、学習曲線が急になる可能性があり、コミュニティが提供するリソースが少なく、他のツールとの統合時に摩擦が生じる可能性があります。YOLO11のトレーニングプロセスとメモリ使用量も高度に最適化されており、より広範なハードウェアでの迅速な実験とデプロイが可能です。
結論: YOLO11が推奨される理由
PP-YOLOE+は推奨に値する物体検出モデルですが、Ultralytics YOLO11は、圧倒的多数のユースケースにおいて優れた選択肢です。 最先端の精度、卓越した推論速度、および卓越した計算効率の、より説得力のあるパッケージを提供します。
YOLO11の主な利点は次のとおりです。
- Better Overall Performance: より少ない計算リソースでより高い精度を実現します。
- より高い汎用性: 複数のビジョンタスクに対応する、単一の統合フレームワークです。
- 比類なき使いやすさ: 開発を加速するユーザーフレンドリーなAPIとエコシステム。
- より広範なコミュニティとサポート: PyTorch上に構築され、活発なUltralyticsチームとコミュニティによってサポートされています。
強力で柔軟性があり、使いやすいビジョンAIモデルを求める開発者や研究者にとって、YOLO11は明確な勝者であり、より速く効率的に最先端のアプリケーションを作成できます。
その他のモデルを見る
さまざまなアーキテクチャを検討している場合は、Ultralyticsエコシステム内で利用可能な他の最先端モデルにも興味があるかもしれません。他の比較ページもチェックしてみてください。