PP-YOLOE+とYOLO11:包括的な技術比較
最適な物体検出モデルを選択するには、アーキテクチャ、推論速度、統合能力を慎重に分析する必要がある。このガイドでは、BaiduPaddlePaddle エコシステムの高精度モデルであるPP-YOLOE+と、Ultralyticsの高精度モデルの詳細な技術比較を提供します。 Ultralytics YOLO11YOLO シリーズにおける最新の最先端進化版である。どちらのフレームワークも強力な検出機能を提供する一方、YOLO11 優れた計算効率、統一されたマルチタスク・フレームワーク、開発者にとっての比類なき使いやすさによって、その優位性を際立たせている。
PP-YOLOE+:PaddlePaddle 高精度
PP-YOLOE+は、百度の研究者によって開発されたPP-YOLOEの進化版である。PP-YOLOE+は、学習収束速度と下流タスクのパフォーマンスを向上させるために設計された、アンカーフリーのシングルステージ物体検出器である。PaddlePaddle フレームワーク内に厳密に構築され、CSPRepResNetバックボーンと動的ラベル割り当て戦略を利用して、COCOようなベンチマークで競争力のある精度を達成している。
著者 PaddlePaddle Authors
Organization:Baidu
Date:2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
DocsPaddlePaddle
主な建築上の特徴
PP-YOLOE+のアーキテクチャは、速度と精度のトレードオフを改善することに重点を置いています。分類タスクとローカリゼーションタスクのバランスをより良くするために、ET-Head(Efficient Task-aligned Head)を組み込んでいる。このモデルは、タスクアライメント学習(TAL)として知られるラベル割り当てメカニズムを採用しており、学習中に高品質の陽性を選択するのに役立つ。しかし、PaddlePaddle エコシステムに大きく依存しているため、PyTorchワークフローに統合するには、複雑なモデル変換プロセスが必要になることが多い。
Ultralytics YOLO11:ビジョンAIの新基準
Ultralytics YOLO11 、リアルタイム・コンピューター・ビジョンの最先端を象徴しています。Glenn JocherとJing Qiuによって設計され、YOLOv8の成功の上に構築されています。 YOLOv8の成功に基づき、より速く、より正確で、より効率的なモデルを提供します。YOLO11 11は、単なる物体検出器ではなく、インスタンスのセグメンテーション、ポーズ推定、画像分類、OBB(Oriented Bounding Box)検出を単一の統一されたコードベースで処理できる汎用性の高い基盤モデルです。
著者Glenn Jocher, Jing Qiu
組織:Ultralytics
日付:2024-09-27
GitHubultralytics
Docsyolo11
アーキテクチャと利点
YOLO11 、計算オーバーヘッドを最小限に抑えながら、特徴抽出効率を最大化する洗練されたアーキテクチャを導入している。強化されたバックボーンとヘッド設計を採用することで、前世代やPP-YOLOE+のような競合製品に比べて、パラメータ総数を削減している。この複雑性の低減により、精度を犠牲にすることなく、エッジデバイスとクラウドGPUの両方で推論速度を高速化することができる。さらに、YOLO11 11はメモリ効率を念頭に置いて設計されており、トランスフォーマーベースのモデルや旧来のヘビーなアーキテクチャと比較して、トレーニング時に必要なGPU メモリが少なくて済みます。
パフォーマンス分析指標とベンチマーク
パフォーマンスメトリクスの比較により、2つのモデルの効率性とスケーラビリティの明確な違いが明らかになった。YOLO11 、特に必要とされる計算資源を考慮した場合、速度と精度のバランスにおいて一貫して優れた結果を示しています。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
効率とスピードの解釈
このデータは、YOLO11 モデルの効率性において大きな優位性を持っていることを浮き彫りにしている。例えば、YOLO11xは、PP-YOLOE+xの54.7mAP匹敵しますが、PaddlePaddle モデルの98.42Mという膨大なパラメータに比べ、わずか56.9Mのパラメータでこれを達成しています。これは、モデルサイズを40%以上削減したことを意味し、ストレージ要件の削減とロード時間の短縮に直結します。
リアルタイム推論に関しては、YOLO11 T4GPU ベンチマークにおいて、すべてのモデルサイズでPP-YOLOE+を上回った。この差は、自律走行や高速産業選別のようなレイテンシに敏感なアプリケーションには不可欠です。さらに、YOLO11 CPU ベンチマークが利用可能であることは、専用アクセラレーターのないものも含め、多様なハードウェア環境への最適化を強調しています。
トレーニング方法と使いやすさ
この2つのモデルのユーザー・エクスペリエンスは大きく異なるが、その主な原因は、その基盤となるエコシステムにある。
Ultralytics エコシステムの優位性
Ultralytics YOLO11 、開発者の生産性を優先し、成熟し、よく整備されたエコシステムから恩恵を受けています。
- 使いやすさ:シンプルなPython APIにより、開発者はわずか数行のコードでモデルのロード、トレーニング、デプロイが可能です。参入障壁が非常に低いため、初心者でも専門家でも高度なAIにアクセスできます。
- トレーニングの効率化: YOLO11 、すぐに利用可能な事前学習済みの重みを用いた効率的な学習をサポートする。このフレームワークは、データの増強やハイパーパラメータのチューニングといった複雑なタスクを自動的に処理する。
- メモリ要件: YOLO モデルは、他のアーキテクチャと比較して、トレーニング中に消費するCUDA メモリがより少なくなるように最適化されているため、コンシューマーグレードのハードウェアでより大きなバッチや高解像度のトレーニングを行うことができます。
シンプルなPython インターフェース
カスタムデータセットでYOLO11 モデルをトレーニングするのは、YAMLファイルを指すのと同じくらい簡単だ:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
model.train(data="coco8.yaml", epochs=100, imgsz=640)
PP-YOLOE+ ワークフロー
PP-YOLOE+で作業するには、一般的にPaddlePaddle フレームワークを採用する必要がある。強力ではありますが、このエコシステムはPyTorchユビキタスではないため、PyTorch TensorFlow 環境ですでに確立しているチームにとっては、学習曲線が急になる可能性があります。カスタムトレーニングでは、合理化されたプログラムインターフェイスを使用するのではなく、複雑な設定ファイルを修正する必要がある場合が多く、コミュニティのリソースは拡大しているものの、グローバルなYOLO コミュニティと比較すると充実していない。
汎用性と実世界での応用
両者の大きな違いは、その汎用性にある。PP-YOLOE+は主に物体検出に重点を置いている。対照的に、YOLO11 11はマルチタスクに強い。
YOLO11:検出を超えて
YOLO11アーキテクチャーは、幅広いコンピューター・ビジョン・タスクをサポートしている:
- インスタンス分割: 医療画像解析や 自律走行車の知覚のようなアプリケーションのために、オブジェクトの輪郭を正確に描画します。
- ポーズ推定: スポーツ分析や理学療法モニタリングのためのキーポイントのトラッキング。
- OBB(Oriented Bounding Boxes): 航空画像や衛星の解析に不可欠な回転したオブジェクトの検出。
理想的なユースケース
- 製造と品質管理: YOLO11高速性は、迅速な組立ラインに対応し、リアルタイムで欠陥を検出します。セグメンテーション機能により、欠陥の正確な形状を特定することができます。
- エッジコンピューティング: 性能バランスとパラメータ数の少なさから、YOLO11 11はNVIDIA JetsonやRaspberry Piのようなエッジ・デバイスへの展開に最適です。
- スマートシティ 交通監視のようなアプリケーションでは、YOLO11物体をtrack し、速度を推定する機能は、1つのモデルで包括的なソリューションを提供します。
結論推奨される選択
PP-YOLOE+はPaddlePaddle 範囲内で有能な検出器であることに変わりはない、 Ultralytics YOLO11は、大多数の開発者や研究者にとって、より優れた選択肢として際立っています。
YOLO11 、速度と精度のトレードオフをより有利にし、より少ない計算リソースを消費し、複数のビジョンタスクに比類のない汎用性を提供します。活発なコミュニティ、広範なドキュメント、Ultralytics HUBのようなツールとのシームレスな統合と相まって、YOLO11 、ユーザーがより高い効率性と容易さで堅牢なAIソリューションを構築し、展開できるようにします。
フレームワークに縛られることなく、最新のコンピュータービジョンの可能性を最大限に活用しようとする人にとって、YOLO11 11は決定的な前進の道となる。
その他の比較
YOLO11 競合他社とどのような位置づけにあるかをさらに理解するには、他の詳細な比較をご覧ください: