YOLO11 PP-YOLOE+: 詳細なアーキテクチャと性能比較
コンピュータビジョンの急速に進化する環境において、適切な物体検出モデルを選択することは、開発速度からデプロイメントのレイテンシに至るまであらゆる要素に影響を与える重要な決定です。本ガイドでは、 Ultralytics YOLO11(2024年末にリリースされた汎用性が高く広く採用されているモデル)と、PaddlePaddle の堅牢な産業用検出器であるPP-YOLOE+との包括的な技術比較を提供します。
これらのアーキテクチャを精度指標、推論速度、使いやすさ、デプロイの汎用性に基づいて分析し、特定のアプリケーションに最適なツールを選択するお手伝いをします。
インタラクティブなパフォーマンスベンチマーク
これらのモデル間のトレードオフを理解するには、標準的なデータセット(例: COCOなどの標準データセットにおける性能を可視化することが不可欠です。下図は平均精度(mAP)と推論速度のバランスを示しており、レイテンシ制約に対する「パレート最適解」を特定するのに役立ちます。
パフォーマンスメトリクス分析
以下の表はモデル性能の詳細な内訳を示しています。Ultralytics YOLO11 優れた効率性を示し、PP-YOLOe+モデルと比較してパラメータ数を大幅に削減しながら高い精度を実現しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Ultralytics YOLO11: アーキテクチャとエコシステム
2024年9月発売 YOLO11 は、従来のYOLO 遺産を基盤とし、特徴抽出効率を最大化するために設計された洗練されたアーキテクチャコンポーネントを導入しています。
主要なアーキテクチャ機能
- C3k2バックボーン:CSP(クロスステージ部分)ボトルネックの進化形であるC3k2ブロックは、勾配の流れを維持しつつ処理速度を向上させるため、高速な畳み込み演算を採用している。
- C2PSA 空間注意機構:C2PSA(Cross-Stage Partial with Spatial Attention)モジュールの導入により、衛星画像解析における一般的な課題である、小さな物体や複雑なテクスチャへのモデルの注目能力が向上します。
- マルチタスクヘッド:多くの競合技術とは異なり、YOLO11 単一フレームワーク内で検出、インスタンスセグメンテーション、姿勢推定、および方向付きバウンディングボックス(OBB)をサポートする統一されたヘッド構造YOLO11 。
YOLO11 :
- 著者:グレン・ヨーカーとチン・チウ
- 組織: Ultralytics
- 日付: 2024年9月27日
- GitHub:ultralytics
- ドキュメント:YOLO11
PP-YOLOE+: アーキテクチャとエコシステム
PP-YOLOE+は、PaddlePaddle 開発したPP-YOLOEのアップグレード版です。百度PaddlePaddle 学習フレームワークを活用し、産業応用向けの強力な基盤として設計されています。
主要なアーキテクチャ機能
- CSPRepResStage:このバックボーンは残差接続と再パラメータ化技術を組み合わせることで、学習時には複雑なモデルを維持しつつ、推論時には効率化を実現します。
- TAL(タスクアラインメント学習):PP-YOLOE+は動的ラベル割り当て戦略を採用し、分類と位置特定タスクを連携させることで、陽性サンプル選択の品質を向上させる。
- アンカーフリー: YOLO11、チューニングに必要なハイパーパラメータの数を削減するため、アンカーフリー手法を採用している。
PP-YOLOE+の詳細:
- 著者: PaddlePaddle Authors
- 組織:Baidu
- 日付: 2022-04-02
- Arxiv:PP-YOLOE:YOLOの進化版
- GitHub:PaddlePaddle
- ドキュメント:PP-YOLOE+ README
比較分析:なぜUltralyticsを選ぶのか?
両モデルとも優れた検出器ですが、Ultralytics YOLO11 使いやすさ、エコシステムサポート、リソース効率の面で明確な優位性をYOLO11 。
1. 使いやすさと実装
最も重要な違いの一つはユーザー体験にあります。Ultralytics 「ゼロ・フリクション」の理念に基づいて設計されています。Python 、開発者はわずか5行未満のコードでモデルの読み込み、トレーニング、デプロイが可能です。
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
対照的に、PP-YOLOE+はPaddleDetectionスイートに依存しています。強力ではありますが、PaddlePaddle の設定ファイルや依存関係を含む、より急峻な学習曲線を必要とすることが多く、標準的なPyTorchに慣れたユーザーにとっては直感的でない可能性があります。 PyTorch ワークフローに慣れたユーザーにとっては直感的でない可能性があります。
2. トレーニング効率とメモリ使用量
Ultralytics YOLO 、効率的なリソース利用で知られています。
- メモリ使用量の削減: YOLO11 コンシューマー向けGPUでのトレーニングにYOLO11 。これは、大量のCUDA 必要とするトランスフォーマー中心のアーキテクチャや旧式の産業用モデルに対する決定的な優位性です。
- 収束速度の向上:最適化されたデフォルトのハイパーパラメータと、モザイクやミックスアップといった拡張手法により、YOLO11 、より少ないエポックで使用可能な精度レベルに収束し、計算コストを削減します。
3. 多機能性とタスク支援
現代のコンピュータビジョンプロジェクトでは、単なるバウンディングボックス以上の機能が必要となることが多々あります。プロジェクトの範囲が拡大しても、Ultralytics フレームワークを切り替える必要なく対応Ultralytics 。
- YOLO11: オブジェクト検出、インスタンスセグメンテーション、姿勢推定、方向付きバウンディングボックス(OBB)、分類をネイティブにサポートします。
- PP-YOLOE+:主に物体検出に焦点を当てています。PaddleDetectionは他のタスクもサポートしていますが、それらはしばしば異なるモデルアーキテクチャと設定パイプラインを必要とします。
合理化されたデプロイメント
Ultralytics YOLO11 、ONNX、TensorRT、CoreML、TFLite を含む10以上の形式に、単一TFLite エクスポートできます: model.export(format='onnx')このネイティブな柔軟性により、研究から生産までのプロセスが大幅に簡素化されます。
ビジョンAIの未来:YOLO26のご紹介
YOLO11 成熟した信頼性の高い選択肢YOLO11 一方、この分野は進化を続けている。最先端を求める開発者向けに、Ultralytics 2026年初頭にYOLO26を Ultralytics 。
YOLO26は、ネイティブにエンドツーエンドでNMS設計を採用した画期的なアーキテクチャを実現し、これは最初に YOLOv10で初めて導入されたネイティブのエンドツーエンドNMSフリー設計により、アーキテクチャに革命をもたらします。ノンマキシマムサプレッション(NMS)後処理と分布焦点損失(DFL)の必要性を排除することで、YOLO26は前世代と比較して最大4CPU を実現します。さらに、SGD ハイブリッドであるMuSGDオプティマイザーを統合し、LLMの革新に着想を得た安定したトレーニングダイナミクスを保証します。
エッジデバイス向けの新規プロジェクトや、可能な限り最高のスループットを必要とするプロジェクトでは、YOLO26の検討を強く推奨します。
実際のユースケース
YOLO11 が優れている点
- エッジAIとIoT:YOLO11n(Nano)は精度とパラメータ数の比率が高いため、ラズベリーパイやモバイル環境での導入に最適です。
- 医療画像処理:セグメンテーションと検出を同時に行う能力により、腫瘍の特定や細胞構造の分析に最適である。
- ロボティクス:そのOBBサポートは、姿勢が重要なロボット把持タスクにおいて極めて重要である。
PP-YOLOE+が適している点
- 百度エコシステム統合:既存インフラが百度のAIクラウドやPaddlePaddlePaddlePaddle ウェアアクセラレータに既に多大な投資を行っている場合、PP-YOLOE+はネイティブ互換性を提供します。
- 固定式産業用カメラ:モデルサイズの制約が少ないサーバーサイド推論においては、PP-YOLOE+が依然として競争力のある選択肢である。
結論
YOLO11 PP-YOLOE+はいずれも優れた物体検出アーキテクチャである。しかし、大多数の研究者や開発者にとって、 Ultralytics YOLO11 (およびより新しいYOLO26)は、性能、使いやすさ、エコシステムサポートの優れたバランスを提供します。タスク間のシームレスな移行が可能であることに加え、豊富なコミュニティリソースとドキュメントが揃っているため、プロジェクトの将来性と拡張性が保証されます。
モデルアーキテクチャの詳細な調査については、当社の比較検討資料をご参照ください RT-DETR または YOLOv10 による初期のリアルタイム効率のブレークスルーに関する比較をご参照ください。