Link to this sectionYOLO11対PP-YOLOE+の比較#
コンピュータビジョンアプリケーションを本番環境へデプロイする際、最適なニューラルネットワークアーキテクチャを選択することは極めて重要です。本テクニカル比較では、リアルタイム物体検出分野で著名な2つのモデル、Ultralytics YOLO11とBaiduのPP-YOLOE+を検証します。両アーキテクチャとも堅牢なパフォーマンスを提供しますが、精度、推論速度、開発者エコシステムの課題に対するアプローチは大きく異なります。
以下は、これらモデルのパフォーマンス境界を示すインタラクティブなチャートです。ハードウェア制約に最適なモデルを見つけるための参考にしてください。
Link to this sectionモデルの起源と技術的系譜#
これらモデルの起源と設計哲学を理解することは、それぞれの強みと理想的なユースケースを知る上で重要な文脈となります。
Link to this sectionYOLO11の詳細#
Ultralyticsによって開発されたYOLO11は、YOLOシリーズを高度に洗練させたモデルであり、高速推論、極めて高いパラメータ効率、そして比類のない使いやすさのバランスを重視しています。統合されたマルチタスク機能と、開発者に優しいPython APIで広く知られています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: YOLO11ドキュメント
Link to this sectionPP-YOLOE+の詳細#
PP-YOLOE+は、PaddlePaddleフレームワークに基づいて構築されたPP-YOLOv2の進化版です。CSPRepResNetバックボーンやTask Alignment Learning (TAL) などのアーキテクチャ変更を導入し、特にハイエンドGPUにおける精度の限界を押し広げています。
- 著者: PaddlePaddle 著者陣
- 組織: Baidu
- 日付: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- ドキュメント: PP-YOLOE+ 設定ドキュメント
Link to this sectionアーキテクチャの違い#
YOLO11とPP-YOLOE+の根本的なアーキテクチャ設計は、コンピュータビジョン分野における両者の優先順位の違いを反映しています。
YOLO11は、高度に最適化されたバックボーンとアンカーフリーの検出ヘッドの上に構築されています。C3k2ブロックとSpatial Pyramid Pooling - Fast (SPPF) を活用して、計算オーバーヘッドを最小限に抑えつつマルチスケールな特徴を捉えます。この設計は、エッジNPUやモバイルCPUのようなリソース制約のあるデバイスにおける推論レイテンシを低減する上で非常に有利です。さらに、YOLO11はマルチタスク学習用にネイティブ設計されており、インスタンスセグメンテーション、姿勢推定、指向性バウンディングボックス(OBB)検出をそのまま実行可能です。
**PP-YOLOE+**は、CSPRepResNetバックボーンとEfficient Task-aligned head (ET-head) を導入しています。トレーニング中に表現能力を高めるためにレップパラメータ化技術を多用し、推論時にはそれらのパラメータを標準的な畳み込みに統合します。これにより素晴らしい平均適合率(mAP)を実現しますが、結果としてモデルのパラメータ数やメモリ消費量は大きくなる傾向があり、軽量なエッジデバイスよりも堅牢なサーバーGPUへのデプロイに適しています。
標準的なバウンディングボックスを超えた機能が必要なプロジェクトであれば、Ultralytics YOLO11はセグメンテーション、姿勢推定、分類を同一のAPI内でネイティブにサポートしており、複数の異なるリポジトリを統合する場合と比較して開発オーバーヘッドを大幅に削減できます。
Link to this section性能とベンチマーク#
パフォーマンスを評価する際は、精度(mAP)、様々なハードウェアでの推論速度、およびモデル効率(パラメータ数とFLOPs)を検討します。以下の表は比較メトリクスをハイライトしたもので、最も効率的または最高パフォーマンスの値は太字で示されています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Link to this section分析#
YOLO11は、パフォーマンスバランスとパラメータ効率において明確な優位性を示しています。例えば、YOLO11mはPP-YOLOE+m(49.8)よりも高いmAP(51.5)を達成しつつ、パラメータ数は少なく(20.1M vs 23.43M)、TensorRT上での推論速度も大幅に高速(4.7ms vs 5.56ms)です。YOLO11モデルの軽量性は、モデルトレーニング時およびデプロイ時の両方で、メモリ要件の低減に直結します。
Link to this sectionトレーニングエコシステムと使いやすさ#
モデルの真の価値は、開発者がカスタムのコンピュータビジョンデータセットでどれだけ簡単にトレーニングし、本番環境にデプロイできるかにあることがよくあります。
Link to this sectionUltralyticsの利点#
Ultralyticsは効率化された開発者体験を優先しています。YOLO11のトレーニングはシンプルなPython APIまたはCLIで管理され、複雑なボイラープレートコードを抽象化します。Ultralytics Platformは、ノーコードトレーニング、自動化されたデータセット管理、およびONNX、CoreML、TensorRTなどのフォーマットへのシングルクリックエクスポートを提供することで、これをさらに強化します。
さらに、YOLOモデルはトレーニング時のメモリ効率が高く、Transformerベースのアーキテクチャや重いレップパラメータ化モデルに特有の巨大なVRAMオーバーヘッドを回避し、コンシューマー向けハードウェアでのトレーニングを可能にします。
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()Link to this sectionPP-YOLOE+エコシステム#
PP-YOLOE+はPaddleDetectionエコシステム内で動作します。このフレームワークは強力でBaiduの産業ソリューションと深く統合されていますが、開発者は特定のPaddlePaddleディープラーニングフレームワークを採用する必要があります。これは、既にPyTorchに標準化されているチームにとっては学習曲線が急になる可能性があります。さらに、PP-YOLOE+モデルをエッジデバイス用の標準的なユニバーサルフォーマットへエクスポートする場合、Ultralyticsワークフローで見られるネイティブなエクスポートパイプラインと比較して、追加の変換手順が必要になることがあります。
Link to this section理想的なユースケース#
これらのモデルの選択は、特定のデプロイ環境に依存します。
- アジャイルな開発、エッジコンピューティング、およびモバイルアプリケーションにはYOLO11を選択してください。その高速な推論速度、低メモリ消費量、および広範なエクスポート機能は、標準CPU上でのリアルタイムな小売在庫管理、ドローンによる航空画像解析、および複雑なマルチタスクパイプラインといったタスクに最適です。
- 本番パイプライン全体が既にPaddlePaddleエコシステムに大きく依存している場合、またはメモリ制約や(Paddleの最適化済みハードウェア以外での)ハードウェア互換性が主要な懸念事項ではないハイエンドの専用推論サーバーへデプロイする場合は、PP-YOLOE+を選択してください。
Link to this section次世代: YOLO26の導入#
YOLO11は依然として非常に強力ですが、AI分野の進歩は速いです。物体検出の絶対的な最先端として、Ultralyticsは新しい**YOLO26**を導入しました。2026年1月にリリースされたYOLO26は、前モデルの成功を基盤として、前例のない効率性と精度を実現しています。
YOLO26の主な革新:
- エンドツーエンドのNMSフリー設計: YOLO26は、非最大値抑制(NMS)の後処理をネイティブに排除します。これにより推論が大幅に高速化され、デプロイロジックが簡素化されます。このアーキテクチャの飛躍は、YOLOv10で初めて先駆けて導入されました。
- CPU推論が最大43%高速化: GPUを持たないエッジデバイス向けに特別に最適化されており、低電力ハードウェア上でもリアルタイムパフォーマンスを保証します。
- MuSGDオプティマイザ: LLMのトレーニング安定性に触発された、SGDとMuonのハイブリッドにより、より速い収束とより安定したトレーニングを保証します。
- ProgLoss + STAL: 改良された損失関数は、ドローンアプリケーションやセキュリティ監視に不可欠な、小さな物体の認識性能を劇的に向上させます。
- DFLの削除: Distribution Focal Lossを削除したことで、モデルのエクスポートが簡素化され、広範囲のエッジデバイス全体での互換性が劇的に向上しました。
速度、シームレスなエクスポート、そして最大の精度を優先する新しいプロジェクトには、Ultralytics Platformを通じてYOLO26の機能活用を強く推奨します。
他のアーキテクチャを評価中であれば、YOLO11とRT-DETRの比較、またはレガシーなYOLOv8が現代のベンチマークでどのような位置づけにあるかを探ることもお勧めします。