YOLO11 PP-YOLOE+: リアルタイム検出器の技術的比較
コンピュータービジョンアプリケーションを本番環境に展開する際、最適なニューラルネットワークアーキテクチャの選択は極めて重要です。本技術比較では、リアルタイム物体検出分野における二つの主要モデルを検証します: Ultralytics YOLO11 とBaiduのPP-YOLOE+を検証します。両アーキテクチャは堅牢な性能を提供しますが、精度・推論速度・開発者エコシステムへの対応において全く異なるアプローチを取っています。
以下は、これらのモデルの性能限界を示すインタラクティブチャートです。ハードウェア制約に最適なモデルを特定するお手伝いをします。
モデルの起源と技術的系譜
これらのモデルの起源と設計思想を理解することは、それぞれの強みと理想的な使用事例を理解する上で貴重な背景情報を提供します。
YOLO11
Ultralytics開発されたYOLO11 、高速推論、極限のパラメータ効率、比類のない使いやすさのバランスを優先した、YOLO 高度に洗練された進化YOLO11 。統一されたマルチタスク機能とPython で広く認知されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- ドキュメント:YOLO11ドキュメント
PP-YOLOE+ 詳細
PP-YOLOE+は、PaddlePaddle を基盤として構築されたPP-YOLOv2の進化版です。CSPRepResNetバックボーンやタスクアラインメント学習(TAL)といったアーキテクチャの変更を導入し、特に高性能GPUにおいて精度限界の突破を図っています。
- 著者: PaddlePaddle Authors
- 組織:Baidu
- 日付: 2022-04-02
- Arxiv:https://arxiv.org/abs/2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- ドキュメント:PP-YOLOE+ 設定ドキュメント
アーキテクチャの違い
YOLO11 の基本的なアーキテクチャ設計は、コンピュータビジョン分野における両者の異なる優先順位を反映している。
YOLO11 高度に最適化されたバックボーンとアンカーフリー検出ヘッドを基盤としています。C3k2ブロックと高速空間ピラミッドプーリング(SPPF)を活用し、最小限の計算オーバーヘッドでマルチスケール特徴を捕捉します。この設計は、エッジNPUやモバイルCPUなどのリソース制約デバイスにおける推論遅延の低減に極めて有利です。 さらに、YOLO11 マルチタスク学習をネイティブにサポートする設計YOLO11 、インスタンスセグメンテーション、姿勢推定、方向付き境界ボックス(OBB)検出を標準で即座に実行可能です。
PP-YOLOE+は、CSPRepResNetバックボーンと効率的なタスク整合ヘッド(ET-head)を導入する。学習時には表現能力を高めるためrepパラメータ化技術を多用しつつ、推論時にはそれらのパラメータを標準的な畳み込みに組み込む。 これにより平均精度(mAP)は高い値を示すが、結果として生成されるモデルはパラメータ数とメモリ使用量が増加する傾向にある。そのため軽量なエッジデバイスよりも、堅牢なサーバーGPU上での展開に適している。
マルチタスクの汎用性
プロジェクトで標準的なバウンディングボックスを超える拡張が必要な場合、Ultralytics YOLO11 セグメンテーション、姿勢推定、分類を同一API内でネイティブYOLO11 。これにより、複数の別々のリポジトリを統合する場合と比較して開発オーバーヘッドを大幅に削減できます。
性能とベンチマーク
性能評価においては、精度(mAP)、各種ハードウェアにおける推論速度、およびモデルの効率性(パラメータ数とFLOPs)を検証します。下表は比較指標をまとめたもので、最も効率的または高性能な値を太字で示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
分析
YOLO11 明らかな優位性をYOLO11 性能バランス およびパラメータ効率。例えば、 YOLO11m より高いmAP 51.5)を達成する PP-YOLOE+m (49.8) より少ないパラメータ数(20.1M 対 23.43M)を活用しながら、TensorRT 大幅に高速化TensorRT 4.7ms 対 5.56ms)しています。YOLO11 、本質的に両方の処理におけるメモリ要件の低減につながります。 モデルのトレーニング および展開。
トレーニングエコシステムと使いやすさ
モデルの真の価値は、開発者がカスタムのコンピュータビジョンデータセットでどれだけ容易に学習させ、本番環境にデプロイできるかにしばしばある。
Ultralyticsの利点
Ultralytics 、効率化された開発者体験をUltralytics 。YOLO11 トレーニングYOLO11 Python CLIを通じてYOLO11 、複雑な定型コードを抽象化します。Ultralytics はさらに、ノーコードトレーニング、自動化されたデータセット管理、ワンクリックでの ONNX、CoreML、 TensorRTなどの形式へのワンクリックエクスポートを提供することで、これをさらに強化します。
さらに、YOLO トレーニング中に非常にメモリ効率が高く、トランスフォーマーベースのアーキテクチャや重厚な反復パラメータ化モデルに典型的な膨大なVRAMオーバーヘッドを回避するため、コンシューマーグレードのハードウェアでのトレーニングを可能にします。
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
PP-YOLOE+ エコシステム
PP-YOLOE+はPaddleDetectionエコシステム内で動作します。このフレームワークは強力で百度の産業ソリューションと深く統合されていますが、開発者はPaddlePaddle を採用する必要があります。これにより、PyTorch標準化しているチームにとっては学習曲線が急峻になる可能性があります。 さらに、PP-YOLOE+モデルをエッジデバイス向けの標準的な汎用フォーマットにエクスポートする場合、Ultralytics に組み込まれたネイティブエクスポートパイプラインと比較して、追加の変換ステップが必要となる場合があります。
理想的なユースケース
これらのモデルの中から選択するには、お客様の具体的な導入環境によって異なります。
- YOLO11、アジャイル開発、エッジコンピューティング、モバイルアプリケーションに最適です。高い推論速度、低いメモリ使用量、豊富なエクスポート機能により、標準CPUでのリアルタイム小売在庫管理、ドローンによる航空画像分析、複雑なマルチタスクパイプラインなどのタスクに理想的です。
- PP-YOLOE+を選択すべきなのは、生産パイプライン全体がPaddlePaddle に大きく依存している場合、またはメモリ制約やハードウェア互換性(Paddleの最適化ハードウェア以外)が主要な懸念事項ではない、ハイエンドの専用推論サーバーにデプロイする場合です。
次世代:YOLO26のご紹介
YOLO11 非常に強力YOLO11 、AI分野は急速に進化しています。物体検出における絶対的な最先端技術として、Ultralytics 新たな YOLO26を発表しました。2026年1月にリリースされたYOLO26は、前世代の成功を基盤としつつ、これまでにない効率性と精度を実現しています。
YOLO26の主な革新点:
- エンドツーエンドNMS:YOLO26は非最大抑制(NMS)後処理をネイティブに排除します。これにより推論が大幅に高速化され、展開ロジックが簡素化されます。これは YOLOv10によって初めて実現されたアーキテクチャ上の飛躍です。
- 最大43%高速CPU :GPU非搭載のエッジデバイス向けに最適化され、低消費電力ハードウェア上でリアルタイム性能を保証します。
- MuSGDオプティマイザ:LLMトレーニングの安定性に着想を得た、SGD ミューオンのハイブリッド手法により、収束速度の向上とトレーニングの安定性を実現します。
- ProgLoss + STAL:改良された損失関数は、ドローン応用やセキュリティ監視において極めて重要な微小物体認識を劇的に向上させる。
- DFL除去:ディストリビューション・フォーカル・ロス(DFL)を除去することで、モデルエクスポートが簡素化され、幅広いエッジデバイス間での互換性が劇的に向上します。
新規プロジェクトにおいて、スピード、シームレスなエクスポート、そして最大限の精度を優先する場合、Ultralytics を介したYOLO26の機能を活用することを強く推奨します。
他のアーキテクチャを評価している場合、YOLO11 RT-DETR や、従来の YOLOv8 が現代のベンチマークでどの程度通用するかを探るのも興味深いでしょう。