Ultralytics YOLO26 vs. PP-YOLOE+: 技術比較
リアルタイム物体検出の状況は常に進化しており、研究者やエンジニアは精度、速度、デプロイの容易さの最適なバランスを追求しています。この分野における2つの著名なモデルは、Ultralytics YOLO26とPP-YOLOE+です。両モデルともコンピュータビジョンにおいて重要な進歩を遂げていますが、それぞれ異なるエコシステムのニーズとアーキテクチャ哲学に対応しています。
このガイドでは、両モデルのアーキテクチャ、性能指標、実世界アプリケーションへの適合性を分析し、包括的な技術比較を提供します。YOLO26の現代的なイノベーションが、PP-YOLOE+の確立されたフレームワークとどのように対照的であるかを探ります。
モデルの概要と起源
これらのモデルの系譜を理解することは、それらの設計目標と対象ユーザー層を明確にするのに役立ちます。
Ultralytics YOLO26
2026年1月にUltralyticsのGlenn JocherとJing QiuによってリリースされたYOLO26は、有名なYOLOシリーズの最新の進化を表しています。エッジデバイスおよび低電力デバイス向けに特別に設計されており、ネイティブなエンドツーエンド効率に焦点を当てています。
主な革新には、合理化された推論のためのNon-Maximum Suppression (NMS) の削除、MuSGDオプティマイザ (Moonshot AIのKimi K2に触発されたもの) の導入、およびDistribution Focal Loss (DFL) の削除のような大幅なアーキテクチャの簡素化が含まれます。これらの変更により、精度を犠牲にすることなく速度とシンプルさを必要とする開発者にとって堅牢な選択肢となります。
PP-YOLOE+
PP-YOLOE+は、BaiduのPaddlePaddleチームによって開発されたPP-YOLOEのアップグレード版です。2022年4月頃にリリースされ、PaddlePaddleディープラーニングフレームワーク上に構築されています。CSPRepResStageバックボーンの改良と、TAL (Task Alignment Learning) として知られる動的なラベル割り当て戦略の利用に焦点を当てています。非常に高性能ですが、PaddlePaddleエコシステムと密接に結合しており、これはPyTorchや他のフレームワークに慣れているユーザーのデプロイ選択に影響を与える可能性があります。
アーキテクチャと設計思想
これら2つのモデルの核となる違いは、ラベル割り当て、後処理、および学習最適化の処理方法にあります。
YOLO26: エンドツーエンドの革命
YOLO26は特徴的にエンドツーエンドであり、個別のNMS後処理ステップを必要とせずに、ネットワークから直接最終予測を生成することを意味します。YOLOv10で先駆的に採用されたこの設計選択は、NMSしきい値の調整に関連するレイテンシと複雑さを排除します。
- DFLの削除: Distribution Focal Lossを削除することで、YOLO26はモデルグラフを簡素化し、ONNXやTensorRTのようなエクスポート形式をよりクリーンにし、エッジハードウェアとの互換性を高めます。
- MuSGD オプティマイザー: SGDとMuonのハイブリッドであるこのオプティマイザーは、LLMトレーニングで見られる安定性の向上をコンピュータビジョンにもたらし、より高速な収束を保証します。
- 小物体への注力: ProgLossやSmall-Target-Aware Label Assignment (STAL)といった機能は、航空画像やドローンアプリケーションに不可欠なsmall object detectionの改善を特に目的としています。
PP-YOLOE+: 洗練されたアンカーフリー検出
PP-YOLOE+はアンカーフリーのパラダイムに従いますが、YOLO26のエンドツーエンドのアプローチと比較して、より伝統的な後処理パイプラインに依存しています。
- バックボーン: rep-vggスタイルのブロックとCSP (Cross Stage Partial) 接続を組み合わせたCSPRepResStageバックボーンを利用しています。
- ラベル割り当て: Task Alignment Learning (TAL) を採用しており、分類スコアと局所化品質を動的に整合させます。
- 焦点:「Plus」バージョンは、より優れた事前学習済み重みで初期化することにより、トレーニング速度と収束の改善を重視しており、多くの場合、Objects365で初期化されます。
なぜエンドツーエンドが重要なのか
エッジデプロイメントでは、1ミリ秒が重要です。エンドツーエンドのNMSフリー設計により、モデル出力はすぐに使用できます。Raspberry Piのような限られたハードウェアで動作する従来の検出器における一般的なボトルネックである、数千の候補ボックスに対するCPU負荷の高いソートやフィルタリングは不要です。
性能指標の比較
以下の表は、COCOデータセットにおけるYOLO26とPP-YOLOE+のパフォーマンスを比較したものです。YOLO26は、特にパラメーター数と推論速度において優れた効率性を示し、最新のハードウェア向けに最適化されていることを強調しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
主なポイント:
- 効率性:YOLO26nは、PP-YOLOE+t(39.9 mAP)よりも高い精度(40.9 mAP)を、およそ半分のパラメーター数(2.4M対4.85M)と4分の1のFLOPs(5.4B対19.15B)で達成します。
- 速度:YOLO26はGPU推論(T4 TensorRT)において大幅に高速で、nanoモデルは1.7msを記録し、同等のPP-YOLOE+モデルの2.84msと比較して高速です。
- CPU最適化:YOLO26はCPU向けに明示的に最適化されており、最大43%高速な推論が可能であるため、専用のアクセラレーターを持たないデバイスに最適です。
トレーニングとエコシステム
開発者エクスペリエンスは、モデルアーキテクチャだけでなく、それを取り巻くツールによっても定義されます。
Ultralyticsによる使いやすさ
Ultralyticsはシームレスなユーザーエクスペリエンスを優先しています。YOLO26は、detect、segment、姿勢推定、分類、およびOriented Bounding Boxes (obb)をサポートする統合されたpythonパッケージに組み込まれています。
開発者は、直感的なCLIまたはpython APIを使用して数秒でトレーニングを開始できます:
from ultralytics import YOLO
# Load the YOLO26s model
model = YOLO("yolo26s.pt")
# Train on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
このエコシステムは、簡単なデプロイメントにも及びます。「 export モードは、次のような形式への変換をサポートしています OpenVINO, CoreML、および TensorRT 単一のコマンドで。
PP-YOLOE+とPaddlePaddle
PP-YOLOE+はPaddlePaddleフレームワークに深く統合されています。強力である一方で、Baiduエコシステム内にすでにいないユーザーは、学習曲線が急になることがよくあります。トレーニングには通常、複雑なyamlファイルの構成と特定のPaddleDetectionスクリプトの利用が含まれます。モデルを非Paddle推論エンジンに移植するには、追加の変換ステップ (例: PaddleからONNX、そしてTensorRTへ) が必要になる場合があります。
ユースケースと応用
YOLO26の理想的なシナリオ
- エッジAIとIoT:低FLOPsとDFLの削除により、YOLO26は、Raspberry PiやNVIDIA Jetsonのようなデバイスで優れた性能を発揮します。
- リアルタイムビデオ分析: 高い推論速度により、フレームレートが重要となる交通監視や安全監視に最適です。
- 航空およびドローン画像:STALおよびProgLoss関数は、高高度からの小さなオブジェクトの検出において明確な利点を提供します。
- マルチタスク要件:姿勢推定やインスタンスsegmentをdetectと同時に必要とするプロジェクトは、同じAPIとモデルファミリーを使用できます。
PP-YOLOE+の理想的なシナリオ
- データセンターデプロイメント: 大規模なGPUクラスターが利用可能で、特定のアーキテクチャの好みよりも生のパラメーター効率が重要ではないシナリオ向け。
- PaddlePaddleレガシーシステム:すでにPaddlePaddleインフラストラクチャに多大な投資を行っている組織は、フレームワークを切り替えるよりもPP-YOLOE+にアップグレードする方が簡単だと感じるでしょう。
結論
PP-YOLOE+は依然として有能なdetectorですが、Ultralytics YOLO26は、コンピュータビジョンアプリケーションの大部分において、よりモダンで効率的、かつユーザーフレンドリーなソリューションを提供します。そのエンドツーエンドのNMSフリー設計は、最先端の精度と最小限のリソース使用量と相まって、2026年に堅牢なAIソリューションをデプロイしようとしている開発者にとって、優れた選択肢として位置づけられます。
Ultralyticsエコシステムとのシームレスな統合により、データアノテーションからデプロイまで、ワークフローがスムーズかつ生産的に維持されます。
参考資料
他のオプションや以前の世代のモデルに関心がある方は、以下のドキュメントを参照してください。