PP-YOLOE+ 対 YOLO26: 最先端物体検出
急速に進化するコンピュータビジョンの分野において、適切な物体検出アーキテクチャの選択は、精度・速度・導入容易性のバランスを取る上で極めて重要である。本比較では、PaddlePaddle-YOLOEを改良したPP-YOLOE+と、Ultralytics開発した最新のエッジ最適化型ブレークスルーであるYOLO26を検証する。両モデルはリアルタイム検出における重要なマイルストーンを象徴するが、対応するエコシステムと導入ニーズは異なる。
視覚的パフォーマンス比較
以下の図は、PP-YOLOE+とYOLO26の性能トレードオフを示しており、新しいアーキテクチャによって達成されたレイテンシと精度の向上を強調している。
モデル概要
PP-YOLOE+
PP-YOLOE+は、百度のPaddlePaddle が開発したPP-YOLOEのアップグレード版です。アンカーフリーパラダイムを基盤とし、様々なハードウェアプラットフォームで優れた性能を発揮するクラウド・エッジ統合アーキテクチャを導入しています。特にPaddlePaddle 内において、精度と推論速度のトレードオフの最適化に焦点を当てています。
- 著者: PaddlePaddle Authors
- 組織:Baidu
- 日付:2022年4月2日
- Arxiv:2203.16250
- GitHub:PaddleDetection
- ドキュメント:PP-YOLOE+ドキュメント
YOLO26
Ultralytics YOLO 最新バージョンであり、エッジコンピューティングの効率性を再定義するよう設計されています。2026年1月にリリースされ、ネイティブなNMSを導入し、非最大抑制(NMS)後処理の必要性を排除しました。 分布焦点損失(DFL)の廃止やMuSGDオプティマイザの導入といった大幅な最適化により、YOLO26はCPUや低消費電力デバイスでの高速推論を特に念頭に設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026年1月14日
- GitHub:Ultralytics リポジトリ
- ドキュメント:YOLO26 ドキュメント
技術アーキテクチャとイノベーション
これら二つのモデルの構造上の違いが、特定のタスクへの適性を決定づける。
PP-YOLOE+アーキテクチャ
PP-YOLOE+は、CSPRepResNetバックボーンと、パス集約ネットワーク(PAN)を備えた特徴ピラミッドネットワーク(FPN)を採用し、マルチスケール特徴融合を実現する。主な革新点は以下の通り:
- アンカーフリー設計:アンカーボックスのハイパーパラメータ調整を不要にし、トレーニングパイプラインを簡素化します。
- タスクアラインメント学習(TAL):分類タスクと位置特定タスクを明示的に整合させ、陽性サンプル選択の品質を向上させる。
- ET-Head:精度を維持しながら計算オーバーヘッドを低減する効率的なタスク整合型ヘッド。
ただし、PP-YOLOE+は従来のNMS に依存しており、シーン内で検出された物体の数に応じて遅延変動が生じる可能性がある。
YOLO26 イノベーション
YOLO26はエンドツーエンド検出へのパラダイムシフトを表す。
- NMS:YOLO26はオブジェクトごとに厳密に1つの予測を生成することで、NMS 完全に排除します。これは後処理ロジックがボトルネックとなり得るエッジデバイスへの展開において極めて重要です。
- MuSGDオプティマイザ:大規模言語モデル(LLM)のトレーニングに着想を得た、SGD オン(Moonshot AI社開発)のハイブリッド手法。トレーニングを安定化させ、収束を加速させる。
- ProgLoss + STAL:漸進的損失(Progressive Loss)とソフトタスクアラインメント損失(Soft Task Alignment Loss)の統合は、航空画像やロボティクスにおける一般的な課題である小物体検出の性能を大幅に向上させる。
- DFL除去:ディストリビューションフォーカルロスを除去することでモデルグラフが簡素化され、 ONNX や TFLite などへのエクスポートをよりクリーンにし、多様なハードウェアアクセラレータとの互換性を高めます。
MuSGDを用いたトレーニングの安定性
YOLO26のMuSGDオプティマイザは、LLMトレーニングの安定性をコンピュータビジョンにもたらします。モーメンタムと勾配を適応的に管理することで、広範なハイパーパラメータ調整の必要性を低減し、SGD AdamW少ないエポック数で最適な精度を達成できるようにします。
パフォーマンス指標
以下の表は、COCO におけるPP-YOLOE+とYOLO26の性能を比較したものです。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
主なポイント:
- 効率性:YOLO26モデルは一貫して、より高い精度を達成するために必要なFLOPsとパラメータ数が少ない。例えば、YOLO26xはわずか5570万パラメータで 57 . 5mAP驚異的な精度を達成する一方、PP-YOLOx+は54.7mAP到達するのに9842万パラメータを必要とする。
- 推論速度:YOLO26はGPU(T4TensorRT)上で優れた速度を発揮し、Nanoモデルはわずか1.7ミリ秒で処理を完了します。CPU も顕著で、前世代比最大43%高速CPU を実現し、専用アクセラレータを持たないデバイスに最適です。
- 精度:ナノ/タイニーからエクストララージまでの全スケールにおいて、YOLO26はCOCO mAP でPP-YOLOE+を上回る性能を示した。
エコシステムと使いやすさ
モデルを選択する際には、周囲のエコシステムが単純な指標と同様に重要である。
Ultralyticsエコシステムの利点
Ultralytics (YOLO26を含む)Ultralytics 、統一されたユーザー中心のプラットフォームの恩恵を受けています。
- 合理化されたAPI:一貫したPython 、検出、セグメンテーション、姿勢推定、分類、OBBをシームレスに切り替えられます。
- Ultralytics : Ultralytics は、クラウド上でのデータセット管理、ラベリング、ワンクリックトレーニングのためのノーコードソリューションを提供します。
- ドキュメント:広範かつ頻繁に更新されるドキュメントが、インストールからラズベリーパイなどのエッジデバイスへのデプロイまで、すべてのステップをユーザーに案内します。
- メモリ効率:YOLO26はトレーニング時のメモリ効率を考慮して設計されており、メモリ負荷の高い代替手法と比較して、民生用GPU上でより大きなバッチサイズを可能にします。
PaddlePaddleエコシステム
PaddlePaddle 深く統合されています。強力な一方で、PyTorch慣れたユーザーにとっては学習曲線が急峻な専用ツールチェーン(PaddleDetection)を必要とすることが多いです。PaddlePaddle 優先される環境において特に優れています。
ユースケースと応用
リアルタイムエッジ分析
スマートカメラやドローンなどのエッジデバイス上で動作するアプリケーションにおいては、YOLO26が明らかに優位である。そのエンドツーエンドNMS設計は予測可能な遅延を保証し、これは安全システムにとって極めて重要である。削減されたFLOPs数により、バッテリー駆動のハードウェア上でも効率的に動作可能となる。
産業オートメーション
品質検査など高精度が求められる製造現場では、両モデルとも対応可能です。ただしYOLO26のProgLoss関数は微小欠陥の検出性能を向上させており、生産ライン上の微細な欠陥発見において優位性があります。
複雑な視覚タスク
PP-YOLOE+が主に検出に焦点を当てているのに対し、YOLO26はより幅広いタスクを標準でサポートしている。
- インスタンスセグメンテーション:精密なオブジェクトマスキングのため。
- 姿勢推定: 人間の活動認識において極めて重要である。
- オリエンテッド境界ボックス(OBB):物体が回転する航空測量や海運物流において不可欠である。
マルチタスクの汎用性
PP-YOLOE+とは異なり、Ultralytics 異なるタスクごとに異なるモデルアーキテクチャを必要とせず、単にタスクヘッドを変更するだけでUltralytics 。例えば、 yolo26n-pose.pt 同じ使い慣れたAPIでキーポイント検出を即座に有効にします。
コード例: YOLO26の始め方
Ultralytics Python のおかげで、YOLO26のトレーニングとデプロイは非常に簡単です。以下のコードスニペットは、事前学習済みモデルを読み込み、画像に対して推論を実行する方法を示しています。
from ultralytics import YOLO
# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")
# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
for result in results:
result.show() # Display predictions on screen
result.save("output.jpg") # Save annotated image to disk
結論
PP-YOLOE+とYOLO26のいずれも、コンピュータビジョン分野における印象的な貢献である。PaddlePaddle を既に導入しているチームにとっては、PP-YOLOE+が依然として確固たる選択肢となる。
しかし、大多数の開発者や研究者にとって、Ultralytics 優れたパッケージを提供します。そのエンドツーエンドのアーキテクチャはデプロイメントパイプラインを簡素化し、最先端の精度と記録的な速度により、2026年において最も汎用性の高いモデルとなっています。Ultralytics 堅牢なサポートUltralytics 機能と組み合わせることで、YOLO26は構想から本番環境導入までの時間を大幅に短縮します。
他の現代的なアーキテクチャに関心のあるユーザー向けに、ドキュメントでは以下のような優れた代替案も扱っています YOLO11 やトランスフォーマーベースの RT-DETRなどの優れた代替手法についても解説しています。