Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 と PP-YOLOE+ の比較#

コンピュータビジョンの分野では、リアルタイム物体検出モデルが急速に進化しています。最も効率的なビジョンAIモデルのデプロイを検討しているMLエンジニアや研究者にとって、Ultralytics YOLO26 と PP-YOLOE+ のようなアーキテクチャを比較することは不可欠です。本ガイドでは、両者のアーキテクチャ、トレーニング手法、性能指標、および理想的な実世界でのデプロイメントシナリオについて詳細に分析します。

Link to this sectionモデルの起源とメタデータ#

これらのコンピュータビジョンアーキテクチャの背景を理解することは、設計思想やターゲット環境を把握する上で役立ちます。

YOLO26 の概要 2026年1月にリリースされた YOLO26 は、Ultralytics エコシステムの頂点に立つモデルです。これは決定的なエッジAIソリューションとなるよう設計されており、より小さなフットプリント、ネイティブなエンドツーエンド処理、そして比類のない速度を誇ります。

YOLO26の詳細はこちら

PP-YOLOE+ の概要 PP-YOLO シリーズの進化形として開発された PP-YOLOE+ は、PaddlePaddle エコシステム向けに高度に最適化されたアンカーフリーの検出器です。CSPRepResNet バックボーンと ET-head を採用しており、標準的な検出指標を向上させています。

PP-YOLOE+の詳細はこちら

Link to this sectionアーキテクチャの革新#

これらのモデルが視覚データを処理する方法の違いは、メモリ要件、トレーニングの安定性、および推論レイテンシに劇的な影響を与えます。

Link to this sectionYOLO26: NMS不要のフロンティア#

YOLO26 は、効率的なモデルデプロイメントのために設計された、いくつかの画期的なアーキテクチャ上の変更を導入しています。

  • エンドツーエンドの NMS不要設計: YOLOv10 で初めて導入されたコンセプトに基づき、YOLO26 は非最大値抑制 (NMS) 後処理をネイティブで排除しています。これにより、レイテンシの変動が低減され、デプロイメントパイプラインが大幅に簡素化されます。
  • DFL の削除: DFL (Distribution Focal Loss) を削除することで、モデルは非常に軽量になり、TensorRTCoreML といったフォーマットへのシームレスなエクスポートが可能になります。
  • MuSGD オプティマイザ: Moonshot AI の Kimi K2 に着想を得た YOLO26 は、LLM トレーニングのイノベーションをコンピュータビジョンにもたらします。ハイブリッドな MuSGD オプティマイザ (SGD + Muon) は、非常に安定したトレーニングダイナミクスと迅速な収束を保証します。
  • ProgLoss + STAL: これらの高度な損失関数は、小さな物体の認識において顕著な改善をもたらし、ドローン画像農業分野のアプリケーションにおいてこのアーキテクチャを非常に効果的なものにしています。

Link to this sectionPP-YOLOE+: Paddle を中心としたアプローチ#

PP-YOLOE+ はアンカーフリーのパラダイムを採用しており、標準的なサーバーハードウェアでの高精度に重点を置いています。特徴抽出能力を向上させる RepResNet 構造を特徴としていますが、Baidu のディープラーニングスタックで利用可能な特定の操作に強く依存しているため、ネットワークの変更や、制約の厳しいエッジデバイスへのエクスポートは、Ultralytics フレームワークと比較して大幅に複雑になる可能性があります。

Link to this sectionパフォーマンスと指標の比較#

多様な実世界でのデプロイメントシナリオにおいて、速度と精度の強力なパフォーマンスバランスは不可欠です。PP-YOLOE+ は競合力のある精度を提供しますが、YOLO26 は、特に CPU での推論速度や低いメモリ使用量を評価する際、一貫してより好ましいトレードオフを実現しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

特定のエッジ最適化と DFL 削除のおかげで、YOLO26 は前世代と比較して最大 43% 高速な CPU 推論を実現し、Raspberry Pi や標準的なエッジコンピューティングユニット上でデプロイした場合に PP-YOLOE+ を大幅に上回ります。

メモリ効率

モデルアーキテクチャを比較する際、Ultralytics YOLO モデルは複雑な Transformer モデルよりもトレーニング中のメモリ使用量を大幅に低く抑えており、コンシューマーグレードの GPU での迅速なプロトタイピングにおいて非常にアクセスしやすい点に注目してください。

Link to this sectionUltralyticsエコシステムの利点#

PP-YOLOE+ も有能なモデルですが、真の差別化要因は開発者体験にあります。統合された Ultralytics エコシステムは、ビジョンAIの実践者にとって比類のない環境を提供します。

  1. 使いやすさ: Ultralytics は合理化されたユーザーエクスペリエンスを提供します。シンプルな Python API がデータパイプラインとトレーニングループの複雑さを抽象化し、広範かつ積極的に保守されているドキュメントによってサポートされています。
  2. 汎用性: 主に物体検出に焦点を当てている PP-YOLOE+ とは異なり、YOLO26 は同じ API 構造を使用して、画像分類インスタンスセグメンテーションポーズ推定、および指向性バウンディングボックス (OBB) をネイティブでサポートしています。
  3. トレーニング効率: 入手可能な事前学習済み重みの自動ダウンロードと高度なデータ拡張により、従来のフレームワークと比較して CUDA メモリと時間を節約し、効率的なトレーニングプロセスが保証されます。

Link to this sectionコード例: シンプルな動作#

以下の有効な Python コードは、Ultralytics API を使用して AI プロジェクトを開始することがいかに簡単かを示しています。

from ultralytics import YOLO

# Load a pre-trained YOLO26 nano model for optimal edge performance
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="cpu")

# Perform NMS-free inference on a target image
inference_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

Link to this section理想的な実世界での応用#

YOLO26 と PP-YOLOE+ のどちらを選択するかは、主にプロダクション環境の制約に依存します。

PP-YOLOE+ をデプロイすべき場合:

  • Baidu エコシステムの統合: PaddlePaddle インフラストラクチャや、Baidu のハードウェアおよびソフトウェアスタックが厳格に適用される特定のアジアの製造現場に深く根ざしたプロジェクト。
  • サーバーサイドのバッチ処理: NMS によって引き起こされるレイテンシのジッターがそれほど懸念されない、エンタープライズグレードのハードウェアで実行されるシナリオ。

YOLO26 をデプロイすべき場合:

  • エッジデバイスと IoT: YOLO26 の最大 43% 高速な CPU 速度は、スマートカメラ、ドローン、および低電力ロボティクスにとって究極の選択肢となります。
  • 時間的制約のあるデプロイメント: ネイティブな NMS 不要のアーキテクチャにより、安定した超低レイテンシの推論が保証され、これは自動運転研究や高速な製造品質管理にとって極めて重要です。
  • マルチタスクプロジェクト: 物体検出、セグメンテーションによる精密なマスク作成、またはポーズ推定によるキーポイント追跡の組み合わせが必要な場合、統一された YOLO26 フレームワークは不可欠です。

Link to this sectionユースケースと推奨事項#

YOLO26 と PP-YOLOE+ の選択は、プロジェクト固有の要件、デプロイメントの制約、およびエコシステムの好みに依存します。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は以下の場合に強力な選択肢となります:

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionPP-YOLOE+ を選ぶべき場面#

PP-YOLOE+ は以下の場合に推奨されます:

  • PaddlePaddle エコシステムへの統合: Baidu の PaddlePaddle フレームワークとツールを使用して構築された既存のインフラストラクチャを持つ組織。
  • Paddle Lite エッジデプロイメント: Paddle Lite または Paddle 推論エンジン専用に高度に最適化された推論カーネルを備えたハードウェアへのデプロイ。
  • 高精度サーバーサイド検出: フレームワークの依存関係が懸念事項とならない、強力な GPU サーバー上での最大の検出精度を優先するシナリオ。

Link to this section他のアーキテクチャの検討#

より広範なモデルを検討しているユーザーには、何千ものプロダクション環境で定番となっている、信頼性の高い前世代の Ultralytics モデルである YOLO11 を確認することをお勧めします。さらに、Transformer ベースのメカニズムを必要とするシナリオでは、RT-DETR アーキテクチャが魅力的な代替案を提供しますが、トレーニング中のメモリ需要は高くなります。

最終的に、MuSGD オプティマイザ、ProgLoss + STAL 機能、および NMS 不要設計を活用することで、YOLO26 は現代的でスケーラブル、かつ非常に効率的なビジョンAIソリューションの最優先選択肢としての地位を確固たるものにしています。

コントリビューター

コメント