Link to this sectionYOLOX vs PP-YOLOE+#

堅牢なコンピュータビジョンパイプラインを設計する際、適切な物体検出モデルを選択することは極めて重要な決定です。リアルタイム物体検出器の分野は非常に競争が激しく、推論速度と検出精度の究極のバランスを目指して数多くのアーキテクチャが競い合っています。この技術的比較では、YOLOXとPP-YOLOE+という2つの著名なモデルを評価します。それぞれのアーキテクチャ設計、トレーニング手法、パフォーマンス指標を検証することで、開発者や研究者が自身のデプロイ環境に適したツールを選択するために必要な知見を提供することを目指します。

Link to this sectionアーキテクチャの革新と設計#

両モデルとも、初期のYOLOイテレーションにおける特定の課題に対処するために設計されましたが、速度と精度のトレードオフを解決するために根本的に異なるアプローチをとっています。

Link to this sectionYOLOX：研究と産業の橋渡し#

MegviiのZheng Ge、Songtao Liu、Feng Wang、Zeming Li、およびJian Sunによって開発されたYOLOXは、2021年7月18日にリリースされました。これは、アンカーフリー設計を全面的に採用することで、YOLOファミリーにおける大きな転換点となりました。彼らの公式Arxiv論文で基礎研究を、YOLOX GitHubリポジトリでオリジナルのソースコードを確認できます。

YOLOXは、分類タスクと回帰タスクを分離するデカップリングヘッドを統合しており、トレーニング中の収束速度を大幅に向上させています。さらに、SimOTAのような高度なラベル割り当て戦略を導入し、ポジティブサンプルを動的に割り当てるようにしました。これにより、計算リソースが厳しく制限されるエッジAI環境において、モデルが極めて効率的になります。

YOLOX について詳しく学ぶ

Link to this sectionPP-YOLOE+: 高性能産業用検出#

BaiduのPaddlePaddle開発チームによって2022年4月2日に導入されたPP-YOLOE+は、PP-YOLOシリーズの高度に最適化された進化版です。そのArxiv論文で詳しく説明されているPP-YOLOE+は、Baiduのエコシステムに深く統合されており、PaddlePaddleフレームワークを必要とします。モデルの設定はPaddleDetection GitHubリポジトリで確認できます。

PP-YOLOE+ relies on a powerful CSPRepResNet backbone and utilizes an Efficient Task-aligned head (ET-head) alongside Task Alignment Learning (TAL). This architecture achieves outstanding mean Average Precision (mAP) on the COCO dataset, making it a formidable choice for industrial defect detection and heavy server-side processing where accuracy is prioritized over minimal dependencies.

PP-YOLOE+の詳細はこちら

Link to this sectionパフォーマンスベンチマーク#

これらのモデルがさまざまなスケールでどのように動作するかを理解することは、デプロイにおいて不可欠です。以下の表は、mAPやTensorRTにエクスポートした際の推論速度など、主要な指標を概説しています。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

展開に関する考慮事項

PP-YOLOE+xは絶対的な精度において最高の結果を出しますが、YOLOXは極めて軽量なバリアント（NanoおよびTiny）を提供しており、低電力のマイクロコントローラーやレガシーなモバイルハードウェアに非常に適しています。

Link to this sectionユースケースと推奨事項#

YOLOXとPP-YOLOE+のどちらを選択するかは、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの優先順位に依存します。

Link to this sectionYOLOXを選択すべき時#

YOLOXは以下の場合に強力な選択肢となります。

アンカーフリー検出研究: 新しい検出ヘッドや損失関数を実験するためのベースラインとして、YOLOXのクリーンでアンカーフリーなアーキテクチャを使用する学術研究。
超軽量エッジデバイス: YOLOX-Nanoバリアントの非常に小さなフットプリント（0.91Mパラメータ）が不可欠な、マイクロコントローラやレガシーモバイルハードウェアへのデプロイ。
SimOTAラベル割り当ての研究: 最適輸送に基づくラベル割り当て戦略と、それが学習の収束に与える影響を調査する研究プロジェクト。

Link to this sectionPP-YOLOE+ を選ぶべき場面#

PP-YOLOE+ は以下の場合に推奨されます:

PaddlePaddle エコシステムへの統合: Baidu の PaddlePaddle フレームワークとツールを使用して構築された既存のインフラストラクチャを持つ組織。
Paddle Lite エッジデプロイメント: Paddle Lite または Paddle 推論エンジン専用に高度に最適化された推論カーネルを備えたハードウェアへのデプロイ。
高精度サーバーサイド検出: フレームワークの依存関係が懸念事項とならない、強力な GPU サーバー上での最大の検出精度を優先するシナリオ。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

NMSフリーのエッジ展開： Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
CPUのみの環境： GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
小さな物体の検出： aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionUltralyticsの優位性：YOLO26の紹介#

YOLOXとPP-YOLOE+はどちらも明確な利点を提供しますが、AIの急速な進化は、最先端の精度と比類なき使いやすさを兼ね備えたツールを求めています。ここで、Ultralyticsのモデル、特に最近リリースされたUltralytics YOLO26が、従来の調査用リポジトリを凌駕します。

2026年1月にリリースされたYOLO26は、最新の物体検出およびそれ以降の分野において新たな標準を確立し、競合するフレームワークでは到底及ばない開発者エクスペリエンスを提供します。

Link to this section開発者がYOLO26を選ぶ理由#

エンドツーエンドのNMSフリー設計: YOLOv10で先駆的に導入された概念を基盤とするYOLO26は、ネイティブなエンドツーエンドモデルです。Non-Maximum Suppression (NMS)のポストプロセスを完全に削除することで、一貫したレイテンシを保証し、エッジ環境向けのデプロイパイプラインを劇的に簡素化します。
次世代の最適化: トレーニングの安定性は、SGDとMuonのハイブリッドであるMuSGDオプティマイザ（Moonshot AIのKimi K2のようなLLM手法に着想を得た）によって革新されました。これにより、より高速な収束が保証されます。さらに、YOLO26はProgLoss + STALを活用して、航空画像やロボティクスを含むアプリケーションにおいて極めて重要な小物体認識を大幅に向上させます。
Unmatched Hardware Efficiency: By removing Distribution Focal Loss (DFL), YOLO26 drastically lowers memory requirements. It boasts up to 43% faster CPU inference, making it the definitive choice for devices lacking dedicated GPU acceleration.
極めて高い汎用性: 検出に特化したPP-YOLOE+とは異なり、YOLO26は多数のタスクにわたって統合されたサポートを提供します。これには、インスタンスセグメンテーションのための特殊なセマンティックセグメンテーション損失、正確なポーズ推定のためのResidual Log-Likelihood Estimation (RLE)、および指向性バウンディングボックス (OBB)のための高度な角度損失メカニズムが含まれています。

YOLO26の詳細はこちら

Link to this sectionシームレスなエコシステム統合#

Ultralyticsは、複雑なフレームワークのインストールに伴うフラストレーションを解消します。統合されたPython APIまたは直感的なUltralytics Platformを使用することで、わずか数行のコードでモデルのトレーニング、検証、エクスポートが可能です。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

Ultralyticsエコシステム内の他の堅牢なアーキテクチャを評価しているユーザーにとって、YOLO11はレガシーなデプロイにおいて非常に信頼性の高い選択肢であり、TransformerベースのRT-DETRはアテンションベースのソリューションを求めるユーザーに優れた能力を提供します。

Link to this section要約#

YOLOXとPP-YOLOE+のどちらかを選択することは、PyTorchベースの柔軟性を好むか、BaiduのPaddlePaddleとの深い統合を好むかという、主なフレームワークの制約に帰結することがよくあります。しかし、AIインフラの将来を見据える組織にとって、Ultralytics YOLO26ははるかに優れた代替手段を提供します。画期的なNMSフリー設計、軽量なメモリフットプリント、そして包括的なタスク汎用性を備えたYOLO26は、チームがこれまで以上に容易に、より高速で賢く効率的なコンピュータビジョンアプリケーションを構築できるようにします。

貢献者

GLglenn-jocher¹³

作成日 2025年1月27日更新日 3 週間前