YOLOX vs. YOLO26: オブジェクトdetectionアーキテクチャの比較分析
急速に進化する物体検出の分野において、特定のアプリケーションに適したモデルを特定することは極めて重要です。この包括的なガイドでは、Megvii製の高性能なアンカーフリー検出器であるYOLOXと、エッジでの効率性とエンドツーエンドのデプロイメントのために設計された最新の最先端モデルであるUltralytics YOLO26を比較します。
アーキテクチャ、パフォーマンス指標、およびトレーニング手法を分析することで、開発者や研究者が実世界のコンピュータービジョンプロジェクトにおいて情報に基づいた意思決定を行えるよう支援することを目指しています。
概要
両モデルは、YOLOの系譜における重要なマイルストーンです。YOLOX(2021年)は、anchor-free detectとデカップルドヘッドの普及に貢献し、学術研究と産業応用の間のギャップを埋めました。一方、YOLO26(2026年)は、NMSを排除したネイティブなエンドツーエンド設計により、さらに限界を押し広げ、より高速なCPU推論と小さなオブジェクトに対する優れた精度を実現しています。
ほとんどの最新アプリケーション、特にエッジデバイスに展開されるものや合理化された統合を必要とするものには、YOLO26がより堅牢なエコシステム、低いレイテンシ、およびシンプルなデプロイメントワークフローを提供します。
YOLOX: アンカーフリーの先駆者
YOLOXは、YOLOシリーズをanchor-freeメカニズムに移行させ、デカップルドヘッドやSimOTAラベル割り当てなどの他の高度なdetect技術を統合しました。
技術仕様
主要なアーキテクチャ機能
- Anchor-Free Mechanism: YOLOv4やYOLOv5のような事前定義されたアンカーボックスを使用する前身とは異なり、YOLOXはバウンディングボックスを直接予測します。これにより、設計パラメータの数と異なるデータセットに必要なヒューリスティックなチューニングが削減されます。
- Decoupled Head: YOLOXは、分類タスクと位置特定タスクを異なる「ヘッド」に分離します。この分離により、分類信頼度と回帰精度の間の競合が解決され、より速い収束と優れたパフォーマンスにつながります。
- SimOTA: 正のサンプルをグラウンドトゥルースに動的に割り当てる簡素化された最適輸送割り当て戦略で、トレーニングの安定性と精度を向上させます。
- Multi-positives: anchor-free detectにおける正/負のサンプルの極端な不均衡を緩和するため、YOLOXは中央の3x3領域を正として割り当てます。
従来の強み
YOLOXは、学術研究や従来のanchor-free実装が好まれるシナリオにおいて、強力なベースラインであり続けています。そのデカップルドヘッド設計は、後続のアーキテクチャに大きな影響を与えました。
Ultralytics YOLO26: エンドツーエンドのエッジスペシャリスト
YOLO26は効率性を追求してゼロから設計されており、推論パイプラインのボトルネックを排除することで、CPUとGPUの両方で最大速度を実現します。
技術仕様
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026年1月14日
- リンク:GitHub, ドキュメント
主要なアーキテクチャ革新
- エンドツーエンドのNMSフリー設計: YOLO26はネイティブにエンドツーエンドです。Non-Maximum Suppression (NMS)の後処理を必要としない予測を生成することで、デプロイメント中のレイテンシと複雑さを大幅に削減します。この画期的な進歩はYOLOv10に触発され、生産安定性のために改良されました。
- DFLの削除: Distribution Focal Loss (DFL) モジュールは、モデルのエクスポートを簡素化するために削除されました。これにより、モデルはエッジ/低電力デバイスやTensorRTやCoreMLなどのアクセラレータツールチェーンとの互換性が向上します。
- MuSGD Optimizer: SGDとMuonを組み合わせた新しいハイブリッドオプティマイザです。LLMトレーニング(特にMoonshot AIのKimi K2)に触発されたこのオプティマイザは、ビジョンタスクのトレーニングを安定させ、収束を加速させます。
- ProgLoss + STAL: Progressive Loss BalancingとSmall-Target-Aware Label Assignment (STAL) の組み合わせにより、小さなオブジェクトのdetectが劇的に改善されます。これはドローン画像やIoTセンサーにとって重要です。
- タスクの多様性: 主にdetectであるYOLOXとは異なり、YOLO26はInstance Segmentation、Pose Estimation、Classification、およびOriented Bounding Box (obb)タスクをすぐにサポートします。
エッジ最適化
YOLO26は、以前の世代と比較して最大43%高速なCPU推論を誇り、Raspberry Pi、モバイルデバイス、および専用GPUなしの標準Intel CPUでのデプロイメントに最適な選択肢となっています。
パフォーマンス比較
以下の表は、モデル間のパフォーマンスの違いを示しています。YOLOXは2021年には競争力がありましたが、YOLO26は5年間のアーキテクチャ進化で達成された進歩、特に推論速度とパラメータ効率において、その優位性を示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
分析:
- 精度: YOLO26は、あらゆるスケールにおいてYOLOXを一貫して上回る性能を発揮します。例えば、
YOLO26sは 48.6% mAPを達成し、YOLOX-sの40.5%を大幅に上回り、はるかに大規模なYOLOX-l(49.7%)を達成しつつ、計算リソースはごく一部しか使用しません。 - 速度: YOLO26は、そのエンドツーエンドアーキテクチャを活用し、極めて低いレイテンシを実現します。YOLO26のTensorRTによる推論速度は、同等のYOLOXモデルと比較してしばしば2倍高速であり、これはNMSのオーバーヘッドが排除されていることにも起因します。
- 効率性: YOLO26では、FLOPs対精度比がはるかに優れています。
YOLO26n同等の精度を達成しますYOLOX-s(40.9% 対 40.5%)を達成しつつ、FLOPsは約5分の1(5.4B 対 26.8B)に抑えられています。
トレーニングとエコシステム
開発者エクスペリエンスは、これら2つのフレームワーク間の大きな差別化要因です。
使いやすさとエコシステム
Ultralyticsは、合理化されたユーザーエクスペリエンスを優先しています。YOLO26を使用すると、データ検証、トレーニング、デプロイメントをシームレスに処理する統合されたPythonパッケージにアクセスできます。
- シンプルなAPI: わずか3行のPythonコードでモデルをトレーニングできます。
- 統合されたツール: 実験の追跡、データセット管理、およびONNX、TFLite、OpenVINOなどの形式へのモデルのエクスポートをネイティブでサポートします。
- ドキュメンテーション: 広範で継続的に更新されるUltralytics Docsにより、行き詰まることはありません。
対照的に、YOLOXはより伝統的な研究コードベース構造に依存しており、データセットパス、データ拡張、デプロイスクリプトに対してより多くの手動設定が必要となる場合があります。
学習方法論
- YOLO26: 安定性のためにMuSGDオプティマイザを活用し、オートバッチングとオートアンカリングを利用します(アンカーフリーモデルには関連性が低いものの、内部スケーリングは適用されます)。また、高速な収束のために最適化されたMosaicおよびMixupデータ拡張もサポートしています。
- YOLOX: MosaicとMixupを含む強力なデータ拡張パイプラインを導入し、これが高いパフォーマンスの主要因となりました。通常、最高の精度に達するには、より長いトレーニングスケジュール(300エポック)が必要です。
メモリ要件
YOLO26はメモリ効率が最適化されています。その簡素化された損失関数(DFLの削除)と最適化されたアーキテクチャにより、古いアンカーフリーアーキテクチャと比較して、トレーニング中のVRAM使用量が低減されます。これにより、コンシューマーGPUでより大きなバッチサイズが可能になり、実験が加速されます。
ユースケースと応用
YOLO26が優れている点
- エッジコンピューティング: 最大43%高速なCPU推論とDFLの削除により、YOLO26はRaspberry Piやモバイル展開に理想的な選択肢です。
- リアルタイムビデオ分析: NMSフリー設計により、決定論的なレイテンシが保証され、自動運転やセキュリティアラームシステムのような安全性が重視されるアプリケーションにとって不可欠です。
- 複雑なタスク: プロジェクトがsegmentationやpose estimationを必要とする場合、YOLO26は同じフレームワーク内でこれらの機能を提供します。一方、YOLOXは主にオブジェクト検出器です。
YOLOXの用途
- 研究ベースライン: YOLOXは、そのクリーンなアンカーフリー実装により、学術論文で比較ベースラインとして頻繁に使用されています。
- レガシーシステム: 2021年から2022年に開始され、YOLOXのコードベースを大幅にカスタマイズしたプロジェクトでは、移行にリソースを要する場合がありますが、YOLO26のパフォーマンス向上は通常、その労力に見合うものです。
コード例: YOLO26の始め方
YOLO26への移行は簡単です。以下に、事前学習済みモデルをロードして推論を実行する完全な例を示します。
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (automatically downloads weights)
model = YOLO("yolo26n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
for result in results:
result.show() # Show image with bounding boxes
# Export to ONNX for deployment
model.export(format="onnx")
このシンプルなスニペットは、古い研究リポジトリでしばしば必要とされる何百行ものボイラープレートコードを置き換えます。
結論
While YOLOXがアンカーフリー設計を検証することで物体検出の歴史において極めて重要な役割を果たした一方で、Ultralytics YOLO26は効率的で展開可能なAIの未来を象徴しています。
そのNMSフリーのエンドツーエンドアーキテクチャ、優れた精度対計算比、そしてUltralyticsエコシステムの強力なサポートにより、YOLO26は新規開発と既存のビジョンパイプラインのアップグレードの両方にとって推奨される選択肢です。
参考資料
- YOLO11やYOLOv8のような他のモデルも比較のために探索してください。
- 最高の速度を実現するためのモデルのエクスポートについて学びましょう。
- 最新のチュートリアルとユースケースについては、Ultralytics Blogをご覧ください。