YOLOX対YOLO26:アンカーフリーからエンドツーエンド物体検出への進化
コンピュータビジョン分野は過去10年間で驚異的な変革を遂げてきた。 この進化の過程における二つの重要な節目として、アンカーフリーアーキテクチャを普及させたYOLOXのリリースと、ネイティブのエンドツーエンド設計とNMSによりリアルタイム性能を完全に再定義したUltralytics 登場が挙げられる。本比較では両者のアーキテクチャ、性能指標、最適な導入シナリオを包括的に検証し、開発者が次なるAIプロジェクトにおいて適切な判断を下すための指針を提供する。
モデルの概要
各モデルの起源と主要な設計目標を理解することは、それぞれの技術的成果を理解する上で不可欠な背景を提供する。
YOLOX
著者: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
組織:Megvii
日付: 2021-07-18
Arxiv:2107.08430
GitHub:Megvii-BaseDetection/YOLOX
ドキュメント:YOLOX ReadTheDocs
2021年半ばに登場したYOLOXは、アンカーレス設計と分離型ヘッドを採用し、SimOTAと呼ばれる先進的なラベル割り当て戦略を組み合わせることで、大きな転換をもたらした。従来のアーキテクチャを支配していた従来のアンカーボックス機構から脱却したことで、YOLOXは学術研究と産業応用との間のギャップを埋めることに成功し、オブジェクト検出のための洗練されながらも非常に効果的なフレームワークを提供した。
YOLO26
著者: Glenn Jocher と Jing Qiu
組織: Ultralytics
日付: 2026-01-14
GitHub:ultralytics
プラットフォーム:Ultralytics
2026年初頭にリリースされたYOLO26は、長年にわたる反復的な改良の集大成であり、エッジデプロイメントと簡素化されたトレーニングパイプラインに重点を置いています。エンドツーエンドNMS設計を導入し、従来の非最大抑制(NMS)後処理ステップを完全に排除しました。この画期的な進歩により、多様なハードウェアへのモデルデプロイメントが大幅に簡素化されました。 さらに、分布焦点損失(DFL)モジュールを排除したことで、YOLO26は大幅に低遅延を実現し、現代のコンピュータビジョンアプリケーションにおける最良の選択肢としての地位を確固たるものにしています。
アーキテクチャの革新
これら二つのモデルのアーキテクチャは、特に損失関数と後処理に関して、深層学習手法の急速な進歩を浮き彫りにしている。
YOLOXアプローチ
YOLOXは予測ヘッドにおいて分類と回帰タスクを分離し、これにより学習中の収束が大幅に加速された。アンカーフリー特性により設計パラメータ数が削減され、学習前の複雑なアンカー調整の必要性が軽減された。SimOTAラベル割り当てアルゴリズムと組み合わせることで、YOLOXは当時において最先端の結果を達成し、COCO のような標準ベンチマークで顕著な成果を示した。
YOLO26の優位性
YOLO26はアーキテクチャ効率を新たな次元へ引き上げます。NMS の除去は推論遅延を削減するNMS 、自律走行車やロボティクスにとって重要な要素である一貫した決定論的実行時間を保証します。
YOLO26の主な革新点には以下が含まれます:
- MuSGDオプティマイザ:大規模言語モデル(LLM)の学習手法に着想を得た、SGD ミューオンのハイブリッド手法であり、極めて安定した学習実行と高速な収束を実現します。
- 最大43%高速CPU :DFLを排除しネットワークアーキテクチャを合理化することで、YOLO26はリソース制約のあるエッジデバイス(シンプルなIoTセンサーからRaspberry Piボードまで)向けに大幅に最適化されています。
- ProgLoss + STAL:これらの高度な損失関数は、航空画像の 分析や製造自動化における精密な品質管理に不可欠な、微小物体認識において顕著な改善をもたらします。
エッジファースト最適化
プロジェクトが組み込みシステムや専用GPUを持たないモバイルアプリケーションを対象とする場合、YOLO26の最適化されたCPU 大きな利点を提供し、前世代モデルに比べて計算オーバーヘッドを大幅に削減します。
性能とベンチマーク
実稼働環境向けのモデルを評価する際には、精度、速度、計算複雑性のバランスを分析することが極めて重要である。以下に、画像サイズ640ピクセル(ナノ/タイニー版は416ピクセル)で評価した標準モデルの詳細な比較を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
表が示すように、YOLO26シリーズは優れた性能バランスを提供します。例えば、 YOLO26x 従来のモデルのほぼ半分のパラメータ数mAP 57.5mAP 驚異的な性能を達成しているmAP YOLOXx モデルは、GPU 短縮(11.8ミリ秒対16.1ミリ秒)と圧倒的に優れたデプロイメントの柔軟性に直結します。
トレーニングとエコシステム体験
これらのアーキテクチャ間の最も根本的な違いの一つは、その使いやすさとエコシステムサポートにある。
YOLOXは勾配フローやアンカーフリーメカニズムを研究する研究者にとって基礎的なリポジトリであり続けていますが、その設定は複雑で、依存関係や演算子の手動設定が必要となることがよくあります。一方、 Ultralytics は使いやすさの業界標準を定義しています。
Python することで、開発者は比類のない簡便さでYOLO26モデルの初期化、トレーニング、デプロイを実現できます。本システムはデータセットのダウンロード、ハイパーパラメータ調整、ONNXなどのフォーマットへのシームレスなエクスポートを本質的に処理します。 ONNX、 TensorRT、OpenVINOなどのフォーマットへのシームレスなエクスポートを自動的に処理します。
from ultralytics import YOLO
# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance on the validation set
metrics = model.val()
# Export the optimized model for edge deployment
model.export(format="onnx")
さらに、Ultralytics YOLO 、大規模なトランスフォーマーベースの代替モデルと比較して、トレーニング時のメモリ要件が大幅に低減されているため、エンジニアはコンシューマーグレードのハードウェア上でもより大きなバッチサイズでトレーニングを実施できます。
現実世界のアプリケーション
YOLOXとYOLO26の選択は、最終的にはデプロイメントの制約とマルチタスク要件によって決まります。
YOLOXが優れている点
YOLOXは、特定の学術ベンチマークやMegEngineフレームワークと深く統合されたレガシーシステムにおいて、依然として有力な選択肢である。その歴史的意義から、アンカーフリー検出器やカスタムアサインメント戦略の研究における一般的なベースラインとなっている。
YOLO26が優れている点
YOLO26は基本的に現代の産業用途向けに設計されています。インスタンスセグメンテーション、姿勢推定、オリエンテッドバウンディングボックス(OBB)をネイティブにサポートするため、標準的な検出エンジンよりもはるかに汎用性が高いです。
- スマート小売と在庫管理: NMS設計の活用により、自動レジシステムは超低遅延で映像フィードを処理し、後処理ループのボトルネックなしに商品を認識します。
- ドローンおよび航空解析:OBB専用の角度損失とProgLoss + STALの統合により、YOLO26は広大な衛星画像内の回転物体や微小な人工物体を検出する能力において比類のない性能を発揮する。
- エッジセキュリティシステム: CPU 43%高速化されたYOLO26により、企業は高価なクラウドコンピューティングを必要とせず、堅牢なセキュリティ分析を安価なローカルハードウェアに直接展開できます。
ユースケースと推奨事項
YOLOXとYOLO26の選択は、具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの選好によって決まります。
YOLOXを選択すべき時
YOLOXは以下に最適な選択肢です:
- アンカーフリー検出研究:YOLOXのクリーンなアンカーフリーアーキテクチャをベースラインとして、新たな検出ヘッドや損失関数の実験を行う学術研究。
- 超軽量エッジデバイス:マイクロコントローラーやレガシーモバイルハードウェアへの展開において、YOLOX-Nanoモデルの極めて小さなフットプリント(0.91Mパラメータ)が極めて重要となる。
- SimOTAラベル割り当て研究:最適輸送に基づくラベル割り当て戦略と、それが学習収束に与える影響を調査する研究プロジェクト。
YOLO26を選択すべき時
YOLO26は以下に推奨されます:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
Ultralytics 調査
コンピュータビジョンの進化を探求しているなら、Ultralytics には他にも調査する価値のある高性能モデルが存在します:
- YOLO11:YOLO26の直前のバージョンであり、安定した生産環境向けに堅牢な性能と広範なコミュニティサポートを提供します。
- YOLOv8:数千の実世界展開において、使いやすさと柔軟性の基準を確立した、実戦で鍛え抜かれたアーキテクチャ。
結論として、YOLOXが物体検出の分野に重要な概念をもたらした一方で、新たなYOLO26は速度、精度、導入の簡便性において画期的な飛躍を実現し、先進的な開発者や企業にとって決定的な選択肢となっている。