Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLO26: アンカーフリーからエンドツーエンドの物体検出への進化#

コンピュータビジョンの分野は、過去10年間で信じられないほどの変革を遂げてきました。この過程における重要な2つのマイルストーンとして、アンカーフリーアーキテクチャを普及させたYOLOXのリリースと、ネイティブなエンドツーエンドのNMSフリー設計によりリアルタイム性能を完全に再定義した最新の Ultralytics YOLO26 の登場が挙げられます。この包括的な比較では、両者のアーキテクチャ、性能指標、および理想的なデプロイシナリオを探求し、開発者が次のAIプロジェクトに向けて情報に基づいた意思決定を行えるようサポートします。

Link to this sectionモデルの概要#

各モデルの起源と主要な設計目標を理解することは、それぞれの技術的成果を把握するための不可欠なコンテキストとなります。

Link to this sectionYOLOX#

著者: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun 組織: Megvii 日付: 2021-07-18 Arxiv: 2107.08430 GitHub: Megvii-BaseDetection/YOLOX ドキュメント: YOLOX ReadTheDocs

2021年半ばに導入されたYOLOXは、アンカーフリー設計を採用し、デカップルドヘッドとSimOTAとして知られる高度なラベル割り当て戦略を組み合わせることで、大きな転換点をもたらしました。それまでのアーキテクチャで主流だった伝統的なアンカーボックスメカニズムから脱却することで、YOLOXは学術研究と産業応用のギャップを埋め、物体検出のための洗練された非常に効果的なフレームワークを提供しました。

YOLOXについて詳しく学ぶ

Link to this sectionYOLO26#

著者: Glenn Jocher and Jing Qiu 組織: Ultralytics 日付: 2026-01-14 GitHub: ultralytics/ultralytics プラットフォーム: Ultralytics Platform

2026年初頭にリリースされた YOLO26 は、長年にわたる反復的な改善の集大成であり、エッジデプロイメントと簡素化された学習パイプラインに重点を置いています。これは エンドツーエンドのNMSフリー設計 を導入し、従来のNon-Maximum Suppression後処理ステップを完全に排除しました。この画期的な進歩により、多様なハードウェア間でのモデルデプロイが劇的に簡素化されます。さらに、Distribution Focal Loss (DFL) モジュールを削除することで、YOLO26は大幅なレイテンシの削減を実現し、現代の コンピュータビジョンアプリケーション における最高の選択肢としての地位を確立しました。

YOLO26の詳細はこちら

Link to this sectionアーキテクチャの革新#

これら2つのモデルのアーキテクチャは、特に損失関数と後処理に関して、ディープラーニング手法の急速な進歩を浮き彫りにしています。

Link to this sectionYOLOXのアプローチ#

YOLOXは予測ヘッドにおける分類タスクと回帰タスクを分離(デカップリング)し、学習時の収束を大幅に加速させました。そのアンカーフリーという特性は設計パラメータの数を減らし、学習前に複雑なアンカーチューニングを行う必要性を軽減しました。SimOTAラベル割り当てアルゴリズムと組み合わせることで、YOLOXは当時 COCO dataset のような標準的なベンチマークにおいて最先端の結果を達成しました。

Link to this sectionYOLO26の利点#

YOLO26はアーキテクチャの効率性を次のレベルへと引き上げます。NMSの削除は推論レイテンシを削減するだけでなく、一貫性のある決定論的な実行時間を保証します。これは 自動運転車 やロボット工学にとって極めて重要な要素です。

YOLO26の主な革新技術は以下の通りです。

  • MuSGD Optimizer: 大規模言語モデル (LLM) の学習技術に触発されたこのSGDとMuonのハイブリッドにより、非常に安定した学習とより速い収束を実現します。
  • 最大43%高速なCPU推論: DFLを排除しネットワークアーキテクチャを合理化することで、YOLO26は単純なIoTセンサーから Raspberry Pi ボードに至るまで、リソースの限られたエッジデバイス向けに強力に最適化されています。
  • ProgLoss + STAL: これらの高度な損失関数は小物体認識において顕著な改善をもたらし、 航空画像 の解析や 製造オートメーション における精密な品質管理において不可欠です。
エッジファーストの最適化

専用GPUを持たない組み込みシステムやモバイルアプリケーションを対象とするプロジェクトの場合、YOLO26の最適化されたCPU性能は大きな利点となり、前世代のモデルよりも計算オーバーヘッドを大幅に削減できます。

Link to this section性能とベンチマーク#

本番環境向けにモデルを評価する際、精度、速度、および計算複雑性のバランスを分析することが最優先事項です。以下に、画像サイズ640ピクセル(nano/tinyバリアントは416ピクセル)で評価された標準的なモデルの詳細な比較を示します。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

表が示すように、YOLO26シリーズは優れた性能バランスを提供します。例えば、YOLO26x は57.5 mAPという驚異的な数値を達成しつつ、YOLOXx モデルのパラメータ数のほぼ半分しか使用しません。これは、より高速なGPU推論時間(11.8 ms vs 16.1 ms)と、非常に優れたデプロイの柔軟性に直結します。

Link to this section学習とエコシステムの体験#

これらのアーキテクチャの最も大きな違いの1つは、使いやすさとエコシステムのサポートにあります。

YOLOXは、勾配フローやアンカーフリーのメカニズムを研究する研究者にとって基本的なリポジトリであり続けていますが、そのセットアップは複雑になることがあり、多くの場合、依存関係や演算子の手動設定が必要です。逆に、 Ultralyticsエコシステム は使いやすさの業界標準を定義しています。

統一されたPython APIを利用することで、開発者は比類のない簡潔さでYOLO26モデルを初期化、学習、デプロイできます。このシステムは、データセットのダウンロード、ハイパーパラメータの調整、および ONNXTensorRT、OpenVINOなどの形式へのシームレスなエクスポートを本質的に処理します。

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

さらに、Ultralytics YOLOモデルは、重いTransformerベースの代替モデルと比較して、学習中のメモリ要件が大幅に低いため、エンジニアは消費者グレードのハードウェア上でも大きなバッチサイズで学習を行うことができます。

Link to this section実際のアプリケーション#

YOLOXとYOLO26の選択は、最終的にはデプロイの制約とマルチタスクの要件に依存します。

Link to this sectionYOLOXが優れている点#

YOLOXは、特定の学術ベンチマークや、MegEngineフレームワークと深く統合されたレガシーシステムにおいて、依然として実行可能な候補です。その歴史的意義により、 アンカーフリー検出器 やカスタム割り当て戦略を研究するための人気のあるベースラインとなっています。

Link to this sectionYOLO26が優れている点#

YOLO26は、現代の産業アプリケーション向けに根本から設計されています。 インスタンスセグメンテーション姿勢推定、および 指向性バウンディングボックス (OBB) をネイティブにサポートしているため、標準的な検出エンジンよりもはるかに多用途です。

  • スマートリテールと在庫管理: NMSフリー設計の活用により、自動チェックアウトシステムはビデオフィードを超低遅延で処理でき、後処理ループのボトルネックなしに商品を認識できます。
  • ドローンと航空解析: OBBのための特殊な角度損失とProgLoss + STALの統合により、YOLO26は回転した物体や広大な衛星画像内の小さなアーティファクトの検出において比類のない性能を発揮します。
  • エッジセキュリティシステム: 43%高速なCPU推論により、YOLO26は高価なクラウドコンピューティングを必要とせず、安価なローカルハードウェア上で堅牢なセキュリティ解析を直接実行することを可能にします。

Link to this sectionユースケースと推奨事項#

YOLOXとYOLO26のどちらを選ぶかは、プロジェクトの具体的な要件、デプロイの制約、およびエコシステムの優先順位によって決まります。

Link to this sectionYOLOXを選択すべき時#

YOLOXは以下の場合に強力な選択肢となります。

  • アンカーフリー検出研究: 新しい検出ヘッドや損失関数を実験するためのベースラインとして、YOLOXのクリーンでアンカーフリーなアーキテクチャを使用する学術研究。
  • 超軽量エッジデバイス: YOLOX-Nanoバリアントの非常に小さなフットプリント(0.91Mパラメータ)が不可欠な、マイクロコントローラやレガシーモバイルハードウェアへのデプロイ。
  • SimOTAラベル割り当ての研究: 最適輸送に基づくラベル割り当て戦略と、それが学習の収束に与える影響を調査する研究プロジェクト。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は以下のような場合に推奨されます。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section他のUltralyticsモデルを探求する#

コンピュータビジョンの進化を探求しているなら、Ultralyticsファミリーの中に調査する価値のある他の非常に優れたモデルがあります。

  • YOLO11: YOLO26の直系の前身であり、安定した本番環境向けに堅牢な性能と広範なコミュニティサポートを提供します。
  • YOLOv8: 何千もの実際のデプロイメントにおいて、使いやすさと柔軟性の基準を打ち立てた、実戦で十分にテストされたアーキテクチャです。

結論として、YOLOXは物体検出の展望において重要な概念を導入しましたが、新しい YOLO26 は速度、精度、デプロイの簡素化において世代を超えた飛躍をもたらしており、先見の明のある開発者や企業にとって決定的な選択肢となっています。

コメント