Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 と YOLO11 の比較#

最先端のコンピュータービジョンシステムを構築する際、精度、レイテンシ、リソース効率のバランスを取るために適切なモデルを選択することは極めて重要です。急速に進化する人工知能の分野において、Ultralytics は可能性の境界を押し広げ続けています。この詳細な技術比較では、大きな成功を収めた YOLO11 から、革新的な新しい YOLO26 への移行について解説し、AIエンジニアや研究者が情報に基づいたアーキテクチャの意思決定を行うために必要な洞察を提供します。

Link to this sectionモデルの系譜とメタデータ#

両モデルとも Ultralytics によって開発されましたが、オブジェクト検出およびマルチタスクビジョンモデルの歴史において異なるパラダイムを表しています。

YOLO26の詳細:

YOLO26の詳細はこちら

YOLO11 の詳細:

YOLO11の詳細はこちら

その他のアーキテクチャ

YOLO26 は当社の最も高度なリアルタイムモデルですが、高度に専門化されたハードウェアや膨大なメモリ容量を扱うユーザーは、RT-DETR のような Transformer ベースのアーキテクチャや、NMS を必要としない画期的な先駆者である YOLOv10 を検討することもできます。

Link to this sectionアーキテクチャの違いと革新#

YOLO11 から YOLO26 への飛躍には、モデルアーキテクチャと根本的なトレーニング体系の両面で根本的な転換が含まれています。YOLO11 は オブジェクト検出 とマルチタスク学習の強固なベースラインを確立しましたが、YOLO26 はエッジコンピューティングのためのデプロイパイプラインを完全に刷新しました。

Link to this sectionエンドツーエンドの NMS 不要設計#

YOLO26 における最も重要なアップグレードの1つは、そのネイティブなエンドツーエンドアーキテクチャです。重複するバウンディングボックスをフィルタリングするために Non-Maximum Suppression (NMS) 後処理に依存する YOLO11 とは異なり、YOLO26 はこのステップを完全に排除しています。このコンセプトは YOLOv10 で初めて導入されたもので、レイテンシの変動を劇的に抑え、さまざまなエッジデバイス間でのデプロイロジックを簡素化します。

Link to this sectionエッジ効率のための DFL 削除#

YOLO11 はバウンディングボックスの推定を洗練させるために Distribution Focal Loss (DFL) を利用しています。しかし、DFL は低電力のエッジアクセラレータではサポートが不十分なことが多い複雑な softmax 演算に依存しています。YOLO26 は精度を犠牲にすることなく DFL を正常に削除しました。このアーキテクチャの簡素化により、組み込みシステムとの互換性が大幅に向上し、YOLO26 は前モデルと比較して最大 43% 高速な CPU 推論 を実現しています。

Link to this sectionMuSGD オプティマイザ#

トレーニングの安定性と速度は極めて重要です。YOLO26 は、Stochastic Gradient Descent (SGD) と Muon のハイブリッドである MuSGD オプティマイザ を導入しており、これは Moonshot AI の Kimi K2 の LLM トレーニングの革新から大きな影響を受けています。このオプティマイザは、言語モデルのトレーニングの安定性をコンピュータービジョンにもたらし、重量級の Transformer 代替品と比較して、トレーニング中の収束を高速化しメモリフットプリントを削減します。

Link to this sectionProgLoss と STAL#

航空画像 やドローンアプリケーションを扱う研究者にとって、小さな特徴を検出することは歴史的な課題です。YOLO26 は ProgLoss と STAL (Scale-Targeted Attention Loss) を組み合わせることで、YOLO11 よりも小さなオブジェクトの認識において顕著な改善を実現しました。

Link to this sectionパフォーマンスと指標の比較#

両モデルを直接比較すると、YOLO26 は精度とエッジデバイスの効率性において明らかに優位性を示しつつ、Ultralytics エコシステムの特徴である極めて低いメモリ要件を維持しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

注: YOLO26 nano (YOLO26n) モデルは、YOLO11n と比較して CPU 速度が約31%向上 (56.1ms に対し 38.9ms) しており、エッジ優先の設計思想が強調されています。

Link to this sectionコンピュータービジョンタスク全般における汎用性#

両モデルは高度にメンテナンスされた Ultralytics エコシステムの恩恵を受けており、統一された Python API を通じて比類のない使いやすさを提供します。これらは単なるオブジェクト検出器ではなく、マルチタスクの強力なツールです。ただし、YOLO26 にはタスク固有のいくつかの進歩が組み込まれています。

  • インスタンスセグメンテーション: YOLO26 は改良されたセマンティックセグメンテーション損失とマルチスケールプロトタイピングを使用しており、YOLO11 よりも鮮明なマスク境界を生成します。セグメンテーションワークフロー について詳しくはこちらをご覧ください。
  • ポーズ推定: Residual Log-Likelihood Estimation (RLE) を統合することで、YOLO26 は複雑な人間のポーズにおけるキーポイント精度を劇的に向上させます。ポーズ推定機能 をご覧ください。
  • 指向性バウンディングボックス (OBB): 特殊な角度損失関数により、従来の境界の不連続性の問題が解決され、衛星フィード内の回転したオブジェクトを検出する際に YOLO26 は非常に信頼性が高くなっています。OBB タスク についてお読みください。
  • 画像分類: 両モデルとも高速な 分類 を効率的に処理し、YOLO26 は ImageNet においてトップ1精度のわずかな向上を実現しています。

Link to this sectionトレーニングと推論のコード例#

Ultralytics is celebrated for its developer experience. Training a SOTA model or running an inference script takes only a few lines of code, minimizing boilerplate and maximizing productivity. Furthermore, training YOLO models requires significantly less CUDA memory than large transformer networks.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Link to this section理想的なユースケースとデプロイ戦略#

YOLO26 と YOLO11 のどちらを選択するかは、完全に本番環境の制約に依存します。

Link to this sectionYOLO26 をデプロイすべきタイミング#

YOLO26 は、モダンで新規のプロジェクトにとって決定的な選択肢です。特に以下のような用途に構築されています。

  • エッジコンピューティングと IoT: その驚異的な CPU 性能と DFL の削除により、Raspberry Pi、Coral NPU、モバイルプロセッサなどのデバイスで最高のパフォーマンスを発揮します。
  • ドローンおよび航空分析: ProgLoss と STAL の統合により、広大な風景の中で小さく高速に移動するオブジェクトを追跡する能力において唯一無二の性能を発揮します。
  • Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.

Link to this sectionYOLO11 を保持すべきタイミング#

YOLO26 は優れていますが、YOLO11 も非常に高性能なモデルです。以下の場合には YOLO11 を継続して使用することが適しています。

  • レガシーパイプライン: 既存の C++ デプロイインフラストラクチャが、古いアーキテクチャの特定のアンカーベースの出力や NMS ロジックと密結合している場合。
  • 学術的なベースライン: 研究を発表しており、新しいアルゴリズムを評価するために広く認識されている 2024 年の標準が必要な場合。

Link to this sectionUltralytics エコシステムの力#

YOLO11 と YOLO26 のどちらをデプロイするかにかかわらず、Ultralytics モデルを活用するということは、頻繁な更新と広範なコミュニティサポートを備えた 十分にメンテナンスされたエコシステム を利用することを意味します。

エンタープライズチーム向けに、Ultralytics Platform は、データアノテーション、モデルトレーニング、シームレスなクラウドデプロイのためのエンドツーエンドのソリューションを提供します。トレーニング済み重みの CoreMLTensorRT へのエクスポートから、高度な ハイパーパラメータチューニング の設定に至るまで、提供されるツールにより AI ライフサイクルを最大限に効率化できます。

コントリビューター

コメント