コンテンツにスキップ

YOLO26 vsYOLO11:ビジョンAIにおける世代を超えた飛躍

最先端のコンピュータビジョンシステムを構築する際、精度、レイテンシ、リソース効率のバランスを取るためには、適切なモデルの選択が極めて重要です。急速に進化する人工知能の分野において、 Ultralytics は可能性の限界を押し広げ続けています。この詳細な技術比較では、非常に成功した YOLO11 から革新的な新モデルYOLO26への移行を検証し、AIエンジニアや研究者が適切なアーキテクチャ選択を行うために必要な知見を提供します。

モデル系譜とメタデータ

Ultralytics、物体検出とマルチタスク視覚モデルのタイムラインにおいて異なるパラダイムを表している。

YOLO26の詳細:

YOLO26についてさらに詳しく

YOLO11 :

YOLO11の詳細について。

その他のアーキテクチャ

YOLO26は当社で最も先進的なリアルタイムモデルですが、高度に専門化されたハードウェアや膨大なメモリ容量を扱うユーザーは、以下のようなトランスフォーマーベースのアーキテクチャも検討できます。 RT-DETR や、画期的なNMS先駆者である YOLOv10といったトランスフォーマーベースのアーキテクチャを検討することも可能です。

建築上の差異と革新

YOLO11 飛躍は、モデルアーキテクチャと基盤となるトレーニング手法の両方において根本的な転換を伴う。YOLO11 物体検出とマルチタスク学習の堅牢な基盤をYOLO11 一方で、YOLO26はエッジコンピューティング向けの展開パイプラインを完全に刷新した。

エンドツーエンドNMSフリー設計

YOLO26における最も重要な改良点の1つは、ネイティブのエンドツーエンドアーキテクチャである。重複するバウンディングボックスをフィルタリングするために非最大抑制(NMS)後処理に依存YOLO11異なり、YOLO26はこのステップを完全に排除している。この概念は最初に YOLOv10で初めて導入されたこの概念は、遅延変動を劇的に低減し、多様なエッジデバイスにおける展開ロジックを簡素化します。

エッジ効率のためのDFL除去

YOLO11 境界ボックス推定の精度向上に分布型焦点損失(DFL)YOLO11 しかしDFLは複雑なソフトマックス演算に依存しており、低電力エッジアクセラレータでは十分なサポートが得られないことが多い。YOLO26は精度を損なうことなくDFLを排除することに成功した。このアーキテクチャの簡素化により、組込みシステムとの互換性が大幅に向上し、YOLO26は前世代モデルと比較して最大43%CPU を実現している。

MuSGD オプティマイザ

トレーニングの安定性と速度が最優先事項である。YOLO26は、Moonshot AIのKimi K2によるLLMトレーニングの革新に大きく着想を得た、確率的勾配降下法(SGD)とMuonのハイブリッドであるMuSGDオプティマイザーを導入する。このオプティマイザーは、言語モデルトレーニングの安定性をコンピュータビジョンにもたらし、重いトランスフォーマー系手法と比較して、より速い収束を保証し、トレーニング中のメモリ使用量を削減する。

プログレスとSTAL

航空写真やドローン応用を扱う研究者にとって、微細な特徴の検出は長年の課題であった。YOLO26はProgLossとSTAL(Scale-Targeted Attention Loss)を組み合わせ、YOLO11と比較して微小物体認識において顕著な改善を実現した。

パフォーマンスとメトリクスの比較

両モデルを直接比較すると、YOLO26は精度とエッジデバイス効率において明らかな優位性を示しつつ、Ultralytics の特徴である驚異的に低いメモリ要件を維持している。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

注記:YOLO26 nano(YOLO26n)モデルは、YOLO11nと比較してCPU 約31%向上(38.9ms 対 56.1ms)しており、そのエッジファースト設計思想を際立たせている。

コンピュータビジョンタスクにおける汎用性

両モデルとも、高度にUltralytics 恩恵を受け、Python 比類のない使いやすさを提供します。これらは単なる物体検出器ではなく、マルチタスクの強力なツールです。ただし、YOLO26にはいくつかのタスク特化型の改良が組み込まれています:

  • インスタンスセグメンテーション:YOLO26は改良されたセマンティックセグメンテーション損失とマルチスケールプロトタイピングを採用し、YOLO11よりも鮮明なマスク境界を生成します。セグメンテーションワークフローの詳細はこちら。
  • 姿勢推定:残差対数尤度推定(RLE)を統合することで、YOLO26は複雑な人間の姿勢におけるキーポイント精度を劇的に向上させます。姿勢推定機能をご覧ください。
  • オリエンテッド境界ボックス(OBB):特殊な角度損失関数が過去の境界不連続問題を解決し、YOLO26が衛星画像における回転物体の検出において極めて高い信頼性を発揮します。OBBタスクについて読む。
  • 画像分類:両モデルとも高速分類を効率的に処理し、YOLO26はImageNetわずかながらトップ1精度を向上させている。

トレーニングと推論のコード例

Ultralytics 開発者体験で高くUltralytics 。最先端モデルのトレーニングや推論スクリプトの実行はわずか数行のコードで可能であり、定型コードを最小限に抑え生産性を最大化します。さらに、YOLO トレーニングには大規模なトランスフォーマーネットワークに比べて大幅にCUDA しか必要としません。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

理想的なユースケースと導入戦略

YOLO26とYOLO11 の選択は、完全に生産環境の制約によってYOLO11 。

YOLO26をいつ展開すべきか

YOLO26は、現代的な新規プロジェクトにおける決定的な選択肢です。特に以下の用途向けに構築されています:

  • エッジコンピューティングとIoT:その驚異的なCPU とDFL除去により、ラズベリーパイ、コーラルNPU、モバイルプロセッサといったデバイス群の頂点に立つ存在である。
  • ドローンと航空分析:ProgLossとSTALの統合により、広大な地形を移動する微小で高速な物体の追跡が唯一無二の能力として実現します。
  • レイテンシが重要なアプリケーション:自律ロボットや製造品質管理において、NMS設計は予期せぬ後処理スパイクなしに確定的なレイテンシを保証します。

YOLO11いつ保持すべきか

YOLO26が優れているとはいえ、YOLO11 非常に高性能なモデルYOLO11 。YOLO11 を使い続けるのも一案です:

  • レガシーパイプライン:既存のC++デプロイメントインフラストラクチャは、旧式アーキテクチャ特有のアンカーベース出力とNMS に緊密に結合されています。
  • 学術的基準:研究を発表するにあたり、新規アルゴリズムの評価基準として、広く認知された2024年の標準が必要である。

Ultralytics システムの力

YOLO11 YOLO26YOLO11 いずれをデプロイする場合でも、Ultralytics を活用することは、頻繁な更新と広範なコミュニティサポートを備えた、よく管理されたエコシステムを利用することを意味します。

企業チーム向けに、Ultralytics データアノテーション、モデルトレーニング、シームレスなクラウドデプロイメントを包括的に提供するエンドツーエンドソリューションです。トレーニング済み重みのエクスポートから CoreMLTensorRTへのエクスポートから高度なハイパーパラメータ調整の設定まで、提供されるツール群がAIライフサイクルを可能な限り効率化します。


コメント