YOLO26 vsYOLO11:ビジョンAIにおける世代を超えた飛躍
最先端のコンピュータビジョンシステムを構築する際、精度、レイテンシ、リソース効率のバランスを取るためには、適切なモデルの選択が極めて重要です。急速に進化する人工知能の分野において、 Ultralytics は可能性の限界を押し広げ続けています。この詳細な技術比較では、非常に成功した YOLO11 から革新的な新モデルYOLO26への移行を検証し、AIエンジニアや研究者が適切なアーキテクチャ選択を行うために必要な知見を提供します。
モデル系譜とメタデータ
両モデルはUltralyticsによって開発されましたが、物体detectおよびマルチタスクビジョンモデルのタイムラインにおいて異なるパラダイムを代表しています。
YOLO26の詳細:
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026-01-14
- GitHub:Ultralytics リポジトリ
- ドキュメント:YOLO26 公式ドキュメント
YOLO11 :
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:Ultralytics リポジトリ
- ドキュメント:YOLO11 公式ドキュメント
その他のアーキテクチャ
YOLO26は当社で最も先進的なリアルタイムモデルですが、高度に専門化されたハードウェアや膨大なメモリ容量を扱うユーザーは、以下のようなトランスフォーマーベースのアーキテクチャも検討できます。 RT-DETR や、画期的なNMS先駆者である YOLOv10といったトランスフォーマーベースのアーキテクチャを検討することも可能です。
アーキテクチャの違いと革新
YOLO11 飛躍は、モデルアーキテクチャと基盤となるトレーニング手法の両方において根本的な転換を伴う。YOLO11 物体検出とマルチタスク学習の堅牢な基盤をYOLO11 一方で、YOLO26はエッジコンピューティング向けの展開パイプラインを完全に刷新した。
エンドツーエンドNMSフリー設計
YOLO26における最も重要な改良点の1つは、ネイティブのエンドツーエンドアーキテクチャである。重複するバウンディングボックスをフィルタリングするために非最大抑制(NMS)後処理に依存YOLO11異なり、YOLO26はこのステップを完全に排除している。この概念は最初に YOLOv10で初めて導入されたこの概念は、遅延変動を劇的に低減し、多様なエッジデバイスにおける展開ロジックを簡素化します。
エッジ効率のためのDFL除去
YOLO11 境界ボックス推定の精度向上に分布型焦点損失(DFL)YOLO11 しかしDFLは複雑なソフトマックス演算に依存しており、低電力エッジアクセラレータでは十分なサポートが得られないことが多い。YOLO26は精度を損なうことなくDFLを排除することに成功した。このアーキテクチャの簡素化により、組込みシステムとの互換性が大幅に向上し、YOLO26は前世代モデルと比較して最大43%CPU を実現している。
MuSGD オプティマイザ
トレーニングの安定性と速度が最優先事項である。YOLO26は、Moonshot AIのKimi K2によるLLMトレーニングの革新に大きく着想を得た、確率的勾配降下法(SGD)とMuonのハイブリッドであるMuSGDオプティマイザーを導入する。このオプティマイザーは、言語モデルトレーニングの安定性をコンピュータビジョンにもたらし、重いトランスフォーマー系手法と比較して、より速い収束を保証し、トレーニング中のメモリ使用量を削減する。
プログレスとSTAL
航空画像やドローンアプリケーションを扱う研究者にとって、微小な特徴のdetectは歴史的な課題です。YOLO26はProgLossとSTAL(Scale-Targeted Attention Loss)を組み合わせることで、YOLO11と比較して小オブジェクト認識において顕著な改善をもたらします。
パフォーマンスとメトリクスの比較
両モデルを直接比較すると、YOLO26は精度とエッジデバイス効率において明らかな優位性を示しつつ、Ultralytics の特徴である驚異的に低いメモリ要件を維持している。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
注記:YOLO26 nano(YOLO26n)モデルは、YOLO11nと比較してCPU 約31%向上(38.9ms 対 56.1ms)しており、そのエッジファースト設計思想を際立たせている。
コンピュータビジョンタスクにおける汎用性
両方のモデルは、高度に維持されたUltralyticsエコシステムの恩恵を受け、統一されたPython APIを通じて比類のない使いやすさを提供します。これらは単なる物体検出器ではなく、マルチタスクの強力なツールです。しかし、YOLO26はいくつかのタスク固有の進歩を取り入れています。
- インスタンスセグメンテーション: YOLO26は、洗練されたセマンティックsegmentation損失とマルチスケールプロトタイピングを使用し、YOLO11よりも鮮明なマスク境界を生成します。segmentationワークフローの詳細については、こちらをご覧ください。
- 姿勢推定: 残差対数尤度推定 (RLE) を統合することで、YOLO26は複雑な人間の姿勢におけるキーポイントの精度を劇的に向上させます。姿勢推定機能をご覧ください。
- Oriented Bounding Boxes (obb): 特殊な角度損失関数が従来の境界不連続性の問題を解決し、YOLO26を衛星画像フィード内の回転オブジェクトのdetectに非常に信頼性の高いものにしています。obbタスクについてお読みください。
- 画像分類: 両モデルは高速分類を効率的に処理し、YOLO26はImageNetでわずかなtop-1精度向上を実現しています。
トレーニングと推論のコード例
Ultralytics 開発者体験で高くUltralytics 。最先端モデルのトレーニングや推論スクリプトの実行はわずか数行のコードで可能であり、定型コードを最小限に抑え生産性を最大化します。さらに、YOLO トレーニングには大規模なトランスフォーマーネットワークに比べて大幅にCUDA しか必要としません。
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()
理想的なユースケースと導入戦略
YOLO26とYOLO11の選択は、生産環境の制約に全く依存します。
YOLO26をいつ展開すべきか
YOLO26は、現代的な新規プロジェクトにおける決定的な選択肢です。特に以下の用途向けに構築されています:
- エッジコンピューティングおよびIoT: 驚異的なCPUパフォーマンスとDFLの削除により、Raspberry Pi、Coral NPU、およびモバイルプロセッサのようなデバイスの王者となっています。
- ドローンおよび航空分析: ProgLoss + STALの統合により、広大な風景の中で微小な高速移動オブジェクトをtrackする独自の能力を発揮します。
- レイテンシーが重要なアプリケーション: 自律ロボット工学や製造品質管理において、NMSフリーの設計は、予期せぬ後処理の急増なしに決定論的なレイテンシーを保証します。
YOLO11いつ保持すべきか
YOLO26が優れているとはいえ、YOLO11 非常に高性能なモデルYOLO11 。YOLO11 を使い続けるのも一案です:
- レガシーパイプライン: 既存のC++デプロイメントインフラストラクチャが、古いアーキテクチャの特定のアンカーベースの出力とNMSロジックに密接に結合している場合。
- Academic Baselines: 研究を発表しており、新しいアルゴリズムをベンチマークするための高く評価された2024年の標準が必要な場合。
Ultralytics システムの力
YOLO11 YOLO26YOLO11 いずれをデプロイする場合でも、Ultralytics を活用することは、頻繁な更新と広範なコミュニティサポートを備えた、よく管理されたエコシステムを利用することを意味します。
エンタープライズチームにとって、Ultralytics Platformは、データアノテーション、モデルトレーニング、シームレスなクラウド展開のためのエンドツーエンドソリューションを提供します。訓練済み重みをCoreMLまたはTensorRTにエクスポートすることから、高度なハイパーパラメータチューニングの設定まで、提供されるツールはAIライフサイクルが可能な限り効率化されることを保証します。