コンテンツにスキップ

YOLO26 vs.YOLO11:エンドツーエンド視覚AIの新時代

物体検出技術の進化は、速度・精度・効率性への絶え間ない追求によって特徴づけられてきた。この道のりにおける最も重要な二つのマイルストーンがYOLO26とYOLO11である。両モデルとも Ultralyticsに端を発するものの、異なる世代のアーキテクチャ哲学を体現しています。本比較ではこれらのアーキテクチャの技術的差異を掘り下げ、開発者や研究者が特定のコンピュータビジョン用途に適したツールを選択する手助けをします。

性能指標の比較

以下の表は、COCO における2つのモデルファミリーの性能差を比較したものです。YOLO26のCPU 速度が大幅に向上している点に注目してください。これはアーキテクチャの最適化による直接的な結果です。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

アーキテクチャの進化

YOLO26:NMS革命

2026年1月にリリースされたYOLO26は、ネイティブなエンドツーエンド物体検出へのパラダイムシフトを体現している。重複するバウンディングボックスをフィルタリングするために非最大抑制(NMS)のような経験則に基づく後処理ステップに依存する従来の検出器とは異なり、YOLO26はこのロジックをネットワークアーキテクチャに直接組み込んでいる。この概念は元々、 YOLOv10などの研究で先駆的に提唱されたこの概念は、YOLO26において実運用レベルの安定性のために完成された。

主要なアーキテクチャ革新には以下が含まれます。

  • エンドツーエンドNMS設計: NMS排除することで、YOLO26はデプロイメントパイプラインを簡素化します。これは特に、NMS 変動がリアルタイムアプリケーションにジッターを引き起こす可能性のあるエッジコンピューティングシナリオにおいて有益です。
  • DFL除去:ディストリビューション・フォーカル・ロス(DFL)を除去することで、モデルの出力層が合理化されます。この変更により、低電力デバイスとの互換性が大幅に向上し、カスタム演算子の必要数が減少するため、CoreMLへのモデルエクスポートが簡素化されます。
  • MuSGDオプティマイザー:Moonshot AIのKimi K2などの大規模言語モデル(LLM)トレーニング技術革新に着想を得たYOLO26は、SGD 組み合わせたハイブリッドオプティマイザーを採用しています。これによりトレーニング実行の安定性が大幅に向上し、複雑なデータセットでもより高速な収束を実現します。
  • ProgLoss + STAL:漸進的損失関数(ProgLoss)と自己学習アンカー損失(STAL)の導入により、小物体検出において顕著な改善がもたらされる。これらの損失関数は学習中に焦点を動的に調整し、困難な例(しばしば小物体や遮蔽された物体)がより効果的に学習されることを保証する。

CPU 重要な理由

上記の表は、YOLO26nCPU 38. CPU を達成CPU YOLO11nは56.1msCPU 示しています。 CPU の43%向上により、民生用ハードウェアでのリアルタイム分析が可能となり、小売やIoT展開における高価な専用GPUの必要性が低減されます。

YOLO26についてさらに詳しく

YOLO11: 堅牢な標準

YOLO112024年9月にリリースされたYOLO11は、C3k2ブロックの導入とSPPF(Spatial Pyramid Pooling - Fast)モジュールのYOLOv8 遺産を継承しています。高い能力と堅牢性を維持しつつも、従来のアンカーフリー検出ヘッドに依存しており、NMS 必要とします。

YOLO11 、広範なレガシーサポートが必要なシナリオや、前世代の特定のアーキテクチャ上の癖に依存する場合にYOLO11 。しかし、YOLO26の合理化されたアーキテクチャと比較すると、後処理段階でわずかに多くの計算オーバーヘッドを伴い、高スループット環境ではボトルネックとなる可能性があります。

YOLO11の詳細について。

理想的なユースケース

YOLO26を選択すべき時

YOLO26は、効率性と導入の容易性を優先するプロジェクトを中心に、ほぼ全ての新規プロジェクトにおいて推奨される選択肢です。

  1. エッジAIとIoT: CPU NMS設計により、YOLO26はラNVIDIA デバイスに最適です。制御ループに一貫したタイミングが求められるロボティクス分野では、低遅延変動性が極めて重要です。
  2. 複雑な視覚タスク:検出機能に加え、YOLO26はタスク特化型の改善を提供する。例えば、残差対数尤度推定(RLE)は姿勢推定の精度を大幅に向上させ、一方、専用角度損失関数は航空画像における方向付き境界ボックス(OBB)の精度を向上させる。
  3. 低消費電力アプリケーション:DFLの除去と最適化されたアーキテクチャにより、YOLO26は推論あたりの消費電力が低減され、モバイルアプリケーションにおけるバッテリー寿命を延長します。

YOLO11を選択すべき時

YOLO11 次の場合に有効な選択肢YOLO11 :

  • レガシーシステム:既存のパイプラインYOLO11特定の出力形式に高度に最適化されており、後処理ロジックを更新するためのエンジニアリング時間を割く余裕がない場合(ただしUltralyticsを使用すればYOLO26への移行は一般的にシームレスです)。
  • ベンチマークの基準線:研究者はYOLO11 YOLOv8などの広く採用されているモデルをよく使用しますYOLO11 YOLOv8 といった広く採用されているモデルを、新規アーキテクチャとの比較のためのベースラインとして用いることが多い。

Ultralyticsの利点

YOLO26を選択するかYYOLO11を選択するかに関わらず、Ultralytics を活用することで、競合フレームワークに対して明確な優位性が得られます。

使いやすさと汎用性

Ultralytics 「ゼロからヒーローへ」の体験を実現するよう設計されています。単一Python で検出セグメンテーション分類追跡をサポートします。この汎用性により、エンジニアリングチームは新たなコードベースを習得することなく、タスク間を柔軟に切り替えられます。

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")

トレーニング効率とメモリ

両モデルとも学習効率が最適化されていますが、YOLO26のMuSGDオプティマイザはこのプロセスをさらに安定化させます。膨大なVRAMを必要とする大規模なトランスフォーマーベースのモデルとは異なり、Ultralytics YOLO 多くの場合、コンシューマー向けGPUで微調整が可能であり、最先端AIへのアクセスを民主化します。

適切に維持されたエコシステム

Ultralytics オープンソースライブラリは、プロジェクトの将来性を保証します。頻繁なアップデート、充実したドキュメント、データセット管理とクラウドトレーニングのためのツールにより、強力なコミュニティと活発な開発チームによるサポートが受けられます。

モデルメタデータ

YOLO26

YOLO11

その他のモデルを見る

異なるアーキテクチャの探索に関心のあるユーザー向けに、Ultralytics サポートしています RT-DETR による検出と、ゼロショットセグメンテーションタスク向けのSAM をサポートしています。

結論

一方 YOLO11 は堅牢で高性能なモデルであり続ける一方、YOLO26は効率性と速度において新たな基準を確立しました。エンドツーエンドNMS設計に加え、大幅なCPU 最適化と高度な損失関数を組み合わせることで、現代のコンピュータビジョンアプリケーションにおける優れた選択肢となっています。YOLO26を採用することで、開発者はより高い精度と高速なパフォーマンスを、複雑さを抑えつつ実現できます。しかも、ユーザーフレンドリーなUltralytics 内でこれらをすべて達成できるのです。


コメント