YOLO26 vs.YOLOv9:リアルタイム物体検出の次なる進化
物体検出アーキテクチャの進化は、速度、精度、効率性への絶え間ない追求によって特徴づけられてきた。YOLO26と YOLOv9 を比較すると、この急速な進歩が浮き彫りになる。YOLOv9 プログラマブル勾配により情報保持の限界をYOLOv9 一方で、新たに登場したYOLO26は、エッジ性能と大幅なCPU に特化して最適化されたエンドツーエンドNMSキテクチャにより、この分野の概念を再定義している。
モデル概要
YOLO26
YOLO26は2026年初頭時点における最先端の視覚AI技術である。 Ultralyticsによって開発され、ノン・マキシマム・サプレッション(NMS)を不要とするネイティブなエンドツーエンド設計を導入し、デプロイメントパイプラインを効率化します。ディストリビューション・フォーカル・ロス(DFL)を排除し、LLMトレーニングに着想を得たSGD ミューオンを融合した新規最適化アルゴリズムMuSGDを統合することで、YOLO26は最高レベルの精度を維持しながら CPU 最大43%高速化します。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026年1月14日
- 主な特徴: NMSのエンドツーエンド検出、MuSGDオプティマイザ、ProgLoss + STAL
- GitHub:Ultralytics リポジトリ
YOLOv9
2024年初頭にリリースされた、 YOLOv9 はプログラマブル勾配情報(PGI)とGELANアーキテクチャの概念を導入しました。これらの革新は深層ネットワークにおける「情報ボトルネック」問題に対処し、フィードフォワード処理中に重要なデータが失われることを防ぎました。特に高いパラメータ効率を必要とする研究用途において、依然として強力なモデルです。
- 著者: Chien-Yao Wang、Hong-Yuan Mark Liao
- 組織: 中央研究院 情報科学研究所
- 日付: 2024年2月21日
- 主な特徴:プログラマブル・グラディエント情報(PGI)、GELANアーキテクチャ
- Arxiv:YOLOv9
- GitHub:YOLOv9 リポジトリ
技術アーキテクチャの比較
これら二つのモデルのアーキテクチャ上の相違は、理論的な情報フローの最適化から実践的な展開効率への移行を意味する。
YOLO26: 効率性とエッジファースト設計
YOLO26は、後処理と損失計算の計算オーバーヘッドの削減に焦点を当てている。
- エンドツーエンドNMS:従来の検出器は冗長なバウンディングボックスを出力しNMS必要とするが、YOLO26は正確な物体セットを直接予測する。これにより遅延のばらつきが低減され、複雑なカスタムNMS 不要となるため、 ONNX TensorRT形式へのエクスポートが簡素化される。
- ProgLoss + STAL:プログレッシブ損失(Progressive Loss)とソフトターゲットアンカーラベリング(Soft-Target Anchor Labeling)の導入により、小型物体検出が大幅に改善された。これはドローン画像やロボット検査において極めて重要な要件である。
- MuSGDオプティマイザ:大規模言語モデル(LLM)のトレーニング技術からコンピュータビジョン分野へ革新をもたらすこのハイブリッドオプティマイザは、トレーニングの勢いを安定化させ、ハイパーパラメータ調整を最小限に抑えながら収束を加速させます。
YOLOv9: 情報保持
YOLOv9アーキテクチャは、深層ネットワークにおける情報消失問題の解決を核として構築されている。
- PGI(プログラマブル勾配情報):補助的な監視分岐がネットワーク重み更新のための信頼性の高い勾配を生成し、深層が意味情報を保持することを保証する。
- GELAN(汎用効率的層集約ネットワーク):このバックボーンはパラメータ利用率を最適化し、YOLOv9 先行モデルよりも少ないパラメータで高精度を達成YOLOv9 可能にする。ただし、合理化されたYOLO26と比較すると、計算複雑度(FLOPs)が高くなる場合が多い。
デプロイメントの簡素化
NMS 削除は、エッジデプロイメントにおいて画期的な変化をもたらす。YOLOv9のような旧モデルでは、モデルがGPU動作しているCPU NMS CPU 上で実行され、ボトルネックを生んでいた。YOLO26の出力は即座に使用可能な状態で提供されるため、Raspberry Piやモバイルデバイス上での処理速度が大幅に向上する。
パフォーマンス指標
以下の表は標準ベンチマークにおけるモデル比較を示す。CPU 顕著な速度優位性を示す点に注目されたい。これはアーキテクチャ最適化の直接的な成果である。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Ultralytics 強み
YOLOv9 強力な理論的基盤YOLOv9 、Ultralytics 内でYOLO26を使用することは、開発者や企業にとって明確な利点をもたらします。
比類のない使いやすさ
Ultralytics Python 複雑なトレーニングワークフローを数行のコードに変換します。この「ゼロからヒーローへ」の体験は、他の多くのリポジトリの研究中心のセットアップとは対照的です。
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
タスクを横断する汎用性
YOLOv9主に物体検出に焦点を当てているのとは異なり、Ultralytics とYOLO26は、より幅広いコンピュータビジョンタスクをネイティブにサポートします。これにより、単一の統一されたAPIを使用して以下のことが可能になります:
- インスタンスセグメンテーション:ピクセル単位の精密なオブジェクトマスキング。
- 姿勢推定:人間活動解析のためのキーポイント検出
- OBB(方向付き境界ボックス):衛星画像における船舶などの回転した物体の検出。
- 分類:画像全体のカテゴリ分類。
トレーニングと記憶効率
Ultralytics リソース効率に優れるよう設計されています。YOLO26は、トランスフォーマーを多用する代替モデルと比較して、トレーニング中にGPU (VRAM)GPU 一般的に少なくて済みます。この効率性により以下のことが可能となります:
現実世界のアプリケーション
適切なモデルの選択は、具体的な導入上の制約条件によって異なります。
エッジコンピューティングとIoT
YOLO26はエッジデバイスにおける絶対的な王者である。43%高速化CPU により、ラズベリーパイやNVIDIA Nanoといったデバイス上で、重度の量子化を必要とせずにリアルタイム監視を実現可能とする。例えば、ローカルハードウェア上で動作するスマート駐車システムは、NMS設計の恩恵を大きく受け、レイテンシの急上昇を低減できる。
高高度点検
ドローンによる農業モニタリングやインフラ点検において、YOLO26 はProgLoss + STAL機能により優れた性能を発揮する。これらの機能は特に小型物体や困難なアスペクト比への対応を強化し、従来世代よりも高いリコール率でパイプラインの亀裂や作物の害虫を検出することを保証する。
学術研究
YOLOv9 学術研究、特に勾配流とネットワークアーキテクチャ理論に焦点を当てた研究において、依然として有力な候補である。そのPGI(深層情報保持)の概念は、ニューラルネットワークが情報深度を保持する仕組みを探求する上で興味深い道筋を提供している。
結論
両アーキテクチャはコンピュータビジョンにおける重要なマイルストーンである。YOLOv9 深層ネットワークにおける勾配情報の重要性YOLOv9 。しかしYOLO26は、その知見を実用レベルの強力なシステムへと昇華させた。エンドツーエンドNMS、優れたCPU 、Ultralytics シームレスな統合により、YOLO26は現代のAIアプリケーションにおいて速度・精度・使いやすさの最適なバランスを提供する。
最先端を追求する開発者には、最適化器の安定性とエッジ性能における最新の進歩を活用するため、YOLO26への移行をお勧めします。
参考資料
Ultralytics 他の高性能モデルにご興味がある場合は、以下をご覧ください YOLO11 (汎用タスク向け)または RT-DETR (トランスフォーマーベースのリアルタイム検出用)をご覧ください。