YOLOv8 YOLO26:リアルタイム視覚AIのための技術的進化
コンピュータビジョンの急速に進化する世界において、 YOLOv8からYOLO26への進化は、効率性、速度、アーキテクチャの洗練度において大きな飛躍を意味します。2023年にリリースされたYOLOv8 性と使いやすさで業界標準YOLOv8 一方、2026年に登場したYOLO26は、エンドツーエンドNMS検出やLLMに着想を得た最適化といった画期的な変更を導入しています。
このガイドは、開発者、研究者、エンジニアが特定の導入ニーズに最適なモデルを選択できるよう、詳細な技術比較を提供します。
モデルの概要
Ultralytics YOLOv8
著者:Glenn Jocher、Ayush Chaurasia、Jing Qiu
組織:Ultralytics
日付:2023-01-10
GitHub:ultralytics
ドキュメント:YOLOv8
2023年初頭にリリースされた YOLOv8 は、ビジョンAIのユーザー体験を再定義しました。物体検出、インスタンスセグメンテーション、姿勢推定、分類のための統一フレームワークを導入しました。PyTorch を基盤とし、アンカーフリー検出ヘッドとモザイクデータ拡張パイプラインを備え、速度と精度のバランスにおけるベンチマークとなりました。
Ultralytics YOLO26
著者:Glenn Jocher と Jing Qiu
組織:Ultralytics
日付:2026-01-14
GitHub:ultralytics
ドキュメント:YOLO26 ドキュメント
YOLO26は、エッジ最適化パフォーマンスへの需要の高まりに対応するために設計された、Ultralytics最新バージョンです。これはネイティブなエンドツーエンドNMSアーキテクチャを先駆的に採用し、推論のボトルネックとなることが多い後処理ステップを不要にしました。MuSGDオプティマイザーの採用や分布焦点損失(DFL)の排除といった最適化により、YOLO26は前世代と比較して最大43%高速CPU を実現します。
アーキテクチャの違い
YOLOv8 からYOLOv8 OLOYOLOv8 移行は、ネットワークが画像を処理しデータから学習する方法における根本的な変化を伴う。
1. エンドツーエンドNMSフリー設計
最も重要な違いの一つは、重複するバウンディングボックスの処理方法である。
- YOLOv8:後処理において非最大抑制(NMS)に依存し、重複するボックスを除去する。効果的ではあるが、NMS 特に非標準ハードウェアにおいて、遅延の変動性とデプロイメントの複雑さNMS 。
- YOLO26:ネイティブなエンドツーエンドアプローチを採用し、 YOLOv10と同様のネイティブなエンドツーエンドアプローチを採用しています。オブジェクトごとに正確に1つのボックスを出力するようモデルを訓練することで、NMS を完全に排除しています。これにより、確定的なレイテンシと、 TensorRT や CoreMLといったフォーマットへのエクスポートパイプラインを簡素化します。
NMSフリーが重要である理由
NMS 除去はエッジデプロイメントにおける画期的な変化NMS 。これによりCPUの計算オーバーヘッドが削減され、シーン内で検出されるオブジェクトの数にかかわらず、モデルの推論時間が一貫して維持される。
2. 損失関数と最適化
YOLO26は、大規模言語モデル(LLM)の学習から得られた知見を取り入れ、安定性と収束性を向上させている。
- ProgLoss + STAL:YOLO26はProgLossとSTAL(Soft Target Assignment Loss)を採用しており、これらはより滑らかな勾配と困難なサンプル(特に小物体検出において)への優れた対応を実現します。
- MuSGDオプティマイザー:Moonshot AIのKimi K2に着想を得たMuSGDオプティマイザーは、SGD Muonオプティマイザーに類似したモーメンタム更新SGD 組み合わせたものです。この革新により、高い学習率でのトレーニングが安定し、総トレーニング時間が短縮されます。
- DFL除去: YOLOv8 分布焦点損失(DFL)YOLOv8 ボックス境界を微調整した。YOLO26はエッジデバイス向けにアーキテクチャを簡素化するためDFLを除去し、精度を損なうことなく出力チャネル数とメモリ使用量を削減した。
3. タスク特化型強化
YOLOv8 汎用的に複数のタスクYOLOv8 一方で、YOLO26は特化した改良を追加している:
- セグメンテーション:よりシャープなマスク境界を実現するため、意味的セグメンテーション損失とマルチスケールプロトモジュールを導入する。
- ポーズ:キーポイント位置推定における不確実性をより適切に捉えるため、残差対数尤度推定(RLE)を用いる。
- OBB: 方向付き境界ボックス課題における境界不連続性を、専用の角度損失関数を用いて解決する。
パフォーマンス比較
COCO 性能指標の詳細な比較です。YOLO26は全モデルスケールにおいて優れた速度と効率性を示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
注記:YOLO26nは、YOLOv8n と比較して CPU を43%も削減するという顕著な成果を達成YOLOv8n 精度を3.6mAP向上させている。
トレーニングとユーザビリティ
両モデルとも、その「ゼロからヒーローへ」というシンプルさで知られる堅牢なUltralyticsエコUltralytics 恩恵を受けています。
使いやすさとエコシステム
YOLOv8 を選択しても、同じ統一APIを利用できます。モデル間の切り替えは、コード内の文字列を変更するだけで簡単に行えます。
from ultralytics import YOLO
# Load YOLOv8
model_v8 = YOLO("yolov8n.pt")
# Load YOLO26 (Recommended)
model_26 = YOLO("yolo26n.pt")
# Training is identical
model_26.train(data="coco8.yaml", epochs=100)
Ultralytics (旧称HUB)と完全に統合されており、シームレスなデータセット管理、クラウドトレーニング、ワンクリックデプロイメントを実現します。
トレーニング効率
YOLOv8 は非常に効率的ですが、通常は標準的なSGD AdamW 必要とします。MuSGDオプティマイザーを備えたYOLO26は、収束が速く、貴重なGPU 節約できます。さらに、YOLO26は、CUDA 多用するアーキテクチャ(例: RT-DETRなどのトランスフォーマーを多用するアーキテクチャと比較して、トレーニング時のCUDAメモリ使用量が少ないため、NVIDIA 3060や4090などのコンシューマー向けGPUでもより大規模なバッチでトレーニングが可能です。
理想的なユースケース
YOLOv8を使い続けるべき時
- レガシープロジェクト: YOLOv8 を中心に構築済みの安定した本番パイプラインがありYOLOv8 アップグレードのための検証時間を割く余裕がない場合。
- 研究のベースライン: YOLOv8 、その広範な採用と引用により、比較のための標準的な学術ベースラインYOLOv8 。
YOLO26へのアップグレード時期
- エッジデプロイメント: Raspberry Pi、モバイルデバイス、または組み込みシステム上で動作するアプリケーションにおいて、 CPU 極めて重要です。
- リアルタイム遅延: 自律走行やロボティクスなどのアプリケーションで決定論的遅延が必要な場合、NMS設計により混雑したシーンでの後処理によるジッターが排除されます。
- 高精度要件:YOLO26は全mAP YOLOv8 を一貫して上回り、医療画像診断や欠陥検出など精度が重要なタスクにおいてより優れた選択肢となる。
結論
一方 YOLOv8 は依然として強力で汎用性の高いツールですが、YOLO26は効率的なコンピュータビジョンの未来を体現しています。Ultralytics 使いやすさと、NMS検出やLLMに着想を得た最適化といった最先端のアーキテクチャ革新を組み合わせることで、YOLO26は魅力的なアップグレードパスを提供します。
現在新規プロジェクトを開始する開発者にとって、YOLO26は2026年時点で利用可能な速度、精度、リソース効率の最適なバランスを提供する推奨選択肢です。
参考資料
- 他のモデルを探索する YOLO11 などの他のモデルも比較のために探ってみてください。
- ONNX TensorRT ONNX モデルのエクスポートについて学ぶ。
- 最新のチュートリアルやケーススタディについては、Ultralytics をご覧ください。