YOLOv8とYOLO26の比較:リアルタイムビジョンAIの進化
コンピュータビジョンの状況は急速に進化しており、You Only Look Once (YOLO)ファミリーの各世代は、速度と精度において新たなベンチマークを設定しています。この系譜における2つの重要なマイルストーンは、Ultralytics YOLOv8と最先端のUltralytics YOLO26です。YOLOv8が業界リーダーが依拠する堅牢なエコシステムとマルチタスク機能を確立した一方で、YOLO26はエンドツーエンド推論やエッジデバイス向け最適化といった画期的なアーキテクチャ変更を導入しています。
このガイドは、研究者や開発者が、クラウドベースの分析からリソース制約のあるIoTアプリケーションまで、特定の展開ニーズに合った適切なモデルを選択できるよう、詳細な技術比較を提供します。
モデルの概要
Ultralytics YOLOv8
2023年1月にリリースされたYOLOv8は、物体検出、インスタンスセグメンテーション、姿勢推定、分類、および指向性バウンディングボックス (obb)タスクをサポートする統合フレームワークへの大きな転換点となりました。アンカーフリー検出と新しい損失関数を導入し、多様な産業において多用途な選択肢となっています。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023-01-10
- GitHub:Ultralytics リポジトリ
Ultralytics YOLO26
2026年1月に発表されたYOLO26は、効率とパフォーマンスにおける次の飛躍を象徴しています。推論時にNon-Maximum Suppression (NMS)の必要性を排除し、ネイティブなエンドツーエンド (E2E)として設計されています。これにより、特にCPUやエッジハードウェアで高速化が実現されます。Distribution Focal Loss (DFL) の削除とMuSGDオプティマイザの導入により、YOLO26は現代のデプロイメント制約向けに最適化されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026-01-14
- GitHub:Ultralytics リポジトリ
アーキテクチャの違い
YOLOv8からYOLO26への移行には、レイテンシの削減とトレーニングの安定性向上を目的とした根本的な構造変更が含まれています。
エンドツーエンドNMSフリー設計
YOLOv8のような従来の検出器における最も重要なボトルネックの1つは、重複するバウンディングボックスをフィルタリングするNMSとして知られる後処理ステップです。
- YOLOv8: 高度に最適化されているが必要不可欠なNMSステップを使用します。これは、効率的なNMSプラグインのサポートが異なるONNXやTensorRTなどの形式にエクスポートする際に、デプロイメントパイプラインを複雑にする可能性があります。
- YOLO26: YOLOv10によって開拓されたNMSフリーのアーキテクチャを採用しています。ネットワークから直接1対1の予測を生成することで、エクスポートロジックを簡素化し、推論レイテンシを削減するため、Raspberry Piやモバイルデバイスでのリアルタイムアプリケーションに最適です。
損失関数と最適化
YOLO26は、トレーニングレシピにいくつかの新しいコンポーネントを導入しています。
- MuSGD Optimizer: 大規模言語モデル(LLM)のトレーニング技術に触発されたSGDとMuonのハイブリッドです。このオプティマイザはトレーニングの勢いを安定させ、以前のバージョンで使用されていた標準のAdamWやSGDと比較して、より速い収束をもたらします。
- DFL Removal: Distribution Focal Lossの削除により、回帰ヘッドが簡素化されます。この複雑さの軽減は、YOLO26がCPU上で最大43%高速に動作できる主要因です。
- ProgLoss + STAL: Progressive Loss BalancingとSmall-Target-Aware Label Assignment (STAL)は、小さなオブジェクトに対する性能を大幅に向上させ、航空画像や産業検査に使用される汎用検出器の一般的な弱点に対処します。
注意: エッジデプロイメント
YOLO26におけるNMSとDFLの削除は、8ビット量子化に非常に適しています。TFLiteまたはCoreMLを使用してエッジハードウェアにデプロイする場合、YOLO26はYOLOv8と比較して、低精度でも高い精度を維持することがよくあります。
パフォーマンス指標
以下の表は、COCOデータセットにおけるYOLOv8とYOLO26モデルの性能を比較したものです。YOLO26は、すべてのモデルスケールで優れた速度と精度を示し、特にそのアーキテクチャ最適化が際立つCPU環境で顕著です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
注: 太字は、より優れた性能指標(高いmAP、低い速度/パラメータ/FLOPs)を示します。
トレーニング効率と使いやすさ
どちらのモデルも、「ゼロからヒーローへ」のシンプルさで知られる成熟したUltralyticsエコシステムの恩恵を受けています。
合理化されたAPI
YOLOv8を使用する場合でもYOLO26を使用する場合でも、Python APIは一貫しています。これにより、開発者は1行のコード変更でアーキテクチャを切り替えることができ、簡単なベンチマークとA/Bテストを容易にします。
from ultralytics import YOLO
# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Load a YOLO26 model
model_26 = YOLO("yolo26n.pt")
# Train YOLO26 on your custom dataset
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)
メモリとリソース
YOLO26は、RT-DETRのようなトランスフォーマーベースのモデルや古いYOLOバージョンと比較して、トレーニング中のメモリ効率が大幅に優れています。その簡素化された損失ランドスケープとMuSGDオプティマイザにより、同じGPUハードウェアでより大きなバッチサイズが可能になり、トレーニングインフラストラクチャの総所有コストを削減します。VRAMが限られているユーザーでも快適にファインチューニングできます。 yolo26s または yolo26m 一般的なコンシューマーGPUで動作するモデル。
理想的なユースケース
YOLOv8とYOLO26のどちらを選択するかは、お客様の特定の制約とデプロイ環境によって異なります。
YOLOv8を選択すべき時
- レガシー互換性: YOLOv8固有の後処理ロジックと密接に統合されており、容易に更新できない既存のパイプラインがある場合。
- 特定のコミュニティプラグイン: 一部の古いサードパーティツールや深く組み込まれたシステムは、YOLOv8のエクスポート形式に厳密な依存関係を持つ場合がありますが、Ultralyticsエクスポートモジュールはほとんどの変換をシームレスに処理します。
YOLO26を選択すべき時
- エッジコンピューティング: NVIDIA Jetson、携帯電話、または組み込みCPU上でのアプリケーション向けで、レイテンシの1ミリ秒が重要となる場合に適しています。43%のCPU高速化は、バッテリー駆動デバイスにとって画期的な進歩です。
- 小物体検出: ProgLossとSTALの改善により、YOLO26は、ターゲットがしばしば遠く微小であるドローン監視や農業検査において優れた選択肢となります。
- デプロイメントの簡素化: 非標準環境(例:カスタムFPGAや特殊なAIアクセラレータ)でNMSを実装する手間を避けたい場合、YOLO26のエンドツーエンドの特性は理想的です。
- 高性能タスク: 医療画像処理や安全性が重要な自動運転コンポーネントなど、可能な限り最高の精度を必要とするタスク向け。
結論
YOLOv8はコンピュータービジョン分野において強力で信頼性の高いツールであり続けていますが、YOLO26は効率的で高性能な検出の未来を象徴しています。そのアーキテクチャ革新は、NMSのような長年のデプロイメントにおける課題を解決しつつ、最先端の精度を提供します。
最先端を追求する開発者にとって、YOLO26へのアップグレードは、Ultralyticsの体験を特徴づける使いやすさを犠牲にすることなく、速度とモデルサイズにおいて即座のメリットをもたらします。これらの進歩を最大限に活用するために、新しいプロジェクトをYOLO26で開始することをお勧めします。
その他の検討すべきモデル
- YOLO11: YOLO26の直接的な前身であり、古いバージョンから移行するユーザー向けに、パフォーマンスと機能のバランスを提供します。
- YOLOv10: NMSフリーのアプローチを開拓したモデルであり、アーキテクチャの移行に関する学術研究に有用です。
- YOLO-World: カスタムデータセットでトレーニングすることなくオブジェクトを識別するのに最適なオープンボキャブラリ検出器で、テキストプロンプトを利用して検出を行います。