YOLOv5 vs. YOLO26: リアルタイムobject detectionの進化
object detectionの進化は、効率と精度の著しい飛躍によって特徴づけられてきました。長年にわたり、YOLOv5は、その速度と使いやすさのバランスで愛され、業界標準としての地位を確立していました。しかし、コンピュータビジョンの状況は急速に変化しています。そこに登場したのが、Ultralyticsの最新世代であるYOLO26です。これは、エッジデバイスと高性能サーバーの両方で可能なことを再定義します。
このガイドでは、伝説的なYOLOv5と最先端のYOLO26を技術的に比較し、そのアーキテクチャ、性能指標、理想的なユースケースを分析することで、次のコンピュータビジョンプロジェクトに最適なツールを選択するのに役立ちます。
比較の概要
両モデルはUltralyticsのアクセシブルなAIへのコミットメントの産物ですが、それぞれ異なる設計思想の時代を代表しています。YOLOv5は堅牢でユーザーフレンドリーなエコシステムの確立に注力しましたが、YOLO26はレイテンシとアーキテクチャ効率の限界を押し広げています。
YOLOv5: レガシー標準
Glenn Jocherによって2020年6月にリリースされたYOLOv5は、object detectionのアクセシビリティに革命をもたらしました。これは、前身のDarknetフレームワークから脱却し、PyTorchエコシステム内で直接シームレスなトレーニング体験を提供する最初のモデルの一つでした。
- 日付: 2020-06-26
- 著者: Glenn Jocher
- 組織:Ultralytics
- 主要機能: 非最大抑制(NMS)を必要とするアンカーベース検出。
YOLOv5は、特に推論パイプラインの更新が高コストになる可能性のあるレガシーシステムにおいて、信頼性の高い主力として機能し続けています。その「アンカーベース」アーキテクチャは、事前定義されたボックスに依存してオブジェクトの位置を予測します。この方法は効果的ですが、ハイパーパラメータの慎重なチューニングが必要です。
YOLO26: 新たなフロンティア
2026年1月にGlenn JocherとJing QiuによってリリースされたYOLO26は、現代のEdge AI時代向けに設計された抜本的なアーキテクチャの変更を導入しています。アンカーと複雑な後処理から脱却し、精度を損なうことなく純粋な速度を提供します。
- 日付: 2026-01-14
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 主要機能: エンドツーエンドのNMSフリー、MuSGD Optimizer、DFLの削除。
YOLO26は、最大スループットを必要とする開発者向けに構築されています。NMSの必要性を排除することで、デプロイメントロジックを簡素化し、レイテンシを削減するため、CPUやモバイルデバイス上でのリアルタイムアプリケーションにとって優れた選択肢となります。
技術的パフォーマンス比較
以下のメトリクスは、性能における世代間の飛躍を浮き彫りにしています。テストは、COCOデータセット(オブジェクトdetectタスクの標準ベンチマーク)で実施されました。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
主なポイント
- CPU効率: YOLO26nはYOLOv5nと比較してCPUで約2倍高速でありながら、精度(mAP 28.0% vs 40.9%)が大幅に向上しています。これは、GPUリソースが利用できないRaspberry Piやモバイルデバイスへのデプロイにおいて極めて重要です。
- パラメータ効率: YOLO26xは、YOLOv5x(50.7%)よりも大幅に高い精度(mAP 57.5%)を達成しつつ、パラメータ数はほぼ半分(55.7M vs 97.2M)に抑えられています。このモデルサイズの削減により、メモリ要件とストレージコストが低減されます。
- 精度/速度のトレードオフ: YOLO26の「Nano」バージョンは、より小さなモデルクラスであるにもかかわらず、YOLOv5の「Small」バージョンよりも精度において優れています。
YOLOv5からのアップグレード
現在YOLOv5sを使用している場合、YOLO26nに切り替えることで、より高い精度とより高速な推論が同時に得られる可能性が高く、計算コストとレイテンシの両方が削減されます。
アーキテクチャの詳細
この性能差は、モデルがdetectの問題にどのようにアプローチするかの根本的な違いに起因しています。
1. エンドツーエンドNMSフリー設計
YOLOv5は、数千の潜在的なバウンディングボックスを生成する従来のアプローチを使用しています。これらのボックスを最終的なdetect結果に絞り込むために、Non-Maximum Suppression (NMS)と呼ばれる後処理ステップが必要です。このステップは、FPGAやNPUのようなハードウェア上では遅く、高速化が困難な場合があります。
YOLO26はネイティブにエンドツーエンドです。訓練中にデュアルラベル割り当て戦略を採用しており、モデルにオブジェクトごとに単一の高品質なボックスを予測させます。これにより、推論時のNMSステップが完全に不要になります。
- 利点: 低レイテンシとよりシンプルなデプロイパイプライン(カスタムエクスポートのためにC++やCUDAでNMSを実装する必要がありません)。
- 結果: 重い後処理に依存していた以前の世代と比較して、最大43%高速なCPU推論を実現します。
2. 損失関数: DFLの排除とProgLoss
YOLOv5(およびその後のYOLOv8)は、ボックスの境界を洗練するためにDistribution Focal Loss(DFL)を利用していました。DFLは効果的であるものの、計算オーバーヘッドとエクスポートプロセスに複雑さを追加します。
YOLO26はDFLを削除し、INT8デプロイメント向けに量子化しやすい簡素化された回帰ヘッドに戻しました。潜在的な精度損失を補償するために、YOLO26はProgLoss(Progressive Loss Balancing)とSTAL(Small-Target-Aware Label Assignment)を導入しています。
- STAL: 「小オブジェクト」問題に特化して対処し、遠距離または微小なターゲットに対する性能を向上させます。これはv5を含む以前のYOLOバージョンにおける一般的な弱点でした。
- ProgLoss: 訓練中に異なる損失コンポーネントの重みを動的に調整し、収束を安定させます。
3. MuSGDオプティマイザ
訓練の安定性は、YOLO26チームの主要な焦点でした。YOLOv5は通常、標準的なSGDまたはAdam optimizersに依存していましたが、YOLO26は、Moonshot AIのKimi K2および大規模言語モデル(LLM)の訓練技術に触発されたハイブリッドオプティマイザであるMuSGDを組み込んでいます。
- 革新: Muon最適化の安定性をコンピュータビジョンにもたらし、損失の急増のリスクなしに、より高い学習率とより速い収束を可能にします。
汎用性とタスクサポート
両モデルはUltralyticsエコシステムに統合されており、幅広いコンピュータビジョンタスクをサポートしています。しかし、YOLO26にはYOLOv5にはないタスク固有のアーキテクチャ改善が含まれています。
| 機能 | YOLOv5 | YOLO26 |
|---|---|---|
| 物体検出 | ✅ 標準的なアンカーベース | ✅ NMS-Free、小オブジェクト向けSTAL |
| セグメンテーション | ✅ v7.0で追加 | ✅ Semantic Loss & マルチスケールProto |
| 姿勢推定 | ❌ (フォークで利用可能) | ✅ RLE (残差対数尤度推定) |
| OBB | ❌ (フォークで利用可能) | ✅ Angle Loss による高精度な回転 |
| 分類 | ✅ サポート済み | ✅ 最適化されたアーキテクチャ |
YOLO26の姿勢推定におけるResidual Log-Likelihood Estimation (RLE)のサポートは、人間の姿勢追跡において非常に高精度なキーポイントを提供し、スポーツ分析やヘルスケアアプリケーションにおいて優れています。
学習と使用法
Ultralyticsエコシステムの強みの一つは、統一されたAPIです。YOLOv5(最新のパッケージ経由)を使用する場合でもYOLO26を使用する場合でも、コードは一貫しておりシンプルです。
pythonコード例
両方のモデルで学習と推論を行う方法は次のとおりです。 ultralytics パッケージを使用します。なお、YOLOv5の場合、最新のパッケージは yolov5u 互換性を高めるために(アンカーフリーに適合した) 重みをデフォルトで使用しますが、アーキテクチャに関する比較は有効です。
from ultralytics import YOLO
# Load the models
model_v5 = YOLO("yolov5s.pt") # Legacy standard
model_26 = YOLO("yolo26n.pt") # New NMS-free standard
# Comparison: Inference on an image
# YOLO26 requires no NMS post-processing arguments in export/deployment
results_v5 = model_v5("https://ultralytics.com/images/bus.jpg")
results_26 = model_26("https://ultralytics.com/images/bus.jpg")
# Print results to see speed differences
print(f"YOLOv5 Speed: {results_v5[0].speed}")
print(f"YOLO26 Speed: {results_26[0].speed}")
# Train YOLO26 on custom data
# The MuSGD optimizer is handled automatically
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)
Ultralytics Platform(旧HUB)は、コードを書かずにクラウドでデータセットを管理し、両方のモデルを学習させることを可能にすることで、これをさらに簡素化します。ただし、プラットフォームで作成される新規プロジェクトではYOLO26が推奨されるデフォルトです。
デプロイメントとエコシステム
YOLOv5には大規模なレガシーエコシステムがあります。何千ものチュートリアル、サードパーティ製リポジトリ、およびハードウェア統合が、特に yolov5 形式向けに書かれています。YOLOv5の正確な出力tensor形状を厳密に必要とする、堅牢で古いハードウェアパイプラインを使用している場合、YOLOv5は依然として有効な選択肢です。
しかし、最新のデプロイメントにおいては、YOLO26は優れたエクスポートオプションを提供します。
- エッジAI: DFLとNMSの削除により、YOLO26モデルはTensorRTやOpenVINOなどの形式への変換が大幅に容易になります。
- 量子化: YOLO26は量子化フレンドリーに設計されており、モバイルプロセッサ向けにINT8に変換した場合でも高い精度を維持します。
結論
YOLOv5が物体detectを民主化した伝説的なモデルである一方、YOLO26は未来を象徴しています。そのエンドツーエンドのNMSフリー設計、重い損失関数の削除、およびMuSGDのようなLLMにインスパイアされたオプティマイザの統合により、YOLO26はYOLOv5では到底到達できないパフォーマンスプロファイルを提供します。
新しいプロジェクトを開始する開発者にとって、YOLO26は明確な推奨です。低いレイテンシでより高い精度、少ないメモリ使用量、そしてよりシンプルなデプロイメントパスを提供します。
その他のモデルを見る
特殊なアーキテクチャに興味のあるユーザーは、YOLO26の直接の前身であり、優れた汎用性能を提供するYOLO11、または、トレーニングセットに存在しない物体をdetectする必要があるオープンボキャブラリdetectタスク向けにYOLO-Worldを検討してください。