YOLOv5 vs YOLO26: リアルタイム物体検出における世代の飛躍
コンピュータビジョンの進化は、より高速で正確、そして利用しやすいモデルを絶え間なく追求することによって定義されてきました。Ultralytics YOLOv5 と最先端の Ultralytics YOLO26 を比較すると、堅牢なレガシーシステムと現代のAIデプロイメントの最前線との溝を埋めるパラダイムシフトが確認できます。
本ガイドでは、両アーキテクチャの包括的な技術的分析を提供し、その性能指標、構造的な違い、および理想的なデプロイメントシナリオを強調します。
モデルの概要
YOLOv5: 業界の主力製品
2020年にリリースされたYOLOv5は、物体検出のアクセシビリティを革命的に変えました。アーキテクチャをネイティブに PyTorch フレームワークへ移行したことで、開発者にこれまでにない「ゼロからヒーローへ」の体験を提供しました。
- 著者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- ドキュメント: YOLOv5 Documentation
YOLOv5は、高度に保守されたUltralyticsエコシステムの基盤を確立しました。積極的なデータ拡張技術、効率的なトレーニングループ、そして CoreML や ONNX といったエッジフォーマットへの高度に最適化されたエクスポートパスを導入しました。その使いやすさとトレーニング時の低いメモリ要件は、世界中のスタートアップや研究者にとって不可欠な存在となりました。
YOLO26: 次世代ビジョンAIの標準
2026年1月現在、Ultralytics YOLO26 はリアルタイムビジョンAIの頂点に立っています。YOLOv8 や YOLO11 といった世代間の教訓をネイティブに統合しつつ、大規模言語モデル(LLM)のトレーニングから着想を得た大規模なブレイクスルーを導入しています。
- 著者: Glenn Jocher および Jing Qiu
- 組織: Ultralytics
- 日付: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: YOLO26 Documentation
YOLO26は性能バランスの新たな基準を設定し、最先端の精度を提供しながら、エッジコンピューティングシナリオで活用されるよう明示的に設計されています。
古いコードベースから移行する場合、YOLOv5と YOLO11 を比較することにも関心があるかもしれません。YOLO11は、姿勢推定や指向性境界ボックス(OBB)などの多様なタスクに対する初期サポートを導入した前世代のモデルです。
YOLO26におけるアーキテクチャ上のブレイクスルー
YOLOv5がアンカーベースの検出ヘッドと標準的な損失関数に依存しているのに対し、YOLO26は内部メカニズムを完全に刷新し、デプロイメントのボトルネックを排除しています。
- エンドツーエンドのNMSフリー設計: 最大の違いは、YOLO26のネイティブなエンドツーエンドアーキテクチャにあります。冗長な境界ボックスをフィルタリングするために手動のNon-Maximum Suppression (NMS)を必要とするYOLOv5とは異なり、YOLO26はこの後処理ステップを完全に排除しています。これにより、決定論的な推論遅延が保証され、C++や組み込みハードウェアへの統合が劇的に簡素化されます。
- DFLの削除: YOLO26はDistribution Focal Loss (DFL)を削除しました。このアーキテクチャ上の選択は、モデルのエクスポートを大幅に簡素化し、複雑な演算子に苦労することが多い低電力エッジデバイスやマイクロコントローラとの互換性を高めます。
- MuSGDオプティマイザ: Moonshot AIのKimi K2からヒントを得て、YOLO26は MuSGDオプティマイザ(SGDとMuonのハイブリッド)を採用しています。これにより、LLMトレーニングで見られる安定性と急速な収束がコンピュータビジョンにももたらされ、Transformerを多用するモデルと比較してメモリ使用量の削減とトレーニングサイクルの高速化を実現しています。
- ProgLoss + STAL: YOLO26は洗練されたProgLossおよびSTAL関数を活用しており、YOLOv5にとって長年の課題であった小さく密度の高いオブジェクトの検出能力を大幅に向上させています。
パフォーマンスの比較
COCO dataset でモデルを比較すると、YOLO26はパラメータ数を削減しつつCPU推論速度を向上させながら、精度(mAP)において大幅な改善を示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
注: YOLO26 Nano (YOLO26n) は驚異的な40.9 mAPを達成し、YOLOv5nの28.0 mAPと比較して優れています。さらに、DFLの削除とNMSフリーヘッドにより、CPU推論が最大43%高速化しています。
汎用性とタスクサポート
YOLOv5は主に object detection で知られています。後のアップデートで基本的なセグメンテーションが導入されましたが、YOLO26は当初から統合されたマルチタスクエンジンとしてゼロから構築されました。
YOLO26は本来的に以下をサポートしています:
- インスタンスセグメンテーション: タスク固有のマルチスケールプロト(protos)とセマンティックセグメンテーション損失を特徴としています。
- 姿勢推定: 高精度なキーポイント検出のためにResidual Log-Likelihood Estimation (RLE) を活用しています。
- 指向性境界ボックス(OBB): 境界の不連続性の問題を解決するための特殊な角度損失を含んでおり、衛星画像解析 に不可欠です。
- 画像分類: 標準的なフルイメージのカテゴリ分け。
両モデルとも Ultralytics Platform の恩恵を受けており、シームレスなデータアノテーション、自動ハイパーパラメータチューニング、ワンクリックのクラウドデプロイメントが可能です。ただし、YOLO26は最新のAPI構造を最大限に活用しています。
使用法とコード例
Ultralytics Python API を使用すると、モデル間の切り替えは非常に簡単です。両モデルは同じ保守性の高いエコシステムを共有しているため、従来のYOLOv5パイプラインをYOLO26に更新するには、重みファイルを変更するだけで済みます。
Pythonの例
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()CLIの例
最大のスループットを得るために TensorRT 統合を使用して、コマンドライン経由で直接YOLO26をデプロイできます:
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4理想的な使用ケース
YOLO26を選択すべき場合
現代のコンピュータビジョンプロジェクトであれば、YOLO26が間違いなく推奨されます。
- エッジAIおよびIoT: 43%高速なCPU推論とDFLの削除により、Raspberry Pi やモバイルデバイスへのデプロイに最適です。
- 高速パイプライン: NMSフリーアーキテクチャにより、自律型ロボット工学やリアルタイムの security alarm systems に不可欠な、安定した予測可能なレイテンシが保証されます。
- 複雑なシナリオ: アプリケーションで小さなオブジェクト(例: drone monitoring)や回転するオブジェクト(OBB)の追跡が必要な場合、YOLO26の高度な損失関数(ProgLoss + STAL)が大きな精度上の利点を提供します。
YOLOv5を選択すべき場合
- レガシーシステム: 本番環境において、YOLOv5特有のアンカー生成やNMS解析ロジックにハードコードされた依存関係がある場合、移行には一時的なリファクタリング期間が必要になる可能性があります。
- 特定の学術的ベースライン: 研究者は、object detection architectures の歴史的進歩を示すために、YOLOv5を古典的なベースラインとしてよく使用します。
まとめ
YOLOv5からYOLO26への移行は、単なる反復的なアップデートではありません。物体検出モデルがどのようにトレーニングされ、デプロイされるかという根本的な飛躍です。MuSGDオプティマイザの活用、NMSフリー設計による複雑な後処理の削減、CPU速度の劇的な向上により、Ultralytics YOLO26 は妥協のない速度と精度のバランスを実現しています。
YOLOv5は、ビジョンAIを民主化したモデルとして常に記憶されるでしょうが、堅牢で本番環境対応、かつ将来を見据えたアプリケーションを構築したい開発者は、迷わずYOLO26をベースに構築すべきです。