YOLO26 vs. YOLOv5: アーキテクチャ、速度、およびユースケースの比較
物体検出モデルの進化は急速かつ革新的でした。この比較では、Ultralytics YOLO26とUltralytics YOLOv5の明確な特徴を探り、アーキテクチャとトレーニング手法の進歩がそれらの機能にどのように影響を与えたかを検証します。YOLOv5がコンピュータビジョンコミュニティにおける基礎的な柱であり続ける一方で、新しくリリースされたYOLO26は、次世代のエッジデプロイメントと高速推論のために設計された画期的な効率性をもたらします。
モデル概要
両モデルは、YOLO (You Only Look Once) アーキテクチャの歴史において重要なマイルストーンを築いています。これらはリアルタイム性能と使いやすさへのコミットメントを共有していますが、AI開発の異なる時代に対応しています。
Ultralytics YOLO26
YOLO26は、Ultralyticsが2026年1月に発表した最新のイテレーションです。これは、Non-Maximum Suppression (NMS)の後処理の必要性を排除する、ネイティブなエンドツーエンドアーキテクチャへの移行を意味します。エッジコンピューティングを念頭に置いて設計されており、精度限界を押し上げながらデプロイメントを簡素化します。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026-01-14
- ドキュメント:YOLO26 ドキュメント
- 主な革新点: エンドツーエンドのNMSフリー検出、DFLの削除、およびMuSGDオプティマイザ。
Ultralytics YOLOv5
YOLOv5は2020年半ばにリリースされ、その速度、精度、ユーザーフレンドリーなエンジニアリングのバランスにより、瞬く間に業界標準となりました。何百万もの開発者にPyTorchエコシステムを導入し、安定性とレガシーサポートが最重要視される本番環境で広く使用され続けています。
- Author: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- ドキュメント:YOLOv5 ドキュメント
- 主な革新点: ユーザーフレンドリーなPyTorch実装、モザイク拡張、および自動アンカーメカニズム。
アーキテクチャの違い
YOLOv5からYOLO26への移行には、オブジェクトの検出方法とトレーニング中にモデルが最適化される方法における根本的な変更が伴います。
エンドツーエンド vs. 後処理
YOLOv5は、重複するバウンディングボックスを除外するためにNon-Maximum Suppression (NMS)に依存しています。NMSは効果的ですが、特にCPUサイクルが限られたエッジデバイスでは、推論中のボトルネックとなる可能性があるヒューリスティックなプロセスです。特定のデータセットに合わせて調整する必要があるIoUしきい値などのハイパーパラメータを導入します。
対照的に、YOLO26はネイティブなエンドツーエンドです。YOLOv10で最初に開拓された設計を採用することで、YOLO26はNMSを必要とせずに、ネットワーク出力から直接オブジェクトの正確なセットを予測します。これにより、モデル出力が最終結果となるため、デプロイメントパイプラインが大幅に簡素化されます。
デプロイメントの簡素化
YOLO26でのNMSの削除は、CoreMLやTensorRTのような形式にエクスポートする際に、複雑な後処理ステップをコンパイルする必要がなくなることを意味します。生のモデル出力はすぐに使用でき、レイテンシと統合の複雑さを軽減します。
損失関数と最適化
YOLO26は、ProgLoss (Progressive Loss Balancing)とSTAL (Small-Target-Aware Label Assignment)を導入しています。これらの革新は、航空画像や混雑したシーンでの小さなオブジェクトの検出の難しさなど、オブジェクト検出における一般的な弱点を具体的にターゲットにしています。ProgLossは、トレーニング中に異なる損失コンポーネントの重みを動的に調整し、収束を安定させます。
さらに、YOLO26は、大規模言語モデル(LLM)のトレーニング技術に触発されたSGDとMuonオプティマイザのハイブリッドであるMuSGDオプティマイザを利用しています。これにより、LLMトレーニングの安定性がコンピュータビジョンにもたらされ、より速い収束とより堅牢な重みをもたらします。
簡素化されたヘッドアーキテクチャ
YOLO26における大きな変更点は、Distribution Focal Loss (DFL)の削除です。DFLはYOLOv8のような以前のイテレーションでボックスの精度向上に役立ちましたが、エクスポート時に計算オーバーヘッドと複雑さを追加しました。回帰損失を洗練することで、YOLO26はDFLなしで高精度を達成し、以前の世代と比較してCPUで最大43%高速化します。これはエッジAIアプリケーションにとって重要な指標です。
性能指標の比較
以下の表は、COCOデータセットにおけるYOLO26とYOLOv5の性能を比較しています。YOLO26は、精度(mAP)と推論速度の両方で大幅な向上を示しており、特にアーキテクチャの最適化が際立つCPUハードウェアにおいて顕著です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
主なポイント
- 精度の大幅な向上: YOLO26n (Nano)は40.9 mAPを達成し、28.0 mAPのYOLOv5nを大幅に上回っています。これにより、ユーザーは検出品質を犠牲にすることなく、より小さなモデルをデプロイできます。
- CPU効率: YOLO26のアーキテクチャの簡素化により、CPU推論が劇的に高速化されます。例えば、YOLO26nはCPUで約39msで実行されますが、YOLOv5nでは約74msであり、Raspberry Piやモバイルデプロイメントに最適です。
- パラメータ効率: YOLO26は多くの場合、より少ないパラメータでより高い精度を達成し(例:YOLO26lは24.8Mパラメータに対し、YOLOv5lは53.2Mパラメータ)、トレーニングと推論中のメモリフットプリントを削減します。
トレーニングとエコシステム
両モデルとも堅牢なUltralyticsエコシステムから恩恵を受けていますが、YOLO26はより新しいツールとより深い統合を活用しています。
使いやすさとAPI
両モデルは統一された ultralytics Pythonパッケージを使用しています(YOLOv5は元々スタンドアロンでしたが、現在は統合されています)。これにより、それらを切り替えるのは、モデル名の文字列を変更するのと同じくらい簡単です。
from ultralytics import YOLO
# Load YOLO26 for state-of-the-art performance
model_26 = YOLO("yolo26n.pt")
model_26.train(data="coco8.yaml", epochs=100)
# Load YOLOv5 for legacy comparison
model_v5 = YOLO("yolov5nu.pt")
model_v5.train(data="coco8.yaml", epochs=100)
高度なトレーニング機能
YOLO26は、改善されたデータ拡張戦略と、YOLOv5で採用されていた標準的なSGDよりも効果的に局所最適解から脱却するのに役立つ新しいMuSGDオプティマイザをサポートしています。さらに、YOLO26は、姿勢推定のための残差対数尤度推定 (RLE)や、Oriented Bounding Box (OBB)タスクのための特殊な角度損失など、YOLOv5の時代には存在しなかったか、洗練されていなかったタスク固有の改善を提供します。
ユーザーはUltralytics Platformを活用して、データセットの管理、クラウドでのモデルトレーニング、そして様々なエンドポイントへのシームレスなデプロイを行うこともできます。
理想的なユースケース
YOLO26を選択すべき時
YOLO26は、その優れた精度対レイテンシ比により、ほぼすべての新規プロジェクトにおいて推奨される選択肢です。
- エッジAI & IoT: DFLの削除とNMSフリー推論により、YOLO26はNVIDIA Jetson、Raspberry Pi、携帯電話など、CPU/NPUの効率が重要となるデバイスに最適です。
- 小物体検出: STALのおかげで、YOLO26はドローン画像や製造業における欠陥検出など、ターゲットが画像サイズに対して非常に小さい場合が多いシナリオで優れた性能を発揮します。
- リアルタイムビデオ分析: 速度向上により、より高いフレームレートの処理が可能になり、交通監視やスポーツ分析に不可欠です。
YOLOv5を選択すべき時
古いモデルではありますが、YOLOv5には依然としてニッチな用途があります。
- レガシーシステム: 2020年代のYOLOv5リポジトリ構造に厳密に基づいて構築された既存のパイプラインでは、移行するよりも古いモデルを維持する方が容易であると感じるかもしれません。
- 幅広いハードウェアサポート: 古いモデルであるため、YOLOv5は事実上あらゆる考えられるプラットフォームに移植されており、新しいアーキテクチャ向けに最適化されたサポートがまだない可能性のある非常に特殊なマイクロコントローラも含まれます。
結論
YOLOv5はそのアクセシビリティと信頼性により現代の物体検出の基礎を築きましたが、YOLO26は大きな飛躍を遂げました。エンドツーエンドのNMSフリー設計を採用し、エッジハードウェア向けに最適化し、MuSGDやProgLossのような高度なトレーニング技術を組み込むことで、YOLO26は最高のパフォーマンスを求める開発者にとって魅力的なアップグレードを提供します。
ほとんどのユーザーにとって、選択は明確です。YOLO26は今日の要求の厳しいコンピュータビジョンアプリケーションに必要な速度、精度、汎用性を提供します。
その他のモデルを見る
他のアーキテクチャの探索に興味がある場合は、YOLO26の直接の前身であるYOLO11、またはオープンボキャブラリ検出機能についてはYOLO-Worldを確認してください。