コンテンツにスキップ

YOLOv5 vs. YOLO26: リアルタイムobject detectionの進化

物体検出技術の進化は、速度・精度・使いやすさにおいて飛躍的な進歩を遂げてきた。本比較では YOLOv5、ビジョンAIを民主化した伝説的モデルと、次世代のエッジ効率性とエンドツーエンド性能をUltralytics の最新鋭アーキテクチャであるYOLO26を比較検討します。

両モデルはコンピュータビジョン史における画期的な瞬間を象徴している。YOLOv5 2020年に実用性とコミュニティ普及の基準をYOLOv5 一方、YOLO26は2026年にエンドツーエンドNMSアーキテクチャ、LLMに着想を得た最適化、比類なきCPU によって新たな地平を切り開いた。

YOLOv5:コミュニティのお気に入り

YOLOv5Ultralyticsリリースされ、PyTorch移行を象徴しました。その性能だけでなく、比類のない使いやすさでも有名になり、高度なコンピュータビジョンを世界中の開発者や研究者に利用可能にしました。

アーキテクチャと強み

YOLOv5 AIの「ユーザー体験」に焦点を当てた合理化されたアーキテクチャYOLOv5 。CSP-Darknet53バックボーンとPath Aggregation Network(PANet)ネックを採用し、異なるスケール間での特徴伝播を改善した。

主要な機能は以下の通りです。

  • モザイクデータ拡張:4枚の画像を1枚に統合する学習手法であり、モデルのdetect 物体detect と新規状況への汎化能力を大幅に向上させる。
  • 自動学習アンカーボックス:モデルはトレーニング開始前に、カスタムデータセット向けの最適なアンカーボックス寸法を自動的に学習します。
  • 導入の容易さ:ONNXCoreML、および TFLite により、モバイルおよびエッジアプリケーションの定番ツールとなりました。

YOLOv5について詳しくはこちら

YOLO26:効率性の新たな基準

2026年1月にリリースされたYOLO26は、前世代の遺産を継承しつつ、根本的なアーキテクチャの転換を導入しています。近年の精度向上を犠牲にすることなく、CPU 最優先する決定的な「エッジファースト」モデルとして設計されています。

画期的な機能

YOLO26は、YOLOv5 を図る複数の最先端の革新技術を統合しています:

  1. ネイティブにエンドツーエンド(NMS):後処理で重複するボックスをフィルタリングするために非最大抑制(NMS)を必要とするYOLOv5異なり、YOLO26はネイティブにエンドツーエンドです。NMS遅延のばらつきが解消され、ロボティクスや自動運転におけるリアルタイム制御システムに不可欠な一貫した推論時間を保証します。
  2. MuSGDオプティマイザー:Moonshot AIのKimi K2のような大規模言語モデル(LLM)の学習安定性に着想を得て、YOLO26SGD 組み合わせたハイブリッドオプティマイザーを採用しています。これにより、LLMの収束特性をビジョンタスクにもたらします。
  3. DFL除去:ディストリビューション焦点損失を除去することでモデル構造が簡素化され、よりクリーンなエクスポートと、Coral EdgeTPUのような低電力エッジデバイスやアクセラレータとの互換性向上を実現します。
  4. ProgLoss + STAL:新規損失関数(ProgLossおよびSTAL)は、多くのリアルタイム検出器にとって従来からの弱点であった小規模物体認識において、大幅な改善をもたらす。

YOLO26についてさらに詳しく

パフォーマンスバランス

YOLO26は驚くべきバランスを実現し、前世代と比較して最大43%CPU を提供しながら、より高い精度を維持します。これにより、GPU 不足している、あるいは利用できないデバイスに最適です。

技術比較:性能指標

以下の表は、YOLOv5 性能差を比較したものです。YOLOv5 優れたモデルですが、YOLO26は全てのモデルスケールにおいて、より高い効率性と精度を示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

注:CPU ONNX)における劇的な速度向上は、その合理化されたアーキテクチャと複雑な後処理ステップの削除によるものです。

トレーニング方法論とエコシステム

Ultralytics を選択する主な利点は、共有エコシステムです。YOLOv5 移行はシームレスです。なぜなら、両モデルとも ultralytics Python と Ultralytics Platform.

使いやすさとAPI

両モデルとも、AIライフサイクル全体を簡素化する統一APIを活用しています。CLI を使用する場合CLI Pythonを使用CLI 、構文は直感的なままです。

from ultralytics import YOLO

# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt")  # Switch to 'yolov5s.pt' seamlessly

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

トレーニング効率

YOLOv5 効率的なトレーニングの基準を確立し、「AutoBatch」などの機能を導入してGPU 最大化しました。YOLO26 はMuSGDオプティマイザーによりこれをさらに進化させます。トレーニングの動的挙動を安定化させることで、YOLO26は収束が早くなり、ピーク精度に到達するまでのエポック数を削減します。これにより、クラウドコンピューティングコストの削減と研究者の反復サイクルの高速化が実現します。

さらに、YOLO26のメモリ要件削減により、Transformerを多用するアーキテクチャと比較して、コンシューマー向けハードウェア上でより大きなバッチサイズが可能となります。 RT-DETRと比較して、より大きなバッチサイズを処理可能にします。

現実世界のアプリケーション

これらのモデル間の選択は、多くの場合、導入ハードウェアと特定のユースケース要件によって決まります。

エッジコンピューティングとIoT

ラズベリーパイやスマートフォン上で動作するアプリケーションにおいては、YOLO26が圧倒的な優位性を示します。最大43CPU NMS 廃止NMS 、スマート駐車管理や携帯型在庫スキャンといったタスクにおいて驚異的な応答性NMS 。また、分布焦点損失(DFL)の廃止により、マイクロコントローラー向けの整数量子化への変換も簡素化されました。

ロボティクスと自律システム

ロボティクスにおいて、遅延の一貫性は極めて重要である。YOLO26NMS設計は、推論時間を決定論的に保ち、シーンがNMS 生じる変動する処理時間を回避する。この信頼性は自律航行や衝突回避システムにとって不可欠である。

レガシーシステムサポート

YOLOv5YOLOv5 、既存システムにおいて依然として堅牢な選択肢です。特に、YOLOv5 を中心にデプロイメントパイプラインが厳密に定義されている場合(例:古いFPGAビットストリームが想定する特定のtensor )に有効です。その大規模なコミュニティサポートと長年にわたる実戦テストにより、ほぼあらゆる特殊ケースに対する解決策がフォーラムやGitHubのイシューで容易に入手可能です。

汎用性:検知を超えた

YOLOv5 後続バージョン(v7.0)でセグメンテーションをサポートするようにYOLOv5 一方、YOLO26はマルチタスク学習器として一から構築された。

  • インスタンスセグメンテーション:YOLO26は、セマンティックセグメンテーション損失やマルチスケールプロトモジュールといったタスク特化型の改良を含み、医療画像解析などのタスクにおけるマスク品質を向上させます。
  • 姿勢推定:残差対数尤度推定(RLE)により、YOLO26はスポーツ分析における人間姿勢推定において優れたキーポイント精度を提供する。
  • オリエンテッド境界ボックス(OBB):航空写真や衛星データにおいて、YOLO26の特殊な角度損失は回転物体検出で頻発する境界問題を解決し、OBBタスクにおいて優れた性能を発揮する。

結論

YOLOv5 OLO26の両方は、Ultralytics AIを簡単、高速、かつ正確に実現するというUltralytics 体現しています。 YOLOv5 は業界で圧倒的な存在感を誇る、信頼性の高い定番モデルです。しかし2026年の新規プロジェクトにおいては、YOLO26が魅力的なアップグレード選択肢を提供します。

NMSMuSGD最適化アルゴリズム卓越したCPU 備えたYOLO26は、単なる改良版ではなく、エッジAIにおける飛躍的な進化です。検出、セグメンテーション、姿勢推定、分類を単一の効率的なフレームワークに統合することで、Ultralytics 開発者が今日のコンピュータービジョン課題解決に最適なツールをUltralytics 。

他のモダンなアーキテクチャを探求したい開発者向けに、 YOLO11 モデルも優れた性能を発揮しますが、速度と次世代機能のバランスを考慮すると、YOLO26が最優先の推奨モデルとなります。


コメント