コンテンツにスキップ

YOLO26 vs.YOLOv5:リアルタイム物体検出の進化

物体検出技術の進化は重要な節目を経ており、YOLO26と伝説的な YOLOv5 を比較することで、コンピュータビジョンがどれほど進歩したかが明確に理解できます。YOLOv5 020年に実用性とバランスの業界標準をYOLOv5 一方で、YOLO2YOLOv5 2026年の生成AIとビジョン研究の最先端を体現しています。本ガイドでは、両者のアーキテクチャ、性能指標、最適な導入シナリオを分析し、プロジェクトに適したツールの選択を支援します。

概要

YOLOv5, 公開元 Ultralytics が2020年に発表したYOLOv5は、物体検出をアクセスしやすく、高速で、簡単に訓練できるようにすることでAIを民主化しました。これはレガシーシステムにとって信頼できる主力ツールであり続けています。

YOLO26は2026年1月にリリースされ、その遺産を継承しつつ、非最大抑制(NMS)を排除したネイティブなエンドツーエンド構造を採用しています。大規模言語モデル(LLM)に着想を得たMuSGDオプティマイザを導入することで、収束速度の向上と精度の大幅な改善を実現し、特に小型物体やエッジデバイスにおいて顕著な効果を発揮します。

機能YOLO26YOLOv5
アーキテクチャNMSツーエンドアンカーベースでNMS
オプティマイザMuSGD(LLMに着想を得た)SGD Adam
推論速度CPU上で最大43%高速化標準リアルタイム
タスク検出、セグメント化、分類、姿勢推定、OBBdetect、segment、classify
最適な用途エッジAI、CPU、ロボティクス汎用、レガシーサポート

パフォーマンスベンチマーク

以下の表はCOCO におけるモデル比較を示します。YOLO26は精度(mAP)と推論速度の両方で大幅な向上を示しており、特に効率的な処理がCPU 。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

パフォーマンスに関する注記

YOLO26nは、YOLOv5nと比較して mAP46%も大幅に向上させながら、CPU上ではほぼ2倍の速度で動作します。これにより、モバイルアプリケーションやエッジAIにおける決定的な選択肢となります。

YOLO26: エッジAIの新標準

YOLO26は、現代のデプロイメントパイプラインの複雑性に対処するよう設計されています。NMS と分布焦点損失(DFL)の必要性を排除することで、このモデルは ONNX やTensorRTといったフォーマットへのエクスポートを簡素化し、レイテンシ変動を低減します。

主要なアーキテクチャ革新

  1. NMS:モデルアーキテクチャはオブジェクトごとに直接1つのバウンディングボックスを予測し、ヒューリスティックなNMS を排除します。これにより推論時の計算オーバーヘッドが削減され、この技術は最初に YOLOv10で初めて確立された手法である。
  2. MuSGDオプティマイザー:LLMトレーニングの革新技術を採用したYOLO26は、SGD ューオン(Moonshot AIのKimi K2に着想を得た)のハイブリッド方式を採用。これによりトレーニングの動的特性がより安定し、収束が高速化。カスタムモデルのトレーニングコストを削減します。
  3. ProgLoss + STAL:プログレッシブ損失とソフトターゲットアンカー損失の統合は、小型物体の検出を大幅に改善する。これはドローン画像や自律走行車両にとって極めて重要な要件である。
  4. 効率性: CPU 最大43%高速化されたYOLO26は、標準的なノートパソコンやラズベリーパイなど、高性能GPUを搭載していないデバイス向けに最適化されています。

YOLO26についてさらに詳しく

YOLOv5: 使いやすさの遺産

YOLOv5 ユーザー体験を最優先にすることで、コンピュータビジョンの世界を変革した。直感的なPyTorch 堅牢なエコシステムが、「ゼロからヒーローへ」のAI開発の基準を確立した。

  • 使いやすさ:シンプルなディレクトリ構造と「train.py」インターフェースで知られるYOLOv5 、教育目的や迅速なプロトタイピングにおいてYOLOv5 人気がYOLOv5 。
  • 幅広い互換性:豊富なエクスポート形式のサポートにより、AppleCoreML Android TFLiteまで、ほぼすべてのハードウェアで動作します。
  • コミュニティサポート:長年にわたる活発な開発により、膨大なチュートリアル、サードパーティ製統合ツール、コミュニティによる修正プログラムが蓄積されています。

YOLOv5について詳しくはこちら

ユースケースの比較

これらのモデルの中から選択するには、ハードウェア、精度、およびタスクの複雑さに関する具体的な制約条件を考慮する必要があります。

YOLO26の理想的なシナリオ

  • エッジコンピューティングとIoT:DFLとNMS の除去により、YOLO26はCPUおよびNPU上で非常に高速NMS 。スマートカメラ、小売分析、産業用センサーに最適です。
  • ロボティクスとナビゲーション:エンドツーエンド設計により決定論的遅延が実現され、これはロボティクスにおけるリアルタイム制御ループに不可欠である。
  • 高度なタスク:航空画像における残差対数尤度推定(RLE)を用いた姿勢推定や、高精度な方向付き境界ボックス(OBB)検出が必要な場合、YOLO26はYOLOv5 特化したアーキテクチャヘッドを提供します。
  • 小型物体検出:ProgLossのおかげで、YOLO26は製造上の欠陥や監視映像内の遠方物体といった小さなアイテムの検出に優れている。

YOLOv5の理想的なシナリオ

  • レガシーシステム: YOLOv5 と既に深く統合されているプロジェクトでは、性能が要件を満たす場合、現行モデルを維持することが費用対効果に優れる可能性があります。
  • 教育ワークショップ:そのシンプルなコードベースは、畳み込みニューラルネットワーク(CNN)の基礎を教えるのに最適です。

トレーニングとエコシステム

両モデルともUltralytics を受けていますが、YOLO26は最新の効率性を導入しています。

トレーニング効率

YOLO26はMuSGDオプティマイザを採用しており、バッチサイズや学習率の変化にかかわらず学習を安定させます。これにより、YOLOv5標準的なSGD と比較して収束までのエポック数が少なくなることが多く、GPU コストの削減につながります。

メモリ要件

Ultralytics はその効率性で知られています。YOLO26もこの傾向を受け継ぎ、Transformerベースの代替CUDA (例: RT-DETRなどのトランスフォーマーベースの代替モデルよりも大幅に少ないCUDAメモリしか必要としません。これにより、NVIDIA 3060や4090などのコンシューマー向けGPUでより大規模なモデルをトレーニングできるようになります。

Ultralytics

両モデルUltralytics と完全に統合されており、これによりワークフロー全体が効率化されます:

  • データセット管理:AI支援によるデータのアップロードとアノテーション。
  • ワンクリックトレーニング:インフラ管理なしでクラウド上でトレーニングを実施。
  • デプロイメント:自動でTensorRT、OpenVINO などにエクスポートし、本番環境へ展開します。

結論

一方 YOLOv5 は依然として一世代の物体検出器を定義した尊敬される古典ですが、2026年の新規プロジェクトにはYOLO26が優れた選択肢です。そのアーキテクチャ上の進歩——特にNMS設計とMuSGDオプティマイザ——により、より高速で、より正確で、エッジデバイスへの展開が容易なモデルを実現しています。

速度と精度の最適なバランスを求める開発者にとって、YOLO26は将来を見据えた基盤を提供します。大幅な性能向上を活用するため、既存のYOLOv5 YOLO26へ移行することを推奨します。

著者および参考文献

YOLO26

YOLOv5

他の現代建築を探求したい方は、以下を参照してください YOLO11 を、汎用的なビジョンタスク向けに、あるいは RT-DETR (トランスフォーマーベースの検出)をご覧ください。


コメント