コンテンツにスキップ

YOLO26 vs.YOLO:リアルタイム物体検出の進化

コンピュータビジョンの分野は急速に進化しており、新たなアーキテクチャが絶えず速度と精度の限界を押し広げている。このタイムラインにおける二つの重要なマイルストーンは、2022年末にアリババグループがYOLO、Ultralytics 発表した最先端モデルであるYOLO26である

YOLO YOLO ニューラルアーキテクチャ検索(NAS)といった革新的な概念YOLO 一方で、YOLO26はネイティブなエンドツーエンド処理とエッジファースト設計へのパラダイムシフトを体現しています。本詳細比較では、これら2つの強力なモデルのアーキテクチャ上の差異、性能指標、導入時の現実を検証し、開発者が物体検出ニーズに適したツールを選択する手助けをします。

性能指標の比較

以下の表は、YOLO26とYOLOの性能を比較したものです。特にCPU演算において推論速度が大幅に向上している点に注目してください。これはYOLO26アーキテクチャの特徴です。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics :新たな基準

Ultralytics リリースされたYOLO26はYOLO11 および YOLOv8の遺産を基盤とし、検出パイプラインに抜本的な変更を導入しています。その主要な設計思想は、デプロイメントとトレーニングにおけるボトルネックの除去に焦点を当てており、ハイエンドGPUと制約のあるエッジデバイスの両方で最も効率的なモデルとなっています。

主要なイノベーション

  1. エンドツーエンドNMS設計:従来世代やYOLOなどの競合技術とは異なり、YOLO26はネイティブにエンドツーエンドです。これにより、非最大抑制(NMS)後処理が不要となります。このアプローチは遅延変動を低減し、デプロイメントパイプラインを簡素化する画期的な手法であり、初めて YOLOv10で初めて確立された画期的な手法です。
  2. MuSGDオプティマイザ:大規模言語モデル(LLM)のトレーニングにおける最近の進歩に着想を得て、YOLO26はSGD ミューオンのハイブリッドを採用しています。このオプティマイザはトレーニング中の安定性を高め、収束を早めることで、最適な精度に到達するために必要な計算コストを削減します。
  3. エッジファースト最適化:ディストリビューションフォーカルロス(DFL)を除去することで、モデルアーキテクチャが簡素化され、CoreML ONNX CoreML ONNX 形式へのエクスポートが容易になります。これにより、以前のバージョンと比較して CPU 速度が43%も大幅に向上し、ラズベリーパイやスマートフォンなどのデバイスに最適です。
  4. 強化された小物体検出:ProgLossとSTAL(スケール対応適応損失)の統合により、小物体に対する性能が大幅に向上し、シングルステージ検出器の一般的な弱点を解決した。

合理化されたデプロイメント

YOLO26NMS 削除したため、エクスポートされたモデルは複雑な後処理コードを含まない純粋なニューラルネットワークです。これによりC++やモバイル環境への統合が大幅に容易になり、ロジックエラーの発生も抑えられます。

コード例

YOLO26のユーザー体験は、合理化Ultralytics Python SDKと一貫性を保っています。

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

YOLO26についてさらに詳しく

YOLO:NAS駆動の挑戦者

アリババのDAMOアカデミーが開発YOLO、2022年にニューラルアーキテクチャ検索(NAS)を活用してバックボーンを設計したことで注目を集めた。ネットワーク構造を手作業で構築する代わりに、著者らはMAE-NAS(補助エッジ法)を用いて、特定の遅延制約下で効率的なアーキテクチャを自動的に発見した。

主な特徴

  • MAE-NASバックボーン:ネットワーク構造は、情報フローを最大化しつつ計算コストを最小化するよう数学的に最適化された。
  • RepGFPN:再パラメータ化を用いて異なるスケール間での特徴融合を改善する効率的な特徴ピラミッドネットワーク。
  • ZeroHead:ネットワーク末端のパラメータ数を削減することを目的とした軽量検出ヘッド設計。
  • AlignedOTA:トレーニング中にモデルがどのアンカーボックスが真の物体に対応するかをより良く理解するのを助けるラベル割り当て戦略。

YOLO 時代において優れた性能YOLO 、大規模な教師モデルが小規模な生徒モデルを導く複雑な蒸留トレーニングパイプラインに依存しているため、Ultralytics 「ゼロからトレーニング」機能と比較して、カスタムトレーニングのリソース消費量が大きくなる。

詳細な比較

アーキテクチャとトレーニングの安定性

最も顕著な違いは最適化手法にある。YOLO NASにYOLO 最適な構造を模索するため、理論上は非常に効率的なFLOPsを実現できるが、修正やデバッグが困難なアーキテクチャを生み出すことが多い。

一方、YOLO26は手作業による直感的なアーキテクチャ改良(DFLの削除やNMSなど)を採用し、MuSGDオプティマイザーによって強化されている。このオプティマイザーは、大規模言語モデル(LLM)でよく見られる安定性をコンピュータビジョンにもたらす。開発者にとって、これはYOLO26がハイパーパラメータ調整への依存度が低く、カスタムデータセット上でも確実に収束することを意味する。

推論速度とリソース効率

YOLO TensorRT GPU YOLO に対し、YOLO26はより広範なアプローチを採用している。NMS 排除したNMS YOLO26はCPU上で優れた性能NMS 、従来モデルより最大43%高速化を実現した。これは、エッジデバイスに専用GPUが搭載されていない可能性がある小売分析やスマートシティのアプリケーションにおいて極めて重要である。

さらに、YOLO26の学習時のメモリ要件は一般的に低い。YOLO 最高の結果を得るために蒸留用の重い教師モデルを学習させる必要があるYOLO 、YOLO26は直接SOTA結果を達成するため、GPU 電力を大幅に節約できる。

汎用性とエコシステム

Ultralytics 大きな利点は汎用性です。YOLO 主に物体YOLO 。一方、YOLO26アーキテクチャは、以下を含む幅広いコンピュータビジョンタスクをネイティブにサポートします:

これにより、単一の開発チームが複数の異なる問題に対して1つのAPIと1つのフレームワークを使用できるようになり、技術的負債を大幅に削減します。

比較表:機能

機能YOLO26DAMO-YOLO
リリース日2026年1月2022年11月
アーキテクチャエンドツーエンド、NMSNASベース、アンカー不要
後処理なし(モデル出力=最終)非最大抑制 (NMS)
オプティマイザMuSGD(SGD ミューオン)SGD AdamW
トレーニングパイプライン単段式、ゼロから訓練複合蒸留(師弟)
サポートされているタスクdetect、segment、姿勢推定、obb、classify検出
エッジ最適化高 (DFLなし、CPU最適化)中程度(TensorRT )

結論

両アーキテクチャは物体検出の歴史における頂点を示す。YOLO 自動アーキテクチャ探索と再パラメータ化の威力をYOLO 。しかしYOLO26は実用的なAI展開の未来を体現している。

NMS 解消し、MuSGDのようなLLMグレードの最適化アルゴリズムを導入、さらにセグメンテーション・姿勢推定・物体検出を統合したソリューションを提供Ultralytics 、性能と使いやすさの優れたバランスを実現します。産業オートメーションからモバイルアプリまで、実世界のアプリケーションを開発する開発者にとって、堅牢なエコシステム、充実したドキュメント、Ultralytics YOLO26を明確な推奨選択肢とします。

他の比較に興味のある方は、YOLO11 YOLOYOLO11 比較や、トランスフォーマーベースの代替手法(例: RT-DETRなどのトランスフォーマーベースの代替手法を検討してみてください。

著者と参考文献

YOLO26

DAMO-YOLO

  • 著者:徐賢哲、江一琪、陳偉華、黄一倫、張元、孫秀宇
  • 組織: Alibaba Group
  • 日付: 2022-11-23
  • 論文:arXiv:2211.15444

コメント