コンテンツにスキップ

YOLO:アンカーフリーとNAS駆動型物体検出器の比較

リアルタイム物体検出技術の進化は、アンカーベースからアンカーフリーアーキテクチャへ、手動設計のバックボーンから自動化されたニューラルアーキテクチャ検索(NAS)へと、数多くのパラダイムシフトを経験してきた。本包括的な技術比較では、この進化の道程における二つの重要なYOLO分析する。 両モデルのアーキテクチャ革新、学習手法、性能トレードオフを検証するとともに、現代の開発者にとって比類なき選択肢Ultralytics の優位性を明らかにする。

YOLOX:アンカー不要パラダイムの先駆者

2021年7月18日、Megviiの鄭格(Zheng Ge)、劉松涛(Songtao Liu)、王峰(Feng Wang)、李澤明(Zeming Li)、孫健(Jian Sun)により発表されたYOLOXは、アンカーフリー設計をYOLO に統合することに成功し、重要な転換点となった。ArXivに掲載された詳細な技術報告書で説明されているように、YOLOXは学術研究と産業展開の間のギャップを埋めることを目的としていた。

主要なアーキテクチャ革新

YOLOXは、その前身モデルを大幅に改善するいくつかの核心的な構造的変化を導入した:

  • アンカーフリー機構:物体の中心位置と境界ボックスの寸法を直接予測することで、YOLOXは設計上のヒューリスティック数を削減し、複雑なアンカークラスタリング処理を簡素化した。これにより、多様なコンピュータビジョンシナリオへの適応性が大幅に向上した。
  • 分離ヘッド:従来のYOLO 分類と回帰の両方に単一の結合ヘッドを使用していた。YOLOXは分離ヘッドを実装し、分類と位置特定を別々に処理することで、収束が大幅に高速化され精度が向上した。
  • SimOTAラベル割り当て:最適輸送割り当て(OTA)の簡略版を用いて正例サンプルを動的に割り当て、学習時間を短縮するとともに中心点割り当ての曖昧さを克服した。

ヨロックスの遺産

YOLOXの分離型ヘッド設計は、後続の物体検出器世代に多大な影響を与え、多くの現代モデルにおける標準機能となった。

YOLOXの詳細について。

YOLO: 大規模自動アーキテクチャ探索

アリババグループの徐賢哲氏と研究チームによってYOLO 、2022年11月23日にYOLO 。ArXiv掲載論文で詳述されている通り、本モデルはニューラルアーキテクチャ探索(NAS)を多用し、速度と精度のパレート最前線を押し上げた。

主要なアーキテクチャ革新

YOLO戦略YOLO、効率的な構造の設計を自動化することに基づいて構築された:

  • MAE-NASバックボーン:多目的進化アルゴリズムを活用し、YOLO 特定のレイテンシ予算向けにカスタマイズされた高効率なバックボーンYOLO 。特にTensorRTなどのフレームワークへエクスポートする場合に顕著である。 TensorRTへのエクスポート時に顕著な効果を発揮します。
  • 効率的なRepGFPN:異なる空間分解能における特徴融合を大幅に強化するヘビーネック設計であり、航空画像解析や様々なスケールでの物体検出に極めて有益である。
  • ZeroHead:モデルの全体的な平均精度(mAP)を犠牲にすることなく、計算上の冗長性を削減する簡略化された予測ヘッド。
  • AlignedOTAと知識蒸留:高度なラベル割り当てと教師-生徒知識蒸留を組み込み、小型の生徒モデルから最大限の性能を引き出す。

DAMO-YOLOの詳細

パフォーマンスとメトリクスの比較

これら2つのモデルを比較する際には、パラメータ数、必要なFLOPs、およびレイテンシプロファイルを検討する必要があります。以下は、複数のスケYOLO YOLOXYOLO の比較ベンチマークデータです。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

両モデルとも優れた結果を達成しているが、注意点がある。YOLOXは分離されたヘッドの慎重な調整を必要とし、YOLO蒸留への依存度が高いため、カスタムデータセットでの再学習には膨大なGPU を必要とするなど、非常にリソース集約的である。

ユースケースと推奨事項

YOLO 、具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの選好YOLO 。

YOLOXを選択すべき時

YOLOXは以下に最適な選択肢です:

  • アンカーフリー検出研究:YOLOXのクリーンなアンカーフリーアーキテクチャをベースラインとして、新たな検出ヘッドや損失関数の実験を行う学術研究。
  • 超軽量エッジデバイス:マイクロコントローラーやレガシーモバイルハードウェアへの展開において、YOLOX-Nanoモデルの極めて小さなフットプリント(0.91Mパラメータ)が極めて重要となる。
  • SimOTAラベル割り当て研究:最適輸送に基づくラベル割り当て戦略と、それが学習収束に与える影響を調査する研究プロジェクト。

DAMO-YOLOを選択するタイミング

YOLO 以下の方におすすめYOLO :

  • 高スループット動画解析:固定NVIDIA GPU 上で高FPS動画ストリームを処理し、バッチ1スループットを主要指標とする。
  • 産業用製造ライン:専用ハードウェア上でGPU 厳しい制約があるシナリオ。例:組立ラインにおけるリアルタイム品質検査。
  • ニューラルアーキテクチャ探索研究:自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化バックボーンが検出性能に及ぼす影響の検討。

Ultralytics YOLO26)を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:

  • NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
  • CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
  • 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。

Ultralytics :YOLO26のご紹介

YOLOXYOLO 重要な歴史的マイルストYOLO 、現代の開発者は最先端の精度と比類のない使いやすさを兼ね備えたソリューションを求めている。Ultralytics まさにこの領域を変革する存在だ。2026年1月にリリースされたYOLO26は、NMSモデルの遺産を基盤とし、速度・精度・開発者体験の究極のバランスを実現する。

YOLO26を選ぶ理由

統合されたUltralytics は、以下を提供することで断片化された学術リポジトリを凌駕します:

  • エンドツーエンドNMS:YOLO26は推論時に非最大抑制(NMS)をネイティブに排除します。これにより、エッジデプロイメントや自動運転車両に不可欠な、非常に高速で予測可能なレイテンシが実現されます。
  • DFL除去:ディストリビューション焦点損失を除去することで、YOLO26はエッジデバイスへのエクスポート処理を簡素化し、軽量アプリケーションのメモリ要件を大幅に削減します。
  • MuSGDオプティマイザー:YOLO26はハイブリッド型SGD ミューオンオプティマイザーによりLLMトレーニングの革新技術を採用し、揺るぎないトレーニング安定性と超高速収束を実現します。
  • 最大43%高速CPU :深い構造的最適化により、YOLO26は高価なGPU 必要とせず、CPU上で驚異的な速度で動作します。
  • 高度な損失関数:ProgLossとSTALの統合により、微小物体認識が大幅に向上し、ドローン検査やIoT監視などのタスクに最適です。
  • 汎用性:純粋なYOLO異なり、YOLO26は単一の統合フレームワーク内でインスタンスセグメンテーション姿勢推定画像分類およびオリエンテッドバウンディングボックス(OBB)タスクをネイティブにサポートする。

今すぐ構築を開始

Ultralytics Python を使用すれば、複雑なディスティレーションパイプラインを手動で設定したり、モデルをデプロイするために何百行ものC++コードを書いたりする必要はありません。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")

YOLO26についてさらに詳しく

検討すべきその他のモデル

コンピュータビジョンのエコシステムは広大です。特定の制約条件に応じて、Ultralytics が完全にサポートする他のアーキテクチャも検討する価値があります:

  • YOLO11 小売分析製造品質管理における堅牢性で知られる、YOLO26の高性能な前身モデル。
  • YOLOv8伝説的な、極めて安定したアンカー不要モデルであり、エッジデバイスへの広範な展開を普及させた。
  • RT-DETR:Baiduが開発したリアルタイム検出用トランスフォーマー。グローバルアテンション機構の恩恵を大きく受けるタスクにおいて優れた代替手段を提供するが、その代償として高いトレーニングメモリ要件を必要とする。

結論

YOLOXYOLO 、深層学習の発展に重要な概念YOLO 。YOLOXはアンカーフリーの分離型アプローチを実証し、YOLO 自動化されたアーキテクチャ探索のYOLO 。しかし実運用においては、これらの研究コードベースの複雑さがアジャイルチームの作業を遅延させる可能性がある。

Ultralytics を活用することで、開発者はこれらの障壁を回避できます。YOLO26のエンドツーエンド設計、優れたCPU 、そして豊富なドキュメントにより、最先端のビジョンAIの実現がこれまで以上に容易になりました。スマートシティインフラ、医療診断、高度なロボティクスを構築する場合でも、Ultralytics 生データから堅牢な実世界展開まで、最も効率的な道筋Ultralytics 。


コメント