コンテンツにスキップ

YOLO Ultralytics YOLOv8:包括的な技術比較

リアルタイムコンピュータービジョンの領域は、研究者やエンジニアが速度と精度の限界を押し広げるにつれて絶えず変化している。この道のりにおける二つの重要なマイルストーンYOLOUltralytics YOLOv8である。両モデルともレイテンシーと平均精度(mAP)のトレードオフを最適化することを目指しているが、物体検出の課題を解決するためのアーキテクチャと哲学的アプローチは根本的に異なる。

この包括的な技術分析では、基盤となるアーキテクチャ、トレーニング手法、実用的な導入事例を比較し、次の人工知能プロジェクトに最適なツールを選択するお手伝いをします。

モデル系統と仕様

これらの深層学習モデルの起源を理解することは、その設計目標や展開エコシステムに関する貴重な背景情報を提供する。

YOLO

著者:許賢哲, 江一琪, 陳偉華, 黄一倫, 張遠, 孫秀宇
所属組織:Alibaba Group
日付:2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:YOLO

DAMO-YOLOの詳細

Ultralytics YOLOv8

著者:Glenn Jocher、Ayush Chaurasia、Jing Qiu
組織:Ultralytics
日付:2023-01-10
GitHub:ultralytics
ドキュメント:YOLOv8

YOLOv8について詳しくはこちら

アーキテクチャの革新

両アーキテクチャの性能特性は、それぞれ独自の構造的決定に起因する。

YOLO 、最適なネットワーク構造を自動的に発見するためにニューラルアーキテクチャ探索(NAS)YOLO 。低遅延で高性能を実現するバックボーンを検索するMAE-NASという概念を導入している。さらに、効率的なRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)を活用し、異なる空間スケール間での特徴融合を強化する。

トレーニングを改善するため、アリババチームはZeroHead設計とAlignedOTAラベル割り当てを採用した。さらに、複雑な知識蒸留プロセスを多用しており、重厚な教師モデルが軽量な生徒モデルを導くことで、学術ベンチマークにおいてより高い精度指標を達成している。

YOLOv8:効率化され、汎用性の高い

Ultralytics YOLOv8において、より開発者優先のアプローチUltralytics 。アンカーベースの設計から移行し YOLOv5 からアンカーフリーアーキテクチャへ移行し、バウンディングボックス予測数を大幅に削減して推論を高速化しました。C2f(2つの畳み込み層を備えたクロスステージ部分ボトルネック)モジュールの導入により、過剰な計算オーバーヘッドを追加することなく勾配の流れと特徴表現が改善されました。

厳密にバウンディングボックスをターゲットとするモデルとは異なり、YOLOv8 マルチモーダルであるよう一から設計YOLOv8 。統一された PyTorch コードベースがインスタンスセグメンテーション、姿勢推定、画像分類をネイティブにサポートするため、エンジニアが別々のリポジトリを組み合わせて構築する手間が省けます。

効率的なトレーニング

Ultralytics 、大規模なトランスフォーマーベースのアーキテクチャと比較して、学習時に本質的に少ないメモリを必要とするため、標準的なコンシューマー向けGPU上で最先端の結果を実現します。

パフォーマンス対決

生データの比較においては、理論上の性能がハードウェア性能にどのように反映されるかを分析することが極めて重要である。下表はモデルサイズごとのトレードオフを示している。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLO 蒸留技術により優れたパラメータ対精度比YOLO 一方、YOLOv8 より幅広いモデルサイズ(NanoからExtra-large)YOLOv8 。YOLOv8 モデルはエッジ最適化の模範例であり、少ないリソース消費で実用性の高い精度を実現しています。

エコシステムと開発者体験

学術論文と実用化システムの真の差別化要因は、エコシステムである。

YOLO広範な知識蒸留パイプラインに依存しているため、カスタムトレーニングは煩雑になりがちです。教師モデルの生成、知識の転移、NASベースのバックボーンのチューニングには、大量のCUDA 高度な設定が必要であり、これが敏捷なエンジニアリングチームの作業を遅らせる要因となっています。

一方、Ultralytics 使いやすさを重視しています。Ultralytics を通じて、開発者はシンプルなAPI、包括的なドキュメント、堅牢な実験追跡統合機能にアクセスできます。統一されたPython により、複雑なパイプラインの構築も容易になります。

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

この合理化されたワークフローは、シームレスなエクスポート機能と組み合わせて OpenVINO および TensorRTへのシームレスなエクスポートを組み合わせることで、ローカルでのプロトタイピングからクラウドやエッジへのデプロイメントまで、摩擦のない道筋を保証します。

実世界での応用例と理想的な使用事例

これらのアーキテクチャの選択は、多くの場合、環境の運用上の制約に帰着します。

DAMO-YOLOの適合性

YOLO ニューラルアーキテクチャ探索を研究する学術環境や、複雑な再帰的パラメータ化戦略の再現を目指す研究者にとって優れた選択肢YOLO 。また、製造ラインにおける高速欠陥検出など、高度に制御された産業用途においても、その多段階トレーニングを処理できる計算リソースがチームにあれば、優れた性能を発揮します。

Ultralytics 本番環境でUltralytics

商業プロジェクトの大多数において、Ultralytics 優れたパフォーマンスバランスを提供します。

その他の注目モデル

より広い視野で探求しているなら、以下の比較にも興味があるかもしれません YOLOv10 または YOLO11 も比較対象として興味深いでしょう。これらはアンカーフリー検出にさらなる進歩をもたらしています。

未来を見据えた設計:YOLO26の登場

YOLOv8 基礎モデルYOLOv8 一方、この分野は進化を続けている。あらゆる新たな進展において、 YOLO26 が推奨される標準モデルです。2026年1月にリリースされたこのモデルは、Ultralytics における画期的な飛躍を象徴しています。

YOLO26は、ネイティブなエンドツーエンドNMS設計を先駆的に実現し、従来の非最大抑制(NMS)によるボトルネックを完全に解消しました。この構造的ブレークスルーにより、 CPU 最大43%高速化され、エッジコンピューティングやIoTハードウェアにおける絶対的なパワーハウスとなっています。

さらに、YOLO26では大規模言語モデル(LLM)の学習手法に着想を得たハイブリッド型最適化アルゴリズム「MuSGD」を導入。これにより収束速度の向上と極めて安定した学習ループを実現しました。新たなProgLoss + STALアルゴリズムと組み合わせることで、YOLO26は微小物体認識において劇的な改善を達成。デプロイメントが高速であるだけでなく、妥協のない精度を保証します。

YOLO26についてさらに詳しく


コメント