YOLOv8 YOLO:物体検出モデルの包括的な技術比較
コンピュータビジョンの分野は絶えず進化を続けており、新たなアーキテクチャがエッジデバイスや大規模クラウドクラスターにおける可能性の限界を押し広げている。本技術深掘りでは、二つの主要なリアルタイム物体検出モデルを比較する: YOLOv8 とYOLO比較します。両モデルのアーキテクチャ、性能指標、トレーニング手法を検証することで、機械学習エンジニアはデプロイメントパイプラインに関する適切な判断を下すことが可能となります。
モデルの背景と起源
両モデルはほぼ同時期に導入されたが、異なる設計思想と研究目標に由来している。
YOLOv8の詳細
- 著者:グレン・ジョッカー、アユシュ・チャウラシア、およびチン・チウ
- 組織: Ultralytics
- 日付: 2023年1月10日
- GitHub:Ultralytics リポジトリ
- ドキュメント:YOLOv8 ドキュメント
YOLO
- 著者:徐賢哲、江一琪、陳偉華、黄一倫、張元、孫秀宇
- 組織:アリババグループ
- 日付: 2022年11月23日
- Arxiv:YOLO 論文
- GitHub:YOLO リポジトリ
アーキテクチャの革新
YOLOv8: 多目的アンカーフリー設計
Ultralytics YOLOv8 は先行モデルから大幅な改善を実現し、信頼性の高い最先端モデルとしての地位を確立しました。アンカーフリー検出ヘッドを採用することで、予測されるバウンディングボックスの数を削減し、推論速度を向上させています。このアーキテクチャは分離型ヘッドを利用し、物体検出・分類・回帰タスクを分離することで、より正確なバウンディングボックス予測を実現しています。
さらに、YOLOv8 CIoU に加え分布焦点損失(DFL) YOLOv8 、特に小型または遮蔽されたターゲットにおいて、物体の境界を正確に特定するモデルの能力を向上させます。その合理化されたバックボーンは、CPU GPU CPU 高度に最適化されています。
YOLO: アーキテクチャ探索駆動型
YOLO 異なるアプローチYOLO 、バックボーンの自動設計にニューラルアーキテクチャ検索(NAS)を多用している。アリババチームは「MAE-NAS」を導入し、特に TensorRT の加速環境において最適な遅延と精度のトレードオフを実現する構造を発見するために「MAE-NAS」を導入した。
本モデルは、効率的な特徴融合のためのRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)と、検出ヘッドの計算負荷を最小化する「ZeroHead」設計を組み込んでいる。学習時には、ラベル割り当てにAlignedOTAを活用し、複雑な知識蒸留プロセスに大きく依存するため、対象となる生徒モデルを監督する大規模な教師モデルが必要となる。
学習の複雑さ
YOLO NASとディスティレーションにより優れたレイテンシー指標YOLO 、これは高度に最適化されたYOLOv8単一段階トレーニングパイプラインと比較して、トレーニング中に大幅にCUDA 計算時間を必要とする。
パフォーマンスとメトリクス
コンピュータービジョンモデルを本番環境にデプロイする際、精度(mAP)と推論速度のバランスが極めて重要である。下表は、両モデルの各種サイズにおける性能を示している。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv8 卓越した性能バランスYOLOv8 。 YOLOv8n (nano)モデルは、DAMO-YOLOtの850万パラメータに対しわずか320万パラメータしか必要とせず、モバイルデバイスやメモリ要件が厳しい環境において圧倒的に優れています。さらに、YOLOv8 より幅広いサイズYOLOv8 、高精度なモデルまで拡張可能です。 YOLOv8x クラウドベースのワークロード向け。
開発者体験とエコシステム
使いやすさとトレーニング効率
最大の差別化要因の一つはユーザー体験です。Ultralytics 開発者の作業効率を重視して設計されています。YOLOv8 トレーニングには非常に少ないメモリ使用量で済み、統一Python またはコマンドラインインターフェース経由で実行可能です。
逆に、YOLO の蒸留強化学習を再現するには、複雑な設定ファイルの操作や、教師-生徒実験の多段階にわたる追跡処理が必要となるYOLO 。
Python YOLOv8 トレーニング、検証、エクスポートする手順がどれほど簡単かを示す例です:
from ultralytics import YOLO
# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")
# Export the trained model to ONNX format
path = model.export(format="onnx")
多様な視覚タスクへの適応性
YOLO 厳密にバウンディングボックス物体検出向けにYOLO 。これに対し、YOLOv8 複数のタスクをネイティブにサポートします。モデル重みを単純に交換するだけで、開発者は基盤となるデプロイメントコードベースを変更することなく、インスタンスセグメンテーション、画像分類、姿勢推定を実行できます。この汎用性により、Ultralytics 複雑なアプリケーションにおいてはるかに実用的なものとなります。
実際のユースケース
YOLOv8を使用するタイミング
YOLOv8速度、精度、導入の容易さを兼ね備えた特性は、以下の用途に最適です:
- スマート小売分析:顧客行動の監視や在庫チェックの自動化を目的とした物体追跡の実施。
- 農業用ロボット技術:多様なハードウェア上で高い性能を発揮し、作物の識別や害虫の検知をリアルタイムで行う。
- 医療診断:インスタンスセグメンテーションを用いた医療画像における異常部位の迅速かつ正確なマッピング
- エッジデプロイメント:OpenVINOなどのエクスポート形式とのシームレスな統合 OpenVINO や CoreML とのシームレスな統合により、YOLOv8 リソース制約のあるデバイスで真価YOLOv8 。
YOLOの使用タイミング
YOLO 特定の状況下で有益であり、特に以下の場合にYOLO :
- 学術NAS研究:反復パラメータ化または自動化されたアーキテクチャ設計手法を研究するチーム向け。
- 厳密にGPUパイプライン:特定のNVIDIA 上でのみ動作するアプリケーションで、NAS構造がTensorRT 制限に向けて大幅に最適化されているもの。
ユースケースと推奨事項
YOLO 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの好みにYOLO 。
YOLOv8を選択すべき時
YOLOv8 以下に最適な選択肢YOLOv8 :
- 多目的マルチタスク展開: Ultralytics 内で、検出、セグメンテーション、分類、姿勢推定のための実績あるモデルを必要とするプロジェクト。
- 確立された生産システム: YOLOv8 構築済みの既存生産環境で、安定し十分にテスト済みのデプロイメントパイプラインを備える。
- 広範なコミュニティとエコシステムによるサポート: YOLOv8豊富なチュートリアル、サードパーティ統合、活発なコミュニティリソースを活用するアプリケーション。
DAMO-YOLOを選択するタイミング
YOLO 以下の方におすすめYOLO :
- 高スループット動画解析:固定NVIDIA GPU 上で高FPS動画ストリームを処理し、バッチ1スループットを主要指標とする。
- 産業用製造ライン:専用ハードウェア上でGPU 厳しい制約があるシナリオ。例:組立ラインにおけるリアルタイム品質検査。
- ニューラルアーキテクチャ探索研究:自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化バックボーンが検出性能に及ぼす影響の検討。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
今後の展望:Ultralytics
YOLOv8 として非常に信頼性の高い主力YOLOv8 、コンピュータビジョン分野は急速に進化しています。ユーザーは新世代モデルも検討すべきです:
YOLO26:最新世代Ultralytics パラダイムシフトを実現します。ネイティブのエンドツーNMS設計を導入し、非最大抑制後処理に伴うレイテンシボトルネックを完全に排除しました。 新開発のMuSGDオプティマイザー(SGD オンのハイブリッド)と特化型ProgLoss + STAL損失関数により、YOLO26は驚異的なトレーニング安定性と小型物体認識能力の大幅な向上を実現。DFL除去(簡素化されたエクスポートとエッジ/低電力デバイスとの互換性向上のため分布焦点損失を除去)により、アーキテクチャ調整が前世代比最大43%高速CPU を実現。現代のエッジコンピューティングにおける決定的な選択肢となる。
YOLO11:もうひとつの優れた代替案、 Ultralytics YOLO11YOLOv8 に対して段階的なアーキテクチャ改良を施しておりYOLOv8 コミュニティにおいて堅牢で広く採用されているモデルであり続けている。
ワークフローを効率化する
モデルをプロトタイプから本番環境へ移行する準備はできていますか?Ultralytics を活用して、データセットの自動アノテーション、track 、そしてクラウドやエッジデバイスへのシームレスなモデル展開を実現しましょう。
結論として、YOLO アーキテクチャ探索に関する興味深い学術的知見YOLO 一方で、Ultralytics より成熟し、汎用性が高く、開発者にとって使いやすいエコシステムを提供します。実績ある安定性をYOLOv8 を使い続けるYOLOv8 NMS超高速アーキテクチャであるYOLO26にアップグレードYOLOv8 、Ultralytics リアルタイムビジョンAIにおける最良の選択肢であり続けます。