YOLOv8 YOLOv9:リアルタイム物体検出器の包括的な技術比較
リアルタイム物体検出の進化は、精度向上、低遅延化、ハードウェア利用率の改善に向けた不断の追求によって特徴づけられてきた。この道のりにおける二つの主要なマイルストーンは Ultralytics YOLOv8 と YOLOv9である。両モデルともコンピュータビジョン分野における最先端の能力を示す一方で、異なる導入ニーズ、アーキテクチャの理念、開発者エコシステムに対応している。
この包括的なガイドでは、技術的な差異、アーキテクチャ上の革新、および実用的な導入上の考慮事項を詳細に解説し、次の人工知能プロジェクトに最適なモデルを選択するお手伝いをします。
モデル系譜と中核理念
指標を掘り下げる前に、各モデルの起源と主要な設計目標を理解することが極めて重要です。
Ultralytics YOLOv8:汎用性の高いエコシステム標準
Ultralyticsチームよりリリース UltralyticsYOLOv8 、単体の物体検出器としてだけでなく、統一されたマルチタスクフレームワークとしてYOLOv8 。シームレスな開発者体験、低メモリ要件、幅広いハードウェア互換性を優先しています。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023-01-10
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLOv8 Docs
YOLOv9: プログラマブル勾配情報
中央研究院の研究者らが独自に開発したYOLOv9 、アーキテクチャ理論にYOLOv9 、特に深層ニューラルネットワークにおける情報ボトルネック現象に対処している。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024-02-21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
エンタープライズ導入
大規模な商用展開を計画している場合は、Ultralytics 活用をご検討ください。クラウドトレーニングの簡素化、データセット管理、ワンクリックAPIエンドポイントを実現します。
アーキテクチャの詳細
深層学習におけるアーキテクチャの選択は、モデルの学習効率やNVIDIA や Intel CPU。
YOLOv8 :C2fと分離ヘッド
YOLOv8 はC2fモジュール(2つの畳み込み層を持つクロスステージ部分ボトルネック)YOLOv8 、従来のC3モジュールに取って代わりました。この変更により勾配の流れが改善され、GPU 過度に消費することなく、ネットワークがより豊かな特徴表現を学習できるようになりました。
さらに、YOLOv8 アンカーフリー設計と分離型ヘッド YOLOv8 。物体検出、分類、回帰を別々の経路で処理することで、モデルは学習中の収束が速くなり、多様なカスタムデータセットへの汎化性能が向上する。
YOLOv9 :PGIとGELAN
YOLOv9 はプログラマブル勾配情報(PGI) と汎用効率的層集約ネットワーク(GELAN)YOLOv9 。PGIは重要なデータがネットワークの層を通過する際に失われないことを保証し、重み更新のための信頼性の高い勾配を提供する。GELANはパラメータ効率を最大化し、FLOPsを管理可能な範囲に保ちつつモデルが高精度を達成することを可能にする。
数学的には印象的ではあるものの、YOLOv9学習中に特定の補助的な可逆分岐に依存する性質は、標準的なパイプラインと比較して学習コードのカスタマイズをより複雑にする可能性がある。
性能指標とベンチマーク
以下の表は、異なるサイズにおけるモデルの直接比較を示しています。性能は物体検出の標準ベンチマークであるMSCOCO で測定されています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
注:各列の最高値は太字で強調表示されています。
トレードオフの分析
YOLOv9 、特にそのより大きなサイズにおいて、わずかに高いピーク精度(mAP)YOLOv9 。 e 変種。ただし、これには代償が伴う。Ultralytics YOLOv8 依然として大きな優位性をYOLOv8 。 推論速度特に、次のような形式にコンパイルされた場合 TensorRT または ONNX制約のあるエッジハードウェア(例: Raspberry Pi または古いモバイルチップ)、YOLOv8 n および s バリエーションははるかに実用的な性能バランスを提供する。
トレーニング効率と生態系統合
モデル選択は精度表を見るだけでは不十分であり、開発者体験が最も重要である。
Ultralytics :使いやすさ
YOLOv9 、複雑なGitHubリポジトリのクローン作成、PyTorch 管理、補助損失項目の重数の手動設定がYOLOv9 必要となる。
対照的に、Ultralytics YOLOv8 驚くほど合理化されたPython をYOLOv8 使いやすさを追求して設計されており、データ拡張やロギング( Weights & BiasesComet )、ハードウェア分散処理をネイティブに処理します。
from ultralytics import YOLO
# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)
# Export for edge deployment
model.export(format="engine", half=True) # TensorRT export
この単一のAPIにより、プロトタイプから本番環境までの時間が大幅に短縮されます。さらに、YOLOv8 トレーニングCUDA 少なく、開発者はコンシューマー向けハードウェアでより大きなバッチサイズを使用できます。
タスクの汎用性
YOLOv9 優れたバウンディングボックス検出器YOLOv9 、現実世界のビジョンAIYOLOv9 さらに多くの機能が必要となることがよくYOLOv9 。YOLOv8 汎用性の高い強力なYOLOv8 インスタンスセグメンテーション、姿勢推定、画像分類、オリエンテッドバウンディングボックス(OBB)をネイティブにサポートしています。単一のフレームワークで複数のタスクを処理することで、ソフトウェアの肥大化と保守コストを大幅に削減できます。
今後の展望
新しいプロジェクトを始める場合、以下の評価も検討するとよいでしょう Ultralytics YOLO11 あるいは最先端のYOLO26を検討することをお勧めします。これらはネイティブにエンドツーエンドNMS設計を備えています。
実際のユースケース
これらのモデルは実運用においてどの程度機能するのか?
自律型ドローンとロボティクス
迅速な障害物回避を必要とするロボット工学において、 YOLOv8 が最適な選択肢です。超低遅延の YOLOv8n 自律システムが環境にリアルタイムで反応し、衝突を防止することを保証します。ネイティブなエクスポート機能により OpenVINO CoreML により、商用ドローンに典型的な低消費電力チップへの展開が容易CoreML 。
高解像度欠陥検出
特殊な製造環境において、微細な異常の検出が重要でありオフライン処理が許容される場合、 YOLOv9 は非常に効果的です。PGIアーキテクチャは、微細なひび割れやPCBはんだ付けエラーを識別するために必要な、きめ細かい視覚的詳細をネットワークが保持するのに役立ちます。
スマート小売とセキュリティ分析
店舗の通路を横断する顧客の追跡や自動レジシステムの管理には、 YOLOv8 は最適なバランスを提供します。BoT-SORTなどの標準アルゴリズムを用いた検出とマルチオブジェクト追跡を同時に実行する能力により、マルチカメラ小売環境での堅牢なソリューションとなります。
ユースケースと推奨事項
YOLOv9 YOLOv8 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステム上の好みにYOLOv9 。
YOLOv8を選択すべき時
YOLOv8 以下に最適な選択肢YOLOv8 :
- 多目的マルチタスク展開: Ultralytics 内で、検出、セグメンテーション、分類、姿勢推定のための実績あるモデルを必要とするプロジェクト。
- 確立された生産システム: YOLOv8 構築済みの既存生産環境で、安定し十分にテスト済みのデプロイメントパイプラインを備える。
- 広範なコミュニティとエコシステムによるサポート: YOLOv8豊富なチュートリアル、サードパーティ統合、活発なコミュニティリソースを活用するアプリケーション。
YOLOv9を選択すべき時
YOLOv9 以下に推奨YOLOv9 :
- 情報ボトルネック研究:プログラマブル勾配情報(PGI)および汎用効率的層集約ネットワーク(GELAN)アーキテクチャを研究する学術プロジェクト。
- 勾配フロー最適化研究:深層ネットワーク層における学習中の情報損失の理解と軽減に焦点を当てた研究。
- 高精度検出ベンチマーク: YOLOv9強力なCOCO 性能が、アーキテクチャ比較の基準点として必要とされるシナリオ。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
次の進化:YOLO26
YOLOv8 YOLOv9 、AIの分野は急速に進化しています。最高の性能を求めるチーム向けに、新たにリリースされたYOLO26は、これらの前世代モデルの成功を基盤に構築されています。
YOLO26はエンドツーエンドNMS設計を導入し、複雑な後処理のボトルネックを完全に排除することで、デプロイメントを簡素化し、レイテンシをより予測可能にします。新開発のMuSGDオプティマイザーと 強化されたProgLoss + STAL損失関数により、DFL除去(分布焦点損失を排除し、エクスポート簡素化とエッジ/低電力デバイス互換性を向上)を実現。 CPU 最大43%高速化され、小物体認識性能も向上しました。エッジコンピューティングの限界に挑戦する開発者には、YOLO26の評価を強く推奨します。
要約すると、YOLOv9 魅力的なアーキテクチャ研究と優れたピーク精度YOLOv9 一方で、 Ultralytics YOLOv8 は、信頼性の高いソフトウェアを迅速にリリースすることを目指す大多数のコンピュータビジョンエンジニアにとって、最も実用的で、サポート体制が整い、汎用性の高い選択肢であり続けています。