YOLOv8 YOLOv9:リアルタイム物体検出器の包括的な技術比較
リアルタイム物体検出の進化は、精度向上、低遅延化、ハードウェア利用率の改善に向けた不断の追求によって特徴づけられてきた。この道のりにおける二つの主要なマイルストーンは Ultralytics YOLOv8 と YOLOv9である。両モデルともコンピュータビジョン分野における最先端の能力を示す一方で、異なる導入ニーズ、アーキテクチャの理念、開発者エコシステムに対応している。
この包括的なガイドでは、技術的な差異、アーキテクチャ上の革新、および実用的な導入上の考慮事項を詳細に解説し、次の人工知能プロジェクトに最適なモデルを選択するお手伝いをします。
モデル系譜と中核理念
メトリクスに深く踏み込む前に、各モデルの起源と主要な設計目標を理解することが極めて重要です。
Ultralytics YOLOv8:汎用性の高いエコシステム標準
Ultralyticsチームよりリリース UltralyticsYOLOv8 、単体の物体検出器としてだけでなく、統一されたマルチタスクフレームワークとしてYOLOv8 。シームレスな開発者体験、低メモリ要件、幅広いハードウェア互換性を優先しています。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023-01-10
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLOv8 Docs
YOLOv9: プログラマブル勾配情報
Academia Sinicaの研究者によって独自に開発されたYOLOv9は、アーキテクチャ理論に重点を置いており、特に深層ニューラルネットワークにおける情報ボトルネック現象に対処しています。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024-02-21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
エンタープライズ展開
大規模な商用展開を計画している場合は、Ultralytics 活用をご検討ください。クラウドトレーニングの簡素化、データセット管理、ワンクリックAPIエンドポイントを実現します。
アーキテクチャの詳細
深層学習におけるアーキテクチャの選択は、モデルの学習効率やNVIDIA や Intel CPU。
YOLOv8 :C2fと分離ヘッド
YOLOv8 はC2fモジュール(2つの畳み込み層を持つクロスステージ部分ボトルネック)YOLOv8 、従来のC3モジュールに取って代わりました。この変更により勾配の流れが改善され、GPU 過度に消費することなく、ネットワークがより豊かな特徴表現を学習できるようになりました。
さらに、YOLOv8 アンカーフリー設計と分離型ヘッド YOLOv8 。物体検出、分類、回帰を別々の経路で処理することで、モデルは学習中の収束が速くなり、多様なカスタムデータセットへの汎化性能が向上する。
YOLOv9 :PGIとGELAN
YOLOv9 はプログラマブル勾配情報(PGI) と汎用効率的層集約ネットワーク(GELAN)YOLOv9 。PGIは重要なデータがネットワークの層を通過する際に失われないことを保証し、重み更新のための信頼性の高い勾配を提供する。GELANはパラメータ効率を最大化し、FLOPsを管理可能な範囲に保ちつつモデルが高精度を達成することを可能にする。
数学的には印象的ではあるものの、YOLOv9学習中に特定の補助的な可逆分岐に依存する性質は、標準的なパイプラインと比較して学習コードのカスタマイズをより複雑にする可能性がある。
性能指標とベンチマーク
以下の表は、異なるサイズにおけるモデルの直接比較を示しています。性能は物体検出の標準ベンチマークであるMSCOCO で測定されています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
注:各列の最高値は太字で強調表示されています。
トレードオフの分析
YOLOv9 、特にそのより大きなサイズにおいて、わずかに高いピーク精度(mAP)YOLOv9 。 e 変種。ただし、これには代償が伴う。Ultralytics YOLOv8 依然として大きな優位性をYOLOv8 。 推論速度、特にのような形式にコンパイルされた場合 TensorRT または ONNX。制約のあるエッジハードウェア(例えば、)で高フレームレート(FPS)を必要とするアプリケーションの場合、 Raspberry Pi または古いモバイルチップ)、YOLOv8 n および s バリエーションははるかに実用的な性能バランスを提供する。
トレーニング効率と生態系統合
モデルの選択は、単に精度表を見るだけではありません。開発者エクスペリエンスが最も重要です。
Ultralytics :使いやすさ
YOLOv9 、複雑なGitHubリポジトリのクローン作成、PyTorch 管理、補助損失項目の重数の手動設定がYOLOv9 必要となる。
対照的に、Ultralytics YOLOv8 驚くほど合理化されたPython をYOLOv8 使いやすさを追求して設計されており、データ拡張やロギング( Weights & BiasesComet )、ハードウェア分散処理をネイティブに処理します。
from ultralytics import YOLO
# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)
# Export for edge deployment
model.export(format="engine", half=True) # TensorRT export
この単一のAPIにより、プロトタイプから本番環境までの時間が大幅に短縮されます。さらに、YOLOv8 トレーニングCUDA 少なく、開発者はコンシューマー向けハードウェアでより大きなバッチサイズを使用できます。
タスクの汎用性
YOLOv9 優れたバウンディングボックス検出器YOLOv9 、現実世界のビジョンAIYOLOv9 さらに多くの機能が必要となることがよくYOLOv9 。YOLOv8 汎用性の高い強力なYOLOv8 インスタンスセグメンテーション、姿勢推定、画像分類、オリエンテッドバウンディングボックス(OBB)をネイティブにサポートしています。単一のフレームワークで複数のタスクを処理することで、ソフトウェアの肥大化と保守コストを大幅に削減できます。
今後の展望
新しいプロジェクトを始める場合、以下の評価も検討するとよいでしょう Ultralytics YOLO11 あるいは最先端のYOLO26を検討することをお勧めします。これらはネイティブにエンドツーエンドNMS設計を備えています。
実際のユースケース
これらのモデルは実運用においてどの程度機能するのか?
自律型ドローンおよびロボット工学
迅速な障害物回避を必要とするロボット工学において、 YOLOv8 が最適な選択肢です。超低遅延の YOLOv8n 自律システムが環境にリアルタイムで反応し、衝突を防止することを保証します。ネイティブのエクスポート機能は OpenVINO およびCoreMLは、商用ドローンに典型的な低電力チップへの展開を容易にします。
高解像度欠陥検出
特殊な製造環境において、微細な異常の検出が重要でありオフライン処理が許容される場合、 YOLOv9 は非常に効果的です。PGIアーキテクチャは、微細なひび割れやPCBはんだ付けエラーを識別するために必要な、きめ細かい視覚的詳細をネットワークが保持するのに役立ちます。
スマート小売とセキュリティ分析
店舗の通路での顧客のtrackや自動精算システムの管理において、YOLOv8は最高のバランスを提供します。BoT-SORTのような標準アルゴリズムを使用して、detectとマルチオブジェクトtrackを同時に実行するその能力は、マルチカメラ小売デプロイメント向けの堅牢なソリューションとなります。
ユースケースと推奨事項
YOLOv8とYOLOv9のどちらを選択するかは、特定のプロジェクト要件、デプロイの制約、およびエコシステムの好みによって異なります。
YOLOv8を選択すべき時
YOLOv8 以下に最適な選択肢YOLOv8 :
- 多様なマルチタスク展開: Ultralyticsエコシステム内で、detect、セグメンテーション、分類、姿勢推定の実績あるモデルを必要とするプロジェクト向け。
- 確立された本番システム: 安定した十分にテストされたデプロイメントパイプラインを備え、YOLOv8アーキテクチャ上に既に構築されている既存の本番環境。
- 広範なコミュニティとエコシステムサポート: YOLOv8の豊富なチュートリアル、サードパーティ統合、および活発なコミュニティリソースから恩恵を受けるアプリケーション。
YOLOv9を選択すべき時
YOLOv9 以下に推奨YOLOv9 :
- 情報ボトルネック研究: プログラマブル勾配情報(PGI)および汎用効率的層集約ネットワーク(GELAN)アーキテクチャを研究する学術プロジェクトです。
- 勾配フロー最適化研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に焦点を当てた研究。
- 高精度detectベンチマーク: YOLOv9の強力なCOCOベンチマーク性能が、アーキテクチャ比較の参照点として必要とされるシナリオ。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。
- NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
- CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
- 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。
次の進化:YOLO26
YOLOv8 YOLOv9 、AIの分野は急速に進化しています。最高の性能を求めるチーム向けに、新たにリリースされたYOLO26は、これらの前世代モデルの成功を基盤に構築されています。
YOLO26はエンドツーエンドNMS設計を導入し、複雑な後処理のボトルネックを完全に排除することで、デプロイメントを簡素化し、レイテンシをより予測可能にします。新開発のMuSGDオプティマイザーと 強化されたProgLoss + STAL損失関数により、DFL除去(分布焦点損失を排除し、エクスポート簡素化とエッジ/低電力デバイス互換性を向上)を実現。 CPU 最大43%高速化され、小物体認識性能も向上しました。エッジコンピューティングの限界に挑戦する開発者には、YOLO26の評価を強く推奨します。
要約すると、YOLOv9 魅力的なアーキテクチャ研究と優れたピーク精度YOLOv9 一方で、 Ultralytics YOLOv8 は、信頼性の高いソフトウェアを迅速にリリースすることを目指す大多数のコンピュータビジョンエンジニアにとって、最も実用的で、サポート体制が整い、汎用性の高い選択肢であり続けています。