コンテンツにスキップ

YOLOv9 .YOLOv8:現代の物体検出技術への深い探求

リアルタイムコンピュータービジョンの分野はここ数年で目覚ましい進化を遂げ、新たなモデルが登場するたびに、エッジデバイスとクラウドサーバーの両方における理論的な限界が押し広げられてきた。最新のYOLOv9 を、非常に人気のある Ultralytics YOLOv8 フレームワークを比較する際、開発者は最先端の理論的な勾配経路と、実戦で鍛え抜かれた実運用可能なエコシステムの選択を迫られることが多い。

この包括的なガイドでは、これら二つの有力なモデルを比較し、そのアーキテクチャ上の革新性、性能指標、および理想的な導入シナリオを分析することで、次の人工知能プロジェクトに最適なモデルを選択するお手伝いをします。

技術仕様と著作権

これらのモデルの系譜を理解することは、それぞれの設計選択に対する重要な背景を提供する。

YOLOv9 台湾・中央研究院情報科学研究所の王千耀(Chien-Yao Wang)と廖宏源(Hong-Yuan Mark Liao)によってYOLOv9 、2024年2月21日にYOLOv9 。本研究の核心は、深層ニューラルネットワークにおける情報ボトルネックの解決に焦点を当てています。YOLOv9 オリジナルYOLOv9 はArxivで閲覧可能であり、ソースコードは YOLOv9 リポジトリで確認できます。

YOLOv9について詳しくはこちら

Ultralytics YOLOv8 Ultralytics Jocher、Ayush Chaurasia、Jing QiuによってYOLOv8 、2023年1月10日にYOLOv8 。多様なビジョンタスクに対応する統一APIを提供し、汎用性の面で業界標準としての地位を確立しました。ソースコードUltralytics リポジトリで管理されており、継続的な更新と長期的な安定性が保証されています。

YOLOv8について詳しくはこちら

アーキテクチャの革新

YOLOv9: プログラマブル勾配情報

YOLOv9 決定的な特徴YOLOv9 プログラマブル勾配情報(PGI)と汎用効率的層集約ネットワーク(GELAN)の導入YOLOv9 。 畳み込みニューラルネットワークが深くなるにつれ、通常は順伝播過程で重要な特徴情報が失われる。PGIはこの情報ボトルネックに対処し、重み更新に用いられる正確な勾配を保持することで、信頼性の高い特徴抽出を保証する。このアーキテクチャはパラメータ効率を最大化し、YOLOv9 より少ない浮動小数点演算(FLOPs)で高精度を達成YOLOv9 可能にする。

YOLOv8:万能な主力モデル

YOLOv8 簡素化されたアンカーフリー検出機構YOLOv8 、予測ボックス数を削減するとともに、後処理段階における非最大抑制(NMS)を高速化しました。そのC2fモジュール(2つの畳み込み層を備えたクロスステージ部分ボトルネック)は、従来モデルと比較してネットワーク全体の勾配流れを改善します。 さらに重要なのは、YOLOv8 汎用性を念頭にYOLOv8 、オブジェクト検出インスタンスセグメンテーション姿勢推定画像分類向き付き境界ボックス(OBB)抽出を標準でネイティブサポートしている点である。

エコシステム統合

YOLOv9 優れた検出性能YOLOv9 、複雑なパイプラインへのネイティブ統合は困難な場合があります。Ultralytics YOLOv9 この課題を解決し、当社の堅牢なエクスポートおよびデプロイメントツールへのアクセスを提供します。

パフォーマンスのバランスとベンチマーク

速度と精度のトレードオフは、ビジョンモデルを展開する際に最も重要な要素である。以下に、標準的なCOCO で評価したモデルサイズ、レイテンシ、平均精度(MAP)の詳細な比較を示す。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

メトリクスを分析すると、YOLOv9 パラメータ数と精度の高さに優れた比率YOLOv9 。YOLOv9cモデルはmAP 53.0%という高いmAP を達成している。しかし、YOLOv8 メモリ要件とハードウェアアクセラレータ上での推論速度においてYOLOv8 大きな優位性をYOLOv8 、YOLOv8n 1060で1.47msという速度を記録している。 NVIDIA TensorRT 環境で1.47msを達成している。

Ultralyticsエコシステムの利点

アーキテクチャを選択する際の重要な考慮点は、使いやすさと周辺ソフトウェアのエコシステムです。依存関係の管理、カスタムデータローダーの作成、複雑なエクスポートスクリプトの処理は開発を停滞させます。統合されたUltralytics 、こうした複雑さを抽象化します。

YOLOv8 YOLOv9 Ultralytics 完全にサポート)のいずれを選択しても、統一されたAPI、自動データ拡張技術、効率化ONNX を活用できます。さらに、Ultralytics 一般的に高度に最適化されたトレーニング効率を備えており、大規模なトランスフォーマーベースモデルにありがちな膨大なCUDA 肥大化を回避します。

トレーニングコードの例

Python を使用していずれのモデルもトレーニングすることは簡単で、わずか数行のコードで実現できます。

from ultralytics import YOLO

# Load the preferred model (swap 'yolov9c.pt' with 'yolov8n.pt' as needed)
model = YOLO("yolov8n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance metrics
metrics = model.val()

# Export to ONNX for production deployment
model.export(format="onnx")

ユースケースと推奨事項

YOLOv8 YOLOv9 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステム上の好みにYOLOv8 。

YOLOv9を選択すべき時

YOLOv9 以下のような場合に有力な選択肢YOLOv9 :

  • 情報ボトルネック研究:プログラマブル勾配情報(PGI)および汎用効率的層集約ネットワーク(GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化研究:深層ネットワーク層における学習中の情報損失の理解と軽減に焦点を当てた研究。
  • 高精度検出ベンチマーク: YOLOv9強力なCOCO 性能が、アーキテクチャ比較の基準点として必要とされるシナリオ。

YOLOv8を選択すべき時

YOLOv8 以下に推奨YOLOv8 :

  • 多目的マルチタスク展開: Ultralytics 内で、検出セグメンテーション分類姿勢推定のための実績あるモデルを必要とするプロジェクト。
  • 確立された生産システム: YOLOv8 構築済みの既存生産環境で、安定し十分にテスト済みのデプロイメントパイプラインを備える。
  • 広範なコミュニティとエコシステムによるサポート: YOLOv8豊富なチュートリアル、サードパーティ統合、活発なコミュニティリソースを活用するアプリケーション。

Ultralytics YOLO26)を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:

  • NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
  • CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
  • 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。

展望:YOLO26の登場

YOLOv8 YOLOv9 はいずれも非常にYOLOv9 、コンピュータビジョンの分野は急速に進化しています。現代的な導入においては、Ultralytics YOLO26の利用を強く推奨します。 Ultralytics の利用を強く推奨します。

YOLO26は、実運用環境における物体検出器の動作様式にパラダイムシフトをもたらす。ネイティブな NMS設計を採用し、後処理に伴う遅延や非決定的挙動を効果的に排除。エッジデバイスや低消費電力ハードウェアへの対応強化のため、DFL(分布焦点損失)完全除去し、モバイル向けエクスポートを劇的に簡素化した。

さらに、YOLO26は画期的なMuSGDオプティマイザーを採用しています。これはSGD ハイブリッド手法であり、ビジョンタスクにLLMレベルのトレーニング安定性をもたらし、収束速度を大幅に向上させます。最大43%高速化したCPU ProgLoss + STALの統合による微小物体認識の大幅な改善により、YOLO26は新たな企業イニシアチブにおける確固たる選択肢です。

YOLO26についてさらに詳しく

代替アーキテクチャ

ハードウェアの制約によっては、これらのモデルを Ultralytics YOLO11 のような汎用タスク向けのモデルとの比較、あるいは RT-DETR のようなトランスフォーマーベースのモデルを検討することも可能です。

実世界でのアプリケーションとユースケース

YOLOv8 YOLOv9 の選択は、YOLOv9 プロジェクトの制約と対象ハードウェアによって決まります。

  • 医療と医療画像: 腫瘍検出システムなど、ピクセル単位の精度が求められる場面において、YOLOv9アーキテクチャは微細なディテールを極めて良好に保持し、重要な診断における偽陰性を低減します。
  • 小売・在庫分析:密集した棚を追跡するスマートスーパーマーケットシステムにおいて、YOLOv9 重なり合う商品を確実に分離mAP 必要なmAP YOLOv9 。
  • スマートシティと交通監視:高速化する物流・交通管理において、YOLOv8 超低遅延性と実証済みの堅牢性は、複数のカメラストリームを同時に跨いだ車両追跡にYOLOv8 。
  • エッジデプロイメント:Raspberry Piやモバイルハードウェアのような制約のあるデバイスにデプロイする場合、YOLOv8 高度に最適化されたC2fブロックYOLOv8 およびYOLO26のCPU )により、よりスムーズでバッテリー消費を抑えた推論パイプラインが実現されます。

コメント