YOLOv9 YOLOv8:アーキテクチャ、性能、および応用
物体検出モデルの進化は加速を続け、開発者にコンピュータービジョンタスク向けの高度なツールを提供している。この分野における最も重要な貢献の2つは YOLOv9(中央研究院の研究者らが開発)と YOLOv8 Ultralytics Ultralyticsによって開発されたモデルです。両モデルとも最先端技術を推進していますが、それぞれ異なるアーキテクチャ戦略を採用し、異なる導入ニーズに対応しています。
本ガイドでは、YOLOv9 YOLOv8のアーキテクチャ、性能指標、トレーニング手法を詳細に技術比較し、アプリケーションに適したツールを選択するための支援を提供します。
モデル概要
技術仕様の詳細に入る前に、これら二つの強力なアーキテクチャの起源と主要な設計思想を理解することが不可欠である。
YOLOv9: プログラマブル勾配情報
2024年2月に中央研究院情報科学研究所の王建耀(Chien-Yao Wang)と廖宏源(Hong-Yuan Mark Liao)によってYOLOv9 、深層ネットワークにおける情報損失のYOLOv9 。著者らは二つの核心的な革新技術を導入した:プログラマブル勾配情報(PGI) と汎用効率的層集約ネットワーク(GELAN)である。
- PGI:データが深層を通過する際に失われる「情報ボトルネック」問題に対処します。補助的な監督を提供し、主枝が重要な特徴情報を保持することを保証します。
- GELAN:パラメータ効率を最適化する軽量アーキテクチャ。CSPNetとELANの長所を組み合わせ、勾配経路計画を最大化する。
YOLOv8:使いやすさと速度の標準
Ultralytics 発表YOLOv8 、YOLOv8 リアルタイム物体検出の業界標準となった。アンカーフリー検出ヘッドと、速度と精度を追求した新設計のバックボーンを導入。単なる性能指標を超え、YOLOv8 開発者体験をYOLOv8 、検出・セグメンテーション ・分類 ・姿勢推定のための統一フレームワークを提供する。
- アンカーフリー設計: ボックス予測の数を削減し、NMSを高速化します。
- モザイク補強:多様な背景に対する頑健性を向上させる高度なトレーニング手法。
- エコシステム統合:デプロイ、エクスポート、追跡のためのツールとシームレスに統合されています。
パフォーマンス比較
モデルを生産用に選択する際には、推論速度と検出精度(mAP)のトレードオフが最も重要である。以下の表は、物体検出の標準ベンチマークCOCO における性能をまとめたものである。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
主なポイント
- 精度: YOLOv9 、同等のモデルスケールにおいてYOLOv9 高いmAP を達成する。GELANアーキテクチャは複雑な特徴を効果的に捕捉するため、精度の1パーセント単位が重要な学術研究において有力な候補となる。
- 速度: YOLOv8 、GPU (TensorRT)上で優れた推論速度YOLOv8 。最適化されたC2fモジュールとアンカーフリーヘッドにより高速処理が可能となり、動画ストリームにおけるリアルタイム推論に不可欠です。
- 効率性: YOLOv9 一部の設定でパラメータYOLOv9 、Ultralytics 通常、トレーニング中のメモリ使用量が低くなります。この効率性により、開発者はより複雑な研究用アーキテクチャと比較して、CUDA が少ないコンシューマー向けYOLOv8 トレーニングできます。
トレーニングと使いやすさ
ユーザーエクスペリエンスは、プロジェクトが構想から展開へ移行する速度を左右することが多い。ここで、エコシステム支援の差が明らかになる。
Ultralyticsの利点
Ultralytics (YOLOv8 のYOLO26を含む)Ultralytics 、統一されたPython 上に構築されています。これにより一貫したAPIが保証され、開発者はたった1行のコードでモデルバージョンやタスクを切り替えることが可能です。
Ultralytics の特徴には以下が含まれます:
- 自動化されたMLOps:統合サポート Comet およびMLflowの統合サポートによる実験追跡。
- シンプルエクスポート:ワンクリックで以下の形式へエクスポート ONNX、 OpenVINO、CoreML などへのワンクリックエクスポート。モバイルおよびエッジデプロイメントCoreML 。
- 豊富なドキュメント: ハイパーパラメータ調整から データ拡張まで、あらゆる内容を網羅した膨大なガイドライブラリ。
from ultralytics import YOLO
# Load a model (YOLOv8 or YOLOv9)
model = YOLO("yolov8n.pt") # Switch to 'yolov9c.pt' instantly
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export for deployment
model.export(format="onnx")
YOLOv9
YOLOv9 Ultralytics YOLOv9 、元の実装は個別のスクリプトと設定ファイルに依存しています。元のコードベースから移行するユーザーは、Ultralytics ワークフローが大幅に効率化され、複雑なフォルダ構造の管理や手動での重みダウンロードが不要になることに気付くでしょう。
効率化されたワークフロー
YOLOv9 ultralytics パッケージは、以下のものを含むすべての生態系便益へのアクセス権を付与します: ハブ 統合と エクスプローラー スタンドアロンリポジトリでは利用できないAPI。
実際のユースケース
適切なモデルの選択は、アプリケーションの具体的な制約に大きく依存します。
YOLOv9の理想的なシナリオ
- 医療画像処理: 脳腫瘍検出やX線分析などのタスクにおいて、プログラマブル勾配情報(PGI)は、失われる可能性のある重要なテクスチャの詳細を保持し、高い診断精度を確保します。
- 小型物体検出:GELANアーキテクチャは特徴保存に優れており、YOLOv9 を高解像度航空写真やドローン映像における小型物体検出YOLOv9 としている。
- 学術ベンチマーク:最先端の結果を発表を目指す研究者は、より大規模なYOLOv9モデルが提供する高いmAP の恩恵を受けるでしょう。
YOLOv8の理想的なシナリオ
- 小売分析:店舗内での自動レジやヒートマップなどの用途において、YOLOv8 高価なハードウェアなしで複数のカメラ映像を同時に処理するのに必要な速度YOLOv8 。
- 組込みシステム:モデルの互換性 TFLite およびEdgeTPU 、Raspberry PiやNVIDIA などのデバイスでの実行に最適TPU 。
- ロボティクス:遅延がナビゲーションや障害物回避において極めて重要な動的な環境において、YOLOv8 の高速推論YOLOv8 ロボットはリアルタイムで反応できるYOLOv8
未来:YOLO26
YOLOv8 優れたYOLOv8 、この分野は進化を続けています。最先端を求める開発者はYOLO26を検討すべきです。2026年1月にリリースされたこのモデルは、効率性と性能において大きな飛躍を遂げています。
YOLO26はいくつかの画期的な機能を導入します:
- エンドツーエンドNMS:非最大抑制(NMS)を排除することで、YOLOv2は導入を簡素化し、レイテンシを大幅に削減します。これは YOLOv10。
- MuSGDオプティマイザー: SGD ューSGD 組み合わせたハイブリッドオプティマイザー。LLMで確認された学習安定性の向上をコンピュータビジョンにもたらす。
- 強化された汎用性: 方向付きバウンディングボックス(OBB)と姿勢推定に特化した改良により、複雑なビジョンタスクにおいて最も汎用性の高いツールとなりました。
- エッジ最適化:前世代比で最大43%高速CPU を実現し、エッジコンピューティングとモバイルアプリケーション向けに特別に設計されています。
新規プロジェクトでは、AI効率の最新進歩を活用していることを確実にするため、YOLOv8 YOLOv9 と並行してYOLO26を評価することを強くYOLOv9 。
結論
YOLOv9 YOLOv8 YOLOv9 明確な利点YOLOv8 。YOLOv9 高度な勾配情報管理による精度最大化を実現する堅牢なアーキテクチャYOLOv9 一方、YOLOv8 速度、使いやすさ、エコシステムサポートにおいて比類のないバランスYOLOv8 。
豊富なドキュメントとコミュニティのサポートによるシームレスな体験を求める開発者にとって、Ultralytics (YOLOv8 新登場のYOLO26を含む)Ultralytics 依然として最良の選択肢です。単一フレームワーク内で検出、セグメンテーション、分類をシームレスに切り替えられる機能により、チームは複雑なAIソリューションをより迅速かつ確実に構築できます。
Ultralytics 、あらゆるモデルを探索し、今日からトレーニングを開始しましょう。コンピュータビジョンモデルの注釈付け、トレーニング、デプロイを最もシンプルに行う方法です。