コンテンツにスキップ

YOLOv9 YOLOv5:現代の物体検出技術への深い探求

コンピュータビジョン分野は驚異的な成長を遂げており、物体検出は無数の産業・研究アプリケーションの基盤となっている。適切なアーキテクチャの選択には、平均精度(mAP)、推論速度、メモリオーバーヘッドの慎重な評価が求められる。本比較では、二つの極めて影響力のあるモデルを検証する: YOLOv9(勾配情報の保持におけるアーキテクチャ的革新で知られる)と Ultralytics YOLOv5。後者は実戦で鍛えられた業界標準モデルとして、驚異的な使いやすさと比類のないデプロイの汎用性で知られています。

建築的革新と技術的起源

これら二つのモデルの根底にある仕組みを理解することは、それぞれの性能プロファイルを理解する上で重要な文脈を提供する。

YOLOv9: プログラマブル勾配情報

台湾・中央研究院情報科学研究所の研究者、王千耀(Chien-Yao Wang)と廖宏源(Hong-Yuan Mark Liao)によってYOLOv9 、2024年2月21日にYOLOv9 。このモデルは、深層ニューラルネットワークに共通する情報ボトルネックに対処するため、二つの画期的な概念を導入している:プログラマブル勾配情報(PGI)と汎用効率的層集約ネットワーク(GELAN)である。

PGIを活用することで、YOLOv9 フィードフォワード処理全体を通じて重要な情報をYOLOv9 、高精度な勾配更新YOLOv9 。一方、GELANアーキテクチャはパラメータ効率を最大化し、驚くほど低い計算オーバーヘッドで最先端の精度を達成します。技術的な詳細はYOLOv9 で確認するかYOLOv9 リポジトリをご覧ください。

YOLOv9について詳しくはこちら

Ultralytics YOLOv5: 生産環境の標準

グレン・ジョチャーによって考案され、2020年Ultralytics によって公開されたYOLOv5 、コンピュータビジョンのアクセシビリティにYOLOv5 。PyTorch上でネイティブに構築された最初の物体検出モデルの一つとして PyTorch フレームワーク上でネイティブに構築された最初の物体検出モデルの一つとして、従来のDarknet Cフレームワークの複雑さを回避しました。YOLOv5 高度に最適化されたCSPNetバックボーンとPANetネックYOLOv5 、速度と精度のシームレスなバランスを最優先しています。

しかし、その最大の成果は、より広範なUltralytics への統合である。YOLOv5 高速なトレーニング効率と低メモリ環境向けに高度にYOLOv5 、エッジデプロイメントにおいて非常に安定した動作を実現している。

YOLOv5について詳しくはこちら

メモリ効率

エッジデバイス向けモデルを評価する際には、Ultralytics YOLO 、大規模なトランスフォーマーベースのアーキテクチャと比較して、トレーニング時と推論時の両方で、通常、大幅にGPU 必要とすることを覚えておいてください。

性能分析:速度 vs. 精度

コンピュータビジョンパイプラインを設計する際、開発者は精度とレイテンシのトレードオフを慎重に検討する必要があります。以下の表は標準的なCOCO における性能差を示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

トレードオフの分析

YOLOv9 絶対的な精度優位性をYOLOv9 。YOLOv9eはGELAN層を活用して微細なディテールを保持し、mAP .mAP 押し上げた。これにより、医療画像や微小物体に対する厳密な精度が求められるシナリオにおいて、卓越した選択肢となる。

逆に、 YOLOv5GPU 、その生のデプロイ速度とハードウェアの柔軟性において優れています。YOLOv5n(Nano)は軽量で有名であり、 TensorRTでわずか1.12msで推論を実行します。リソース制約のあるIoTデバイス、スマートフォン、またはRaspberry Piへのデプロイの場合、YOLOv5 のメモリフットプリントは極めて高い信頼性YOLOv5 。

Ultralyticsエコシステムの利点

モデル選択における主要な考慮点は、周囲のソフトウェアエコシステムである。YOLOv9 最先端の研究ベンチYOLOv9 一方で、両モデルをUltralytics Python 活用することでギャップを埋め、開発者に統一された効率的な体験を提供する。

使いやすさとエクスポート

Ultralytics 複雑な技術的課題をUltralytics 。自動データ拡張ハイパーパラメータ調整といった機能は標準で対応済みです。モデルの本番環境移行も同様に容易で、組み込みのエクスポートコマンドによりモデルを ONNXOpenVINO、または TFLite 形式。

タスクの汎用性

両モデルとも物体検出に優れていますが、Ultralytics 多様なコンピュータビジョン課題に対応できるよう設計されています。この広範なフレームワークは、画像分類インスタンスセグメンテーション姿勢推定方向付きバウンディングボックス(OBB)をネイティブでサポートしており、開発者はコードベースを切り替えることなく複数のビジョン問題を解決できます。

ユースケースと推奨事項

YOLOv5 YOLOv9 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステム上の好みにYOLOv5 。

YOLOv9を選択すべき時

YOLOv9 以下のような場合に有力な選択肢YOLOv9 :

  • 情報ボトルネック研究:プログラマブル勾配情報(PGI)および汎用効率的層集約ネットワーク(GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化研究:深層ネットワーク層における学習中の情報損失の理解と軽減に焦点を当てた研究。
  • 高精度検出ベンチマーク: YOLOv9強力なCOCO 性能が、アーキテクチャ比較の基準点として必要とされるシナリオ。

YOLOv5を選択すべき時

YOLOv5 以下に推奨YOLOv5 :

  • 実績ある生産システム: YOLOv5 track 、豊富なドキュメント、大規模なコミュニティサポートが評価される既存の展開環境。
  • リソース制約下でのトレーニング: GPU 限られた環境において、YOLOv5効率的なトレーニングパイプラインと低いメモリ要件が有利に働く。
  • 幅広いエクスポート形式のサポート:複数の形式での展開を必要とするプロジェクトに対応 ONNXTensorRTCoreML、および TFLite

Ultralytics YOLO26)を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:

  • NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
  • CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
  • 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。

実装例

Ultralytics 優れた点は、重み付け文字列を変更YOLOv9 替えられることです。

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

新たなアーキテクチャの探求

YOLOv5 YOLOv9 優れたYOLOv9 、それぞれ明確な利点を持っていますが、この分野は進化を続けています。新たなプロジェクトを検討しているユーザーは、Ultralytics最新バージョンも評価することをお勧めします。

  • YOLO11: YOLOv8 力強く洗練された形で進化させたモデルであり、あらゆるビジョン課題において優れた速度と精度のバランスを提供する。
  • YOLO26:2026年にリリースされたYOLO26は、現代のパイプラインにおける究極の推奨モデルです。エンドツーNMS設計を導入し、後処理のボトルネックを完全に解消。DFL除去(分布焦点損失を削除し、エクスポートを簡素化、エッジ/低電力デバイスとの互換性を向上)により、 CPU 最大43%高速化。 新たなMuSGDオプティマイザーにより学習安定性が大幅に向上。ProgLoss + STALは損失関数を強化し、IoT・ロボティクス・航空画像処理で重要な小物体認識性能を顕著に改善。これによりエッジとクラウドの両展開において最も堅牢なアーキテクチャを実現。

大規模なデータセットと複雑なデプロイメントパイプラインを管理するチームにとって、Ultralytics を活用することで、これらの最先端モデルをトレーニング、track、デプロイするためのノーコードソリューションを容易に実現できます。


コメント