コンテンツにスキップ

YOLOv7 YOLOv9:包括的な技術比較

YOLO Only Look Once)ファミリーの進化は、ニューラルネットワークアーキテクチャの絶え間ない革新によって特徴付けられ、推論速度、精度、計算効率の間の重要なトレードオフのバランスを取ってきた。この比較では YOLOv72022年のマイルストーンリリースで、学習可能な「フリービーバッグ」で知られる YOLOv9ディープネットワークの情報ボトルネックを克服するためにプログラマブル勾配情報(PGI)を導入した2024年のアーキテクチャである。

パフォーマンスと効率の分析

YOLOv7 YOLOv9 移行は、パラメータ効率の大幅な飛躍を意味する。YOLOv7 、E-ELAN(Extended Efficient Layer Aggregation Networks)を使用したリアルタイム物体検出の限界に挑戦するために最適化されていたが、YOLOv9 、より少ないパラメータと浮動小数点演算(FLOPs)でより高い平均精度mAP)を達成することを可能にするアーキテクチャの変更を導入している。

エッジAIの展開に注力する開発者にとって、この効率性は極めて重要である。下表に示すように、YOLOv9eは 55.6%という圧倒的な mAP達成し、競争力のある計算フットプリントを維持しながら、大型のYOLOv7xを上回っている。逆に、小型のYOLOv9tは、YOLOv7 同じ粒度で明確にはターゲットにしていない層である、制約の多いデバイス向けの軽量ソリューションを提供しています。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

YOLOv7:トレーニング可能なバッグ・オブ・フリービーズの最適化

2022年7月にリリースされたYOLOv7 、YOLO アーキテクチャにいくつかの構造改革を導入し、推論コストを増加させることなく学習プロセスを最適化することに焦点を当てた。

建築ハイライト

YOLOv7 E-ELAN(Extended Efficient Layer Aggregation Network)を利用し、ネットワークがより多くの特徴を効率的に学習できるように、最短および最長の勾配パスを制御する。また、連結ベースのモデルのスケーリングを普及させ、深さと幅を同時にスケーリングできるようにした。重要な革新は、計画された再パラメータ化された畳み込みで、推論中のモデル・アーキテクチャを合理化し、速度を向上させた。

レガシーステータス

YOLOv7 有能なモデルであることに変わりはないが、Ultralytics エコシステムで見られる新しい最適化のネイティブサポートが欠けている。開発者は、最新のMLOpsツールとの統合が、新しいバージョンと比較してより困難であると感じるかもしれない。

YOLOv7もっと知る

YOLOv9:情報のボトルネックを解消する

2024年初頭に発表されたYOLOv9、ディープラーニングにおける基本的な問題、すなわちデータが連続するレイヤーを通過する際の情報損失に対処している。

建築ハイライト

YOLOv9 革新的なコアは、プログラマブル勾配情報(PGI)である。ディープネットワークでは、フィードフォワードの過程で有用な情報が失われ、信頼性の低い勾配が生じることがある。PGIは補助的な監視フレームワークを提供し、重要な情報が損失関数に保存されるようにします。さらに、Generalized Efficient Layer Aggregation Network (GELAN)は、任意のブロッキングを可能にすることでELANの機能を拡張し、パラメータと計算リソースを最大限に活用する。

このアーキテクチャにより、YOLOv9 、乱雑な環境での小さな物体の検出や高解像度の航空画像解析など複雑な検出タスクに非常に強くなっている。

YOLOv9もっと知る

Ultralytics YOLO11 &YOLOv8)が選ばれる理由

YOLOv7 YOLOv9 素晴らしい学術的業績である一方 Ultralytics YOLOシリーズは YOLOv8と最先端の YOLO11-は、実用的な実際のアプリケーション開発のために特別に設計されています。これらのモデルは、使いやすさエコシステムの統合運用効率を最優先しており、ほとんどのエンジニアリングチームにとって優れた選択肢となっています。

合理化されたユーザー・エクスペリエンス

Ultralytics モデルは、トレーニングパイプラインの複雑さを抽象化する統一されたPython APIに包まれています。オブジェクト検出インスタンス分割ポーズ推定OBB(Oriented bounding box)タスクを切り替えるには、引数を1つ変更するだけでよく、標準的なYOLOv7 YOLOv9 実装にはない汎用性があります。

from ultralytics import YOLO

# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt")  # Load a pretrained model

# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Perform inference on an image
results = model("path/to/image.jpg")

整備されたエコシステム

Ultralytics モデルを選択すると、堅牢なエコシステムへのアクセスが可能になります。これには、クラウドトレーニングとデータセット管理のためのUltralytics HUB(および今後のUltralytics Platform)とのシームレスな統合が含まれます。さらに、活発なコミュニティと頻繁なアップデートにより、次のような最新のハードウェアとの互換性が保証されています。 TensorRTまたは OpenVINOへのエクスポートなど、最新のハードウェアとの互換性を確保しています。

記憶力とトレーニング効率

Ultralytics モデルは、そのトレーニング効率の高さで知られている。変圧器ベースのモデル(例えば RT-DETRなど)とは異なり、Ultralytics YOLO モデルは、最適化されたデータローダーとMosaic拡張機能を利用することで、少ないCUDA メモリー要件で迅速なトレーニング時間を実現します。これにより、開発者はコンシューマーグレードのGPUで最先端のモデルをトレーニングすることができます。

YOLO11の詳細について。

理想的なユースケース

適切なモデルを選択するかどうかは、プロジェクト特有の制約に左右される。

YOLOv9実世界での応用例

YOLOv77の実際のアプリケーション

  • レガシーシステム:コードベース全体をリファクタリングすることなく、安定した既知の量を必要とするプロジェクト。

Ultralytics 実世界応用YOLO11

  • スマートシティスピードと導入のしやすさが最優先される交通流解析にオブジェクトトラッキングを使用。
  • ヘルスケア:セグメンテーションと検出が同時に必要とされることが多い医療画像解析
  • 製造: NVIDIA JetsonやRaspberry Piのようなエッジデバイスに品質管理システムを展開し、TFLite ONNX簡単なエクスポートオプションの恩恵を受けています。

結論

YOLOv7 YOLOv9 、コンピュータ・ビジョンの歴史における重要なマイルストーンである。 YOLOv9は、そのPGIアーキテクチャーにより、v7を上回る魅力的なアップグレードを提供し、より優れた効率性と精度を実現している。しかし、多用途で使いやすく、十分なサポートが受けられるソリューションをお探しの開発者の方々には、YOLOv9の方がおすすめです、 Ultralytics YOLO11をお勧めします。その性能のバランス、包括的なドキュメント、マルチタスク機能detect、segment、classify、ポーズ)は、コンセプトから生産への最短経路を提供します。

その他のモデルを見る

特定のコンピュータ・ビジョン・タスクに完璧に適合するものを見つけるには、この他の比較を検討してください:

  • YOLOv8 YOLOv9比較 - 広く採用されているv8と研究に重点を置いたv9を比較。
  • YOLOv10 YOLOv9比較-YOLOv10 エンド・ツー・エンドの比較をご覧ください。
  • YOLO11 YOLOv8比較-Ultralytics 最新リリースの改善点を理解する。
  • RT-DETR vs.YOLOv9- トランスフォーマーに基づく検出とCNNの比較。

コメント