YOLOv9 .YOLO11:現代の物体検出技術への深い探求
コンピュータビジョンの急速な進化は、リアルタイム物体検出の可能性の限界を絶えず押し広げてきた。主要なアーキテクチャを比較すると、 YOLOv9 と Ultralytics YOLO11 は画期的な飛躍として際立っており、それぞれが異なる技術的ニーズに対応している。YOLOv9 深層ネットワークの学習中に勾配の流れを維持する新たな手法YOLOv9 、YOLO11 比類のない効率性、汎用性、使いやすさで汎用ビジョンエコシステムにYOLO11 。
この包括的な技術比較では、各モデルのアーキテクチャ、性能指標、メモリ要件、および最適な導入シナリオを分析し、次なるAIプロジェクトに最適なモデルを選択するお手伝いをします。
YOLO26でプロジェクトの将来性を確保
YOLOv9 YOLO11 優れたモデルYOLO11 、新たにリリースされたYOLO26はさらなる飛躍を遂げています。エンドツーエンドNMS設計による簡素化されたデプロイメント、最大43%高速化されたCPU 、そして迅速な収束を実現する革新的なMuSGDオプティマイザを特徴とします。新規の生産プロジェクトには、YOLO26を強く推奨します。
技術仕様と著作権
これらのモデルの系譜を理解することは、そのアーキテクチャ上の決定やフレームワーク依存関係を理解する上で不可欠な背景を提供する。
YOLOv9
YOLOv9 深層学習における情報ボトルネックに学術的な焦点を強くYOLOv9 、カスタムネットワークブロックを通じて特徴量の忠実度を最大限に高めることを最優先した。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織:中央研究院情報科学研究所
- 日付: 2024年2月21日
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
Ultralytics YOLO11
YOLO11 、最高水準の精度、実環境での展開速度、マルチタスク対応能力のバランスを重視し、生産環境向けに一から設計YOLO11 。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024年9月27日
- GitHub:https://github.com/ultralytics/ultralytics
アーキテクチャの革新
YOLOv9におけるプログラマブル勾配情報
YOLOv9 、汎用効率的層集約ネットワーク(GELAN)と共に、プログラマブル勾配情報(PGI)のYOLOv9 。ニューラルネットワークが深くなるにつれ、情報ボトルネックに陥ることが多く、フィードフォワード処理中に重要な詳細情報が失われる。 PGIは微細な空間情報を保持した信頼性の高い勾配更新を提供することでこの問題を解決し、GELANはパラメータ効率を最大化します。YOLOv9 高精細な特徴再現性が求められるタスクにYOLOv9 優れていますが、後処理では標準的な非最大抑制(NMS)に依存するため、エッジデバイス上で遅延が生じる可能性があります。
YOLO11における効率化の合理化
YOLO11 、長年にわたる基礎研究を基盤としてYOLO11 高度に最適化されたアーキテクチャです。計算オーバーヘッドを削減しつつ特徴抽出を最大化することで、従来のバージョンを改善しています。CPU ボトルネックとなるNMS 異なり、YOLO11 洗練された検出ヘッドYOLO11 、レイテンシと精度の驚異的なバランスを実現しています。 さらに、YOLO11 重厚なトランスフォーマーモデルと比較して、モデル学習時と推論時の両方で本質的に低いメモリ使用量をYOLO11 。トランスフォーマーモデルは学習速度が遅く、膨大なCUDA 必要とする場合が多いのです。
性能指標の比較
標準的なCOCO でこれらのモデルを比較すると、両モデルとも驚異的な能力を発揮するが、パラメータ数の多さと処理速度の間にはトレードオフが生じる。
以下はYOLO 指標の詳細な内訳です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
結果の分析
- 速度とハードウェア効率: YOLO11 推論YOLOv9 YOLO11 上回ります。例えば、YOLO11nはNVIDIA GPU 上でGPU 、驚異的な1.5msを達成しています。 TensorRTにより驚異的な1.5msを達成し、厳密なリアルタイム処理パイプラインにおいて極めて実用的な性能を発揮します。
- 計算要件: YOLO11 一般的に必要なFLOPsが少ない(例: YOLO11mは680億FLOPs、YOLOv9mは763億FLOPs)。これはRaspberry Piやモバイルハードウェアなどのバッテリー駆動型エッジデバイスにおける消費電力の低減につながる。
- 精度対比: mAP YOLOv9eがYOLO11xをわずかに上回るmAP 55.6 vs 54.7)ものの、YOLO11 大幅に低いレイテンシ(11.3ms vs 16.77ms)で最高精度YOLO11 、実環境での展開においてより優れた性能バランスを示している。
エコシステムと使いやすさ
生データは重要ですが、プロジェクトの成功はフレームワークのエコシステムによって左右されることが多くあります。まさにここで、Ultralytics 真価を発揮します。
YOLOv9 高度に専門化されており、最先端の研究実装を提供します。しかし、Ultralytics とその対応するオープンソースパッケージは、合理化されたユーザー体験、シンプルなAPI、そして豊富なドキュメントを提供し、市場投入までの時間を大幅に短縮します。
マルチタスクの汎用性
YOLOv9 主にバウンディングボックス検出にYOLOv9 。一方、YOLO11 統合されたマルチタスクの強力な手法YOLO11 、以下をネイティブにサポートします:
シームレスなデプロイ
Ultralytics を利用することで、開発者はたった1行のコードでモデルを様々な形式にシームレスにエクスポートできます。 Python コードでモデルを様々な形式にシームレスにエクスポートできます。 ONNX、 OpenVINO、 TFLite、または CoreMLを使用する場合、トレーニングから本番環境への移行は容易です。
from ultralytics import YOLO
# Load a highly efficient YOLO11 model
model = YOLO("yolo11n.pt")
# Train rapidly on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to OpenVINO for Intel CPU acceleration
model.export(format="openvino")
理想的なユースケース
YOLOv9を活用すべきタイミング
YOLOv9 、ハードウェアの遅延が主要な制約条件ではない、研究中心の環境や極端な特徴量の忠実度を優先するシナリオにおいて優れたツールYOLOv9 。そのGELANアーキテクチャは、最小のピクセル変動の検出が極めて重要となる医療画像解析において非常に有利に働く可能性があります。
なぜYOLO11 優れた選択肢YOLO11
開発者、エンジニア、運用チームにとって、YOLO11 強くYOLO11 。高速かつスケーラブルなデプロイメントが求められる環境において特に優れています:
- スマート小売分析: Intel プロセッサを活用し、製品と顧客をシームレスに追跡します。
- 自律型ドローン:低FLOPアーキテクチャがバッテリー寿命を保ちつつ、堅牢な小物体検出を実現する領域。
- 動的プロジェクト:検出から開始されるが、後段階で姿勢推定やセグメンテーションが必要となる可能性のあるワークフロー。
展望:次の進化
YOLO11 世代における最先端YOLO11 一方、コンピュータビジョンの分野は進化を続けている。AIの限界を探求するユーザーは、 YOLO26にも目を向けるべきである。
エンドツーエンドのNMS設計の先駆けとして初めて探求された YOLOv10で初めて探求されたエンドツーエンドのNMSフリー設計を先駆け、YOLO26は前例のないトレーニング安定性を実現するMuSGDオプティマイザー(SGD ハイブリッド)を導入。エクスポート簡素化のための分布焦点損失(DFL)の削除、ProgLossやSTALなどの先進的な損失メカニズムにより、YOLO26はCPU を達成。 現代のプロジェクトにおいて、学術的革新性と実運用レベルの信頼性を究極的に融合。さらに、 Ultralytics YOLOv8 からの移行においても、統一されたUltralytics により、YOLO26またはYOLO11 への移行はYOLO11 摩擦なく行えます。