Link to this sectionYOLOv9 と YOLO11 の比較#
コンピュータビジョンの急速な進化により、リアルタイム物体検出で可能なことの限界が絶えず押し広げられています。主要なアーキテクチャを比較すると、YOLOv9と**Ultralytics YOLO11**はそれぞれ異なる技術的ニーズを満たす記念碑的な飛躍として際立っています。YOLOv9はディープネットワーク学習中の勾配フローを維持する新しい手法を導入し、一方でYOLO11は比類のない効率性、汎用性、使いやすさによって汎用ビジョンエコシステムを刷新しました。
この包括的な技術比較では、次回のAIプロジェクトに最適なモデルを選択できるよう、両者のアーキテクチャ、パフォーマンスメトリクス、メモリ要件、および理想的なデプロイシナリオを分析します。
YOLOv9とYOLO11は優れたモデルですが、新しくリリースされたYOLO26は次なる飛躍を象徴するものです。これはデプロイを簡素化するエンドツーエンドのNMSフリー設計、最大43%高速なCPU推論、迅速な収束を実現する革新的なMuSGDオプティマイザを備えています。すべての新しい本番プロジェクトにおいて、YOLO26を強く推奨します。
Link to this section技術仕様と著作権情報#
これらのモデルの系譜を理解することは、アーキテクチャ上の決定やフレームワークの依存関係に関する重要なコンテキストを提供します。
Link to this sectionYOLOv9#
YOLOv9は、ディープラーニングにおける情報ボトルネックに関する学術的焦点が強く、カスタムネットワークブロックを通じて最大の特徴量忠実度を最優先しています。
- 著者: Chien-Yao Wang および Hong-Yuan Mark Liao
- 組織: 中央研究院 情報科学研究所
- 日付: 2024年2月21日
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
Link to this sectionUltralytics YOLO11#
YOLO11は本番環境向けにゼロから設計されており、最高水準の精度、実用的なデプロイ速度、マルチタスクの汎用性のバランスに重点を置いています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024年9月27日
- GitHub: https://github.com/ultralytics/ultralytics
Link to this sectionアーキテクチャの革新#
Link to this sectionYOLOv9におけるプログラマブル勾配情報#
YOLOv9は、Generalized Efficient Layer Aggregation Network (GELAN) とともに、プログラマブル勾配情報 (PGI) という概念を導入しています。ニューラルネットワークが深くなるにつれ、フィードフォワードの過程で重要な詳細が失われる情報ボトルネックが発生しやすくなります。PGIは、微細な空間情報を保持する信頼性の高い勾配更新を提供することでこれに対処し、GELANはパラメータ効率を最大化します。これにより、YOLOv9は高い特徴量忠実度を必要とするタスクに特に適していますが、ポストプロセスで標準的な非最大値抑制 (NMS) に依存しているため、エッジデバイスで遅延が生じる可能性があります。
Link to this sectionYOLO11における効率の最適化#
YOLO11 builds on years of foundational research to deliver a highly optimized architecture. It improves upon previous iterations by reducing computational overhead while maximizing feature extraction. Unlike traditional NMS pipelines that bottleneck CPU performance, YOLO11 uses refined detection heads that achieve an incredible balance between latency and precision. Furthermore, YOLO11 boasts inherently lower memory usage during both model training and inference compared to heavy Transformer models, which are often slower to train and require massive amounts of CUDA memory.
Link to this sectionパフォーマンスメトリクスの比較#
標準的なCOCO datasetでこれらのモデルを比較すると、両者とも素晴らしい機能を発揮しますが、純粋なパラメータ数と運用速度の間でトレードオフが発生します。
以下はYOLO Performance Metricsの詳細な内訳です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this section結果の分析#
- Speed and Hardware Efficiency: YOLO11 consistently outperforms YOLOv9 in inference speed. For example, the YOLO11n achieves an astonishing 1.5ms on an NVIDIA T4 GPU using TensorRT, making it incredibly viable for strict real-time pipelines.
- 計算要件: YOLO11モデルは一般的に必要なFLOPsが少なく(例: YOLO11mの68.0Bに対しYOLOv9mは76.3B)、Raspberry Piやモバイルハードウェアなどのバッテリー駆動のエッジデバイスでの消費電力を低減します。
- 精度の同等性: YOLOv9eは絶対的なmAPにおいてYOLO11xをわずかに上回りますが(55.6対54.7)、YOLO11は大幅に少ない遅延(11.3ms対16.77ms)でピーク精度に達しており、実世界でのデプロイにおいてより好ましいパフォーマンスのバランスを示しています。
Link to this sectionエコシステムと使いやすさ#
生のメトリクスも重要ですが、多くの場合、フレームワークのエコシステムがプロジェクトの成功を左右します。ここでUltralytics Advantageが真価を発揮します。
オリジナルのYOLOv9リポジトリは非常に専門的で、最先端の研究実装を提供しています。しかし、Ultralytics Platformとその対応するオープンソースパッケージは、合理化されたユーザー体験、シンプルなAPI、そして市場投入までの時間を大幅に短縮する広範なドキュメントを提供します。
Link to this sectionマルチタスクの汎用性#
YOLOv9は主にバウンディングボックス検出に焦点を当てています。対照的に、YOLO11はネイティブで以下をサポートする統合マルチタスクの強力なモデルです。
Link to this sectionシームレスなデプロイ#
Using the Ultralytics ecosystem allows developers to seamlessly export models to an array of formats with a single line of Python code. Whether targeting ONNX, OpenVINO, TFLite, or CoreML, the transition from training to production is effortless.
from ultralytics import YOLO
# Load a highly efficient YOLO11 model
model = YOLO("yolo11n.pt")
# Train rapidly on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to OpenVINO for Intel CPU acceleration
model.export(format="openvino")Link to this section理想的なユースケース#
Link to this sectionYOLOv9を活用すべき場面#
YOLOv9は、ハードウェアの遅延が主な制約事項ではない、研究中心の環境や極めて高い特徴量忠実度を優先するシナリオに最適なツールです。そのGELANアーキテクチャは、わずかなピクセルの違いを検出することが重要な医療画像解析において非常に有益です。
Link to this sectionYOLO11が優れた選択肢である理由#
開発者、エンジニア、本番チームにとって、YOLO11が強く推奨されます。高速かつスケーラブルなデプロイが求められる環境でその真価を発揮します。
- スマート小売分析: 標準的なIntel standard processorsを使用して製品や顧客をシームレスに追跡します。
- 自律型ドローン: 低FLOPアーキテクチャがバッテリー寿命を維持しつつ、堅牢な小物体検出を実現します。
- 動的なプロジェクト: 最初は検出として始まっても、後からポーズ推定やセグメンテーションが必要になる可能性のあるワークフローに適しています。
Link to this section今後の展望:次なる進化#
YOLO11はその世代における最先端技術を代表するものですが、コンピュータビジョンの状況は進化し続けています。AIの限界を探求するユーザーは、**YOLO26**にも目を向けるべきです。
YOLOv10で初めて探求されたエンドツーエンドのNMSフリー設計を先駆的に採用したYOLO26は、前例のない学習安定性を実現するMuSGDオプティマイザ(SGDとMuonのハイブリッド)を導入しています。エクスポートを簡素化するためのDistribution Focal Loss (DFL) の削除や、ProgLossやSTALといった高度な損失メカニズムにより、YOLO26はCPU推論を最大43%高速化しました。モダンなプロジェクトにとって、学術的な革新性と実用的な信頼性の究極の組み合わせを提供します。さらに、Ultralytics YOLOv8のようなレガシーシステムからアップグレードするチームは、統合されたUltralytics APIのおかげで、YOLO26やYOLO11への移行を完全にスムーズに行うことができます。