Link to this sectionYOLO11 と YOLOv9 の比較#
コンピュータビジョンの領域は絶えず進化しており、新しいアーキテクチャがリアルタイム物体検出の可能性の限界を押し広げています。この歩みにおける重要なマイルストーンとして、Ultralytics YOLO11 と YOLOv9 が挙げられます。どちらのモデルも卓越したパフォーマンスを提供しますが、ディープラーニングの推論とトレーニングにおける核心的な課題を解決するために、それぞれ異なるアプローチを採用しています。
本ガイドでは、YOLO11 と YOLOv9 の包括的な技術比較を行い、アーキテクチャ、パフォーマンス指標、および理想的なデプロイシナリオを分析します。これにより、お客様の次期人工知能プロジェクトに適したモデルを選択するための支援を提供します。
Link to this sectionモデルの概要#
Link to this sectionUltralytics YOLO11#
YOLO11 は、本番環境向けに設計された非常に最適化された汎用性の高いモデルです。最先端の精度と、エッジコンピューティングや大規模デプロイにおける実践的な要件とのバランスを両立しています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
Link to this sectionYOLOv9#
YOLOv9 は、深層ニューラルネットワークにおける情報損失を軽減するための新しい概念を導入した学術的に強力なモデルであり、特徴抽出の理論的進歩に重点を置いています。
- 著者: Chien-Yao Wang および Hong-Yuan Mark Liao
- 組織: 台湾 中央研究院 情報科学研究所
- 日付: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- ドキュメント: https://docs.ultralytics.com/models/yolov9/
Link to this sectionアーキテクチャの革新#
Link to this sectionYOLOv9: プログラマブル勾配情報#
YOLOv9 は、深層ネットワークの連続した層をデータが通過する際に発生する「情報ボトルネック」問題に取り組みます。これを解決するために、著者らはプログラマブル勾配情報 (PGI) と一般化効率層アグリゲーションネットワーク (GELAN) を導入しました。PGI は、バックプロパゲーション中に重みを更新するために使用される勾配に完全な情報が含まれることを保証し、非常に正確な特徴表現をもたらします。GELAN アーキテクチャはパラメータ効率を最大化し、YOLOv9 が比較的軽量な構造で高精度を実現することを可能にしています。
Link to this sectionYOLO11: エコシステムと効率性#
YOLOv9 が勾配フローに重点を置く一方で、YOLO11 は現実世界での堅牢性と汎用性を考慮して設計されています。Transformer を多用する代替案と比較して、トレーニング中の CUDA メモリ要件を大幅に削減するために、基本的な YOLO アーキテクチャを改良しています。さらに、YOLO11 は単なる物体検出器ではなく、インスタンスセグメンテーション、画像分類、姿勢推定、および 指向性バウンディングボックス (OBB) をネイティブにサポートしています。
YOLO11 の最大の強みの 1 つは、Ultralytics Platform への統合です。これにより、データ読み込み、オーグメンテーション、分散トレーニングの複雑さが単一の API に抽象化されます。
Link to this sectionパフォーマンスの比較#
本番環境向けモデルを選択する際には、平均適合率 (mAP)、推論速度、およびパラメータ数のトレードオフを評価することが不可欠です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
表に示すように、YOLOv9e は全体的に最も高い精度を達成しており、学術的なベンチマークとして非常に優れています。しかし、YOLO11 は全体を通して優れた速度対精度の比率を提供します。例えば、YOLO11m は 4.7 ms (TensorRT) で 51.5 mAP を達成し、同サイズの YOLOv9m を速度面で上回ります。
Link to this sectionトレーニング方法論とエコシステム#
両フレームワーク間では、開発者体験が大きく異なります。
Link to this sectionYOLOv9 のトレーニング#
YOLOv9 のトレーニングでは、多くの場合、高度にカスタマイズされた研究用コードを扱い、特定の依存関係バージョンを管理し、複雑なコマンドライン引数を利用する必要があります。強力ではありますが、ペースの速いエンタープライズ環境では導入のハードルが高い場合があります。
Link to this sectionYOLO11のトレーニング#
YOLO11 は、適切にメンテナンスされた Ultralytics Python API を活用しており、シームレスな「ゼロからヒーロー」体験を提供します。効率的なトレーニングプロセスは、すぐに利用可能な学習済み重みと優れたコミュニティサポートによって支えられています。
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")Python のわずか 3 行のコードで、開発者はモデルを読み込み、最適化されたデフォルトのハイパーパラメータを使用してトレーニングを開始し、トレーニング済みのアーキテクチャを ONNX や TensorRT などのフレームワークにエクスポートしてエッジデプロイすることができます。
Link to this section実際のアプリケーション#
Link to this sectionYOLOv9を選択すべき場合#
YOLOv9 は、ディープラーニングアーキテクチャを探求したい研究者にとって素晴らしい選択肢です。その PGI フレームワークは、高密度データセットで極めて高い精度が要求される高速小売分析において理想的であり、デプロイの複雑さよりもアルゴリズムのパフォーマンスが優先される場合に適しています。
Link to this sectionYOLO11を選択すべき時#
YOLO11 は、本番環境向けの究極のツールです。その合理化された 物体検出 機能は、スマートシティの交通管理や、Raspberry Pi や NVIDIA Jetson などのエッジデバイスに最適です。さらに、さまざまなタスクに対する汎用性は、単一の開発パイプラインで製造業におけるセグメンテーションやスポーツ分析における姿勢推定を処理できることを意味します。
Link to this section最先端技術:YOLO26 の登場#
YOLO11 と YOLOv9 も素晴らしいモデルですが、人工知能の分野は急速に進化しています。今日新しいプロジェクトを開始する開発者には、コンピュータビジョンの限界をさらに押し広げる YOLO26 (2026年1月リリース) を強く推奨します。
YOLO26 は、最近の革新的な成果を組み合わせて、本番環境対応の強力な基盤を構築しています。
- エンドツーエンドの NMS 不要設計: YOLO26 は非最大値抑制 (NMS) 後処理をネイティブに排除しており、デプロイパイプラインが大幅にシンプルかつ高速になります。
- DFL の除去: Distribution Focal Loss の削除により、低電力マイクロコントローラやエッジ AI アクセラレータとの互換性が向上します。
- MuSGD オプティマイザー: LLM トレーニングの革新に触発された MuSGD オプティマイザー (SGD と Muon のハイブリッド) は、安定したトレーニングとより速い収束を実現します。
- 最大 43% 高速な CPU 推論: 専用 GPU を持たないエッジコンピューティングデバイス向けに特別に最適化されています。
- ProgLoss + STAL: これらの改良された損失関数は、農業モニタリングや航空画像において不可欠となる、小さな物体の認識精度を劇的に向上させます。
多様なアーキテクチャの探求に関心があるユーザーは、Transformer ベースのトラッキング用の RT-DETR や、ゼロショットのオープン語彙検出用の YOLO-World も検討することをお勧めします。
Link to this section結論#
YOLO11 と YOLOv9 はどちらも、コンピュータビジョンの歴史にその名を刻みました。YOLOv9 は、最大限の特徴保持を実現するための優れたアーキテクチャの革新を提供します。しかし、エンタープライズ AI アプリケーションからモバイルエッジデバイスに至るまで、圧倒的多数の現実世界のデプロイメントにおいては、YOLO11 の使いやすさ、メモリ効率、汎用的なタスクサポートが比類のない優位性を提供します。業界が前進する中で、新しい YOLO26 を採用することは、お客様のシステムが現在利用可能な最も高速で最も信頼性の高い推論を実行することを保証します。