YOLO11 YOLOv9:包括的な技術比較
コンピュータビジョンの分野は絶えず進化を続けており、新たなアーキテクチャがリアルタイム物体検出の可能性の限界を押し広げている。この進化の過程における二つの重要なマイルストーンは Ultralytics YOLO11 とYOLOv9。両モデルとも卓越した性能を発揮しますが、深層学習の推論と学習における核心的な課題へのアプローチが異なります。
本ガイドでは、YOLO11 YOLOv9包括的な技術比較を提供し、両モデルのアーキテクチャ、性能指標、および最適な導入シナリオを分析することで、次の人工知能プロジェクトに最適なモデル選択を支援します。
モデル概要
Ultralytics YOLO11
YOLO11 、生産環境向けに設計された高度に最適化された汎用モデルYOLO11 。最先端の精度と、エッジコンピューティングや大規模展開における実用的な要件とのバランスを実現しています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- ドキュメント:https://docs.ultralytics.com/models/yolo11/
YOLOv9
YOLOv9 深層ニューラルネットワークにおける情報損失を軽減する新たな概念を導入した強力な学術的貢献YOLOv9 、特徴抽出における理論的進展に重点を置いている。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024-02-21
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
- ドキュメント:https://docs.ultralytics.com/models/yolov9/
アーキテクチャの革新
YOLOv9: プログラマブル勾配情報
YOLOv9 、深層ネットワークの層を順に通過する過程でデータが失われる「情報ボトルネック」問題YOLOv9 。これを解決するため、著者らはプログラマブル勾配情報(PGI)と汎用効率的層集約ネットワーク(GELAN)を導入しました。PGIは、バックプロパゲーション中に重みを更新するために使用される勾配が完全な情報を含むことを保証し、高精度な特徴表現を実現します。 GELANアーキテクチャはパラメータ効率を最大化し、YOLOv9 比較的軽量な構造で高精度を達成YOLOv9 可能にします。
YOLO11: エコシステムと効率性
YOLOv9 勾配流れにYOLOv9 一方、YOLO11 実世界の頑健性と汎用性を追求してYOLO11 基本YOLO 改良し、トランスフォーマーを多用する代替手法と比較して、CUDA 大幅に削減する。YOLO11 単なる物体検出器YOLO11 、インスタンスセグメンテーション、画像分類、姿勢推定、方向付き境界ボックス(OBB)をネイティブにサポートする。
効率化された開発
YOLO11最大の強みのひとつは、Ultralytics 統合です。これにより、データロード、拡張、分散トレーニングといった複雑な処理が統一されたAPIに抽象化されます。
パフォーマンス比較
モデルを生産用に選択する際には、平均精度(mAP)、推論速度、パラメータ数のトレードオフを評価することが極めて重要である。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
表に示す通り、YOLOv9eは最高の総合精度を達成しており、学術的なベンチマークに最適である。しかし、YOLO11 全体的に優れた速度対精度比YOLO11 。例えば、YOLO11mは4.7ミリ秒(TensorRT)mAP 51.5mAP を達成し、同規模のYOLOv9mを速度面で上回っている。
トレーニング方法論とエコシステム
両フレームワーク間では開発者体験が大きく異なる。
YOLOv9トレーニング
YOLOv9 トレーニングでは、高度にカスタマイズされた研究用コードとの連携、特定の依存関係バージョンの管理、複雑なコマンドライン引数の利用がYOLOv9 必要となります。その能力は強力ですが、ペースの速い企業環境では敷居が高いと感じられる場合があります。
トレーニングYOLO11
YOLO11 、よくUltralytics Python YOLO11 、シームレスな「ゼロからヒーローへ」の体験を提供します。効率的なトレーニングプロセスは、すぐに利用できる事前学習済み重みと優れたコミュニティサポートによって支えられています。
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")
わずか3行のPythonで、開発者はモデルを読み込み、最適化されたハイパーパラメータのデフォルト値でトレーニングを開始し、トレーニング済みのアーキテクチャをONNXなどのフレームワークにエクスポートできます。 ONNX や TensorRT などのフレームワークにエクスポートできます。
現実世界のアプリケーション
YOLOv9を選択すべき時
YOLOv9 深層学習アーキテクチャを探求したい研究者にとって素晴らしい選択肢YOLOv9 。そのPGIフレームワークにより、高密度データセットでの極度の精度が要求され、アルゴリズム性能がデプロイメントの複雑さよりも優先される高速小売分析に理想的な候補となります。
YOLO11を選択すべき時
YOLO11 生産現場向けの究極のツールYOLO11 。その効率化された物体検出機能は、スマートシティの交通管理やラズベリーパイやNVIDIA のようなエッジデバイスに最適です。さらに、多様なタスクに対応する汎用性により、単一の開発パイプラインで製造業におけるセグメンテーションから スポーツ分析における姿勢推定までを処理できます。
最先端技術:YOLO26の登場
YOLO11 YOLOv9 確かに注目YOLOv9 、人工知能の分野は急速に進化しています。現在新規プロジェクトを開始する開発者には、Ultralytics コンピュータービジョンの限界をさらに押し広げるYOLO26(2026年1月リリース)を Ultralytics 推奨します。
YOLO26は、近年の革新技術の最高峰を統合し、実用段階の強力なシステムを実現します:
- エンドツーエンドNMS設計:YOLO26は非最大抑制(NMS)後処理をネイティブに排除し、大幅に簡素化され高速化されたデプロイメントパイプラインを実現します。
- DFL除去:ディストリビューション・フォーカル・ロス(DFL)を除去することで、低消費電力マイクロコントローラやエッジAIアクセラレータとの互換性が向上します。
- MuSGDオプティマイザ:LLMトレーニングの革新に着想を得たMuSGDオプティマイザ(SGD ミューオンのハイブリッド)は、安定したトレーニングとより速い収束を実現します。
- 最大43%高速CPU :専用GPUを持たないエッジコンピューティングデバイス向けに特別に最適化されています。
- ProgLoss + STAL:これらの改良された損失関数は、農業監視や航空写真において極めて重要な小規模物体認識を劇的に向上させる。
多様なアーキテクチャを探求したいユーザーは、以下の情報も参照するとよいでしょう RT-DETR (トランスフォーマーベースの追跡)やYOLO(ゼロショット・オープンボキャブラリ検出)も検討するとよいでしょう。
結論
YOLO11 YOLOv9 YOLO11 、いずれもコンピュータビジョンの歴史に確固たる地位をYOLOv9 。YOLOv9 特徴量の最大保持を実現する画期的なアーキテクチャYOLOv9 。しかし、企業向けAIアプリケーションからモバイルエッジデバイスに至るまで、現実世界の導入事例の大多数においては、YOLO11 の使いやすさ、メモリ効率、多様なタスク対応力が圧倒的な優位性をYOLO11 。業界が進化する中、最新のYOLO26を採用することで、システムが現在利用可能な最速かつ最も信頼性の高い推論を実行することを保証できる。