コンテンツにスキップ

YOLO11 YOLOv7:アーキテクチャと性能の技術的比較

コンピュータビジョン分野が加速する中、適切な物体検出アーキテクチャの選択が成功の鍵となる。YOLO の主要な2つの候補は YOLO11(Ultralyticstralytics社開発)と YOLOv7です。両モデルとも最先端技術に大きく貢献していますが、速度、柔軟性、導入の容易さといった点で異なるニーズに対応しています。

このガイドでは、開発者や研究者がプロジェクトに最適なツールを選択できるよう、各アーキテクチャの詳細な技術分析、パフォーマンス指標、および理想的なユースケースを提供します。

モデルの概要と起源

これらのモデルの系譜を理解することは、そのアーキテクチャ上の決定事項に対する文脈を提供する。

YOLO11

2024年9月にリリース UltralyticsYOLO11 、同社の実運用重視の哲学をさらに洗練YOLO11 。現代のハードウェア上で効率を最大化し、高い処理速度と競争力のある精度を両立させるよう設計されています。

  • 著者: Glenn Jocher、Jing Qiu
  • 組織:Ultralytics
  • 日付:2024年9月
  • 主な焦点:リアルタイムでの使いやすさ、幅広いタスク対応(検出、セグメンテーション、姿勢推定、OBB、分類)、およびUltralytics による効率的なデプロイメント。

YOLO11の詳細について。

YOLOv7

2022年7月に発表されたYOLOv7 、YOLOv4の開発チームが導入した学術的な重要なYOLOv7 。推論コストを増加させることなく精度を向上させるため、複数の「フリービーの袋」を導入し、特に学習可能なアーキテクチャの最適化に重点を置いた。

  • 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
  • 組織: 中央研究院 情報科学研究所
  • 日付:2022年7月
  • 主要な焦点:勾配経路解析、モデルの再パラメータ化、動的ラベル割り当て。

YOLOv7について詳しくはこちら

パフォーマンス分析

これらのアーキテクチャを比較する際、平均精度(mAP)や推論遅延といった指標が極めて重要である。下表は、YOLO11 における新たな技術が、旧YOLOv7 に対して効率性の向上YOLO11 示している。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

主なポイント

  • 効率性: YOLO11mモデルは、標準的なYOLOv7 51.4%)よりもわずかに高い精度(51.5%mAP)を達成しつつ、パラメータ数を約45%削減(20.1M vs 36.9M)し、FLOPsも大幅に削減しています。
  • 速度:T4 GPU上では、YOLO11 YOLOv7 推論遅延において一貫して上回っており、これは自動運転や映像解析といったリアルタイムアプリケーションにとって重要な要素である。
  • スケーラビリティ: YOLO11 より幅広いモデル規模(NanoからX-Largeまで)YOLO11 、Raspberry Piやモバイルデバイスなどのリソース制約のあるハードウェアへの展開を容易にします。

アーキテクチャの違い

Ultralytics YOLO11

YOLO11 CSPNet(クロスステージ部分ネットワーク)の基盤概念をYOLO11 、勾配の流れと特徴抽出を改善するためブロック設計を洗練させている。

  • 洗練されたバックボーン:改良されたC3k2ブロック(CSPボトルネックの高速実装)を採用し、計算量を削減しながら特徴の再利用性を向上させる。
  • アンカーフリー検出:直近の前身と同様に、YOLO11 アンカーフリーヘッド YOLO11 、手動によるアンカーボックスのクラスタリングを不要とすることで学習プロセスを簡素化している。
  • マルチタスクヘッド:本アーキテクチャは、統一されたヘッド構造を用いて複数のタスクをネイティブにサポートするよう設計されており、物体検出インスタンスセグメンテーション姿勢推定間のシームレスな切り替えを可能にします。

YOLOv7

YOLOv7 、最短および最長の勾配経路を効果的に制御するために「拡張ELAN」(E-ELAN)YOLOv7 。

  • E-ELAN:勾配経路を破壊することなく、ネットワークがより多様な特徴を学習できるように設計された計算ブロック。
  • モデル再パラメータ化:推論時に分離された畳み込み層を単一層に統合する再パラメータ化技術(RepConv)を採用し、学習精度を損なうことなく速度を向上させる。
  • 補助ヘッド(粗から細へ):トレーニング監視用の補助ヘッドを導入します。これはモデルの深層監視に役立ちますが、トレーニングパイプラインの複雑さを増します。

YOLO26への進化

YOLO11 大幅な改善YOLO11 一方、最新の YOLO26 はさらに限界を押し広げている。2026年1月にリリースされたYOLO26は、 NMSを採用し、後処理の必要性を排除するとともに CPU 最大43%高速化しているまた、LLMトレーニングに着想を得たMuSGDオプティマイザーを採用し、収束速度を向上させている。

トレーニングと使いやすさ

開発者にとって、モデルの「ユーザーエクスペリエンス」——つまり、トレーニング、検証、デプロイの容易さ——は、多くの場合、純粋な指標と同じくらい重要である。

Ultralyticsエコシステムの利点

Python 完全にYOLO11 、「ゼロからヒーローへ」のワークフローを提供します。

  1. 統一API: YOLO11の間で切り替え可能です。 YOLOv8、またはYOLO26の間で、単一の文字列を変更するだけで切り替えられます。
  2. メモリ効率: Ultralytics 、多くの研究リポジトリと比較して、トレーニング中のCUDA 削減するよう最適化されています。これにより、コンシューマー向けGPUでより大きなバッチサイズが可能となります。
  3. ワンクリックエクスポート:ONNXTensorRT、CoreML、TFLite などの形式へのエクスポートは、単一のコマンドモードで処理TFLite 。
from ultralytics import YOLO

# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
path = model.export(format="onnx")

YOLOv7

YOLOv7 、スタンドアロンリポジトリに依存します。強力ではありますが、多くの場合以下が必要となります:

  • 手動設定 .yaml アンカー用ファイル(アンカーフリー版を使用しない場合)。
  • エクスポート前に再パラメータ化された重みをマージするための特定の「デプロイ」スクリプト。
  • トレーニング中の補助ヘッド管理のためのより複雑なコマンドライン引数。

現実世界のアプリケーション

YOLO11を選択すべき時

YOLO11 、信頼性とメンテナンス性が重要な商業および産業用途において最適な選択肢YOLO11 。

  • エッジAI:「Nano」および「Small」モデルの可用性により、YOLO11 製造ラインを監視するスマートカメラやIoTデバイスにYOLO11 です。
  • マルチタスクプロジェクト:アプリケーションがオブジェクト追跡とキーポイント推定を同時に行う必要がある場合(例:スポーツ分析)、YOLO11統一フレームワークによりコードベースが簡素化されます。
  • ラピッドプロトタイピング:使いやすさにより、チームはUltralytics を活用してカスタムデータセット上で迅速に反復作業を行い、市場投入までの時間を短縮できます。

YOLOv7を選択すべき時

  • 学術的ベンチマーキング:2022-2023年の文献結果を再現する場合、またはE-ELANアーキテクチャの特定の効果を研究する場合。
  • レガシーシステム:既存のダークYOLO 特定の入力/出力構造と既に深く統合されているシステム向け。

結論

一方 YOLOv7 が物体検出の歴史において尊敬されるマイルストーンであり続ける一方で、 YOLO11 はより現代的で効率的、かつ開発者向けのソリューションを提供します。優れた速度と精度のバランス、低いメモリ要件、そして堅牢なUltralytics 支援により、YOLO11 実世界での展開に向けたより明確な道筋YOLO11

最先端を求める方には、ぜひ YOLO26を推奨します。これはNMSと次世代オプティマイザにより、これらの基盤をさらに発展させたものです。

その他のリソース


コメント