コンテンツにスキップ

YOLOv7 YOLO11:リアルタイム検出器の技術的比較

物体検出アーキテクチャの進化は、速度、精度、導入の容易さにおける急速な進歩によって特徴づけられてきた。本ガイドでは、 YOLOv7(2022年の最先端モデル)と YOLO11Ultralytics の詳細な技術比較を行います。両モデルのアーキテクチャ上の差異、性能指標、現代のコンピュータビジョンアプリケーションへの適応性を分析します。

概要

YOLOv7 E-ELANのような重要なアーキテクチャ改良YOLOv7 一方で、 YOLO11 は、使いやすさ、エコシステムサポート、効率性において世代を超えた飛躍を遂げています。YOLO11 、最新のハードウェア上で優れた性能YOLO11 、トレーニングワークフローを大幅に簡素化し、単純な検出を超えた幅広いタスクに対するネイティブサポートを提供します。

機能YOLOv7YOLO11
アーキテクチャE-ELAN、連結ベースC3k2、SPPF、GPU最適化
タスク検出、姿勢推定、セグメンテーション(限定)detect、segment、classify、姿勢推定、obb、track
使いやすさ高複雑性(複数スクリプト)合理化された(統一Python )
エコシステム分散(研究の焦点)統合(Ultralytics )
デプロイ手動のエクスポートスクリプトが必要です1行で10以上の形式へエクスポート

詳細な分析

YOLOv7: 「フリービーの袋」アーキテクチャ

2022年7月にリリースYOLOv7 、推論コストを増加させることなく学習プロセスを最適化することで、リアルタイム物体検出の限界を押し広げることをYOLOv7 。この概念は「bag-of-freebies」として知られる。

主な技術的特徴:

  • E-ELAN(拡張効率的層別集合ネットワーク):このアーキテクチャは、最短および最長の勾配経路を制御することでネットワークがより多様な特徴量を学習できるようにし、収束性を向上させる。
  • モデルスケーリング: YOLOv7 、異なるリソース制約に対応するため、深度と幅を同時に変更する複合スケーリング手法YOLOv7 。
  • 補助ヘッド:これは「粗から細へ」のリードガイド式ラベルアサイン機能を利用しており、補助ヘッドが深層での学習プロセスを監督する役割を担う。

YOLOv7の詳細:

YOLOv7について詳しくはこちら

YOLO11:洗練された効率性と汎用性

YOLO11 、生性能と並行して開発者体験を優先Ultralytics をYOLO11 。高い精度を維持しながら計算オーバーヘッドを削減するアーキテクチャ改良を導入し、エッジデバイスとクラウドGPUの両方で非常に高速な処理を実現します。

主な技術的特徴:

  • C3k2ブロック:従来バージョンで使用されていたCSP(クロスステージ部分)ボトルネックの進化形であり、より少ないパラメータで優れた特徴抽出を実現します。
  • 強化版SPPF:空間ピラミッドプーリング - 高速層は、マルチスケールの文脈をより効率的に捕捉するよう最適化されています。
  • タスクの汎用性: YOLOv7主に検出モデルであり姿勢推定機能を一部備えるのとは異なり、YOLO11 インスタンスセグメンテーション姿勢推定オリエンテッドバウンディングボックス(OBB)、分類をネイティブに処理できるよう一からYOLO11 。
  • 最適化されたトレーニング: YOLO11 高度なデータ拡張戦略と改良された損失関数をYOLO11 、トレーニングを安定化させるため、ユーザーによるハイパーパラメータ調整の必要性を低減します。

YOLO11 :

YOLO11の詳細について。

パフォーマンス比較

これらのモデルを比較する際には、速度(レイテンシ)と精度(mAP)のトレードオフを検証することが極めて重要です。YOLO11 優れたバランスを提供し、高い精度を維持しつつ、NVIDIA T4などの最新GPU上で計算要件(FLOPs)を大幅に低減し、より高速な推論速度を実現します。

効率が重要

YOLO11 、より少ないパラメータで従来モデルと同等以上の精度YOLO11 。この「パラメータ効率」は、トレーニング時のメモリ使用量の削減と、NVIDIA Orin Nanoなどのエッジデバイス上での高速実行に直結します。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

表に示す通り、GPU 同等レベルに保ちつつ、YOLOv7(54.7% 対 53.1%)。さらに重要なのは、YOLO11 バリエーションYOLO11 n/s/m)が、ビデオ解析などリアルタイム処理が重要なアプリケーションにおいて、驚異的な速度優位性を提供することです。

エコシステムと使いやすさ

開発者にとって最も重要な差別化要因は、モデルを取り巻くエコシステムである。この点において、Ultralytics 卓越している。

Ultralyticsの利点

YOLO11 ultralytics Python 。機械学習のライフサイクル全体に対して統一されたインターフェースを提供します。

  • シンプルなAPI:わずか数行のPython でモデルの読み込み、学習、検証が可能です。
  • 健全なエコシステム: Ultralytics は、活発なサポート、頻繁なアップデート、データ管理Ultralytics などのツールとのシームレスな統合を提供します。
  • デプロイの柔軟性: ONNX、TensorRT、CoreML、TFLite エクスポートするには、単一のコマンドTFLite 。一方、YOLOv7 、異なるエクスポート形式に対応するために、複雑なサードパーティリポジトリや手動でのスクリプト調整が必要になるYOLOv7 。

コード比較:

トレーニングYOLO11:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

YOLOv7トレーニング: 通常、リポジトリのクローン作成、特定の依存関係のインストール、そして長いコマンドライン引数の実行が必要です:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

実際のユースケース

YOLOv7を選択すべき時

  • レガシーベンチマーク:学術研究を実施しており、新しいアーキテクチャを2022年の最先端基準と比較する必要がある場合。
  • 特定のカスタム実装:既存のパイプラインがYOLOv7 tensor に強く依存してカスタマイズされており、リファクタリングが困難な場合。

YOLO11を選択すべき時

  • 生産環境への導入:信頼性と保守性の容易さが最優先される小売、セキュリティ、製造分野の商用アプリケーション向け。
  • エッジコンピューティング:YOLO11nとYOLO11sの効率性は、ラズベリーパイや処理能力が限られたモバイルデバイスでの実行に最適です。
  • マルチタスクアプリケーション:プロジェクトで物体の検出、セグメンテーション、姿勢推定を同時に行う必要がある場合、YOLO11 これをネイティブにYOLO11 。

最先端技術:YOLO26

YOLO11 ほとんどの用途において優れた選択肢YOLO11 、Ultralytics 革新Ultralytics 。最近リリースされたYOLO26(2026年1月)は、その限界をさらに押し広げています。

  • エンドツーエンドNMS:YOLO26は非最大抑制(NMS)を排除し、よりシンプルなデプロイメントパイプラインと低遅延を実現します。
  • エッジ最適化:ディストリビューション焦点損失(DFL)を除去することで、YOLO26 CPU 最大43%高速化し、エッジAIにおける優れた選択肢となる。
  • MuSGDオプティマイザ: LLMトレーニングから着想を得たこのハイブリッドオプティマイザは、安定した収束を保証します。

今日、新たな高性能プロジェクトを始める開発者には、YOLO26の検討を強く推奨します。

YOLO26についてさらに詳しく

結論

YOLO11 YOLOv7 コンピュータビジョン史における画期的なYOLO11 。YOLOv7 分野を進展させた強力なアーキテクチャ概念YOLOv7 。しかし、 YOLO11 はこれらのアイデアをより実用的で高速、かつユーザーフレンドリーなパッケージへと洗練させました。

研究者から企業エンジニアに至るまで、大多数のユーザーにとって、YOLO11 またはより新しいYOLO26)は、堅牢なUltralytics に支えられた精度、速度、開発者体験の最適な組み合わせを提供します。

その他の検討すべきモデル

  • YOLO26: 究極の速度と精度を実現するNMSモデル。
  • YOLOv10: リアルタイム検出におけるNMSトレーニングの先駆者。
  • RT-DETR: 高精度シナリオ向けトランスフォーマーベース検出器。
  • SAM : ゼロショットセグメンテーションのためのMetaのセグメント・エニシング・モデル

コメント