YOLOv7 対 YOLO11:包括的な技術比較

コンピュータービジョンの分野は、ここ数年で急速に進化しました。オブジェクト検出フレームワークを選択する開発者や研究者にとって、世代を決定づけるモデル間のアーキテクチャや実用的な違いを理解することは極めて重要です。本ガイドでは、学術的なブレークスルーである YOLOv7 と、高度に洗練された実用レベルの Ultralytics YOLO11 との技術的な詳細比較を提供します。

モデルの起源とアーキテクチャの哲学

Institute of Information Science at Academia Sinica の Chien-Yao Wang 氏、Alexey Bochkovskiy 氏、Hong-Yuan Mark Liao 氏によって 2022 年 7 月 6 日にリリースされた YOLOv7 は、この分野にいくつかの新しいコンセプトをもたらしました。arXiv で公開された YOLOv7 の研究論文 で詳述されているこのモデルは、「trainable bag-of-freebies(学習可能な無料の工夫)」アプローチと E-ELAN (Extended Efficient Layer Aggregation Networks) に重点を置いています。これらのアーキテクチャの選択は、勾配パスの効率を最大化するように特別に設計されており、ハイエンド GPU での学術的なベンチマーク評価のための強力なツールとなっています。

YOLOv7の詳細はこちら

Ultralytics の Glenn Jocher 氏と Jing Qiu 氏によって開発された YOLO11 は、2024 年 9 月 27 日にリリースされました。YOLO11 は、純粋なアーキテクチャの複雑さから、開発者第一の包括的なエコシステムへと焦点をシフトしました。Ultralytics GitHub リポジトリ でホストされている YOLO11 は、トレーニングと推論の両方においてメモリ消費量を劇的に削減する最適化されたアンカーフリー設計を特徴としています。これは Ultralytics Platform にネイティブ統合されており、データセットの注釈からエッジ展開まで比類のない使いやすさを提供します。

YOLO11の詳細はこちら

エコシステムの利点

スタンドアロンのレポジトリは学術論文の発表後に放置されることが多いのに対し、Ultralytics モデルは継続的な更新の恩恵を受けており、最新の PyTorch リリース や特殊なハードウェアアクセラレータなど、現代の機械学習スタックとの長期的な互換性が保証されています。

パフォーマンスメトリクスと効率性

モデルを実世界のアプリケーションに展開する際には、生の精度と、推論速度および計算オーバーヘッドとのバランスを取る必要があります。以下は、標準的な COCO データセット ベンチマークで評価された YOLOv7 および YOLO11 バリアントの直接比較です。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

注:YOLOv7 で CPU 速度が欠落している箇所は、ONNX CPU ベンチマークを標準化していないレガシーなテスト環境を示しています。比較可能なティアにおける最良の値は強調表示されています。

結果の分析

データは、効率性における明確な進化を示しています。YOLO11l (Large) モデルは、YOLOv7l の 51.4% と比較して 53.4% という優れた mAPval を達成しつつ、パラメータ数は大幅に少なく (25.3M 対 36.9M)、FLOPs も劇的に少なくなっています (86.9B 対 104.7B)。この計算量の削減により、YOLO11 は NVIDIA TensorRT 実装 上でより高速に動作し、必要な VRAM も少なくて済むため、ハードウェア制約のある環境にはるかに適しています。

ユーザビリティとトレーニングワークフロー

両フレームワークの大きな分岐点は、開発者体験にあります。

YOLOv7 のトレーニング

オリジナルの YOLOv7 オープンソースコードベース を使用する場合、多くの場合、レポジトリのクローン作成、依存関係の手動解決、冗長なコマンドライン引数への依存が必要となります。異なるタスクの管理やモバイルフォーマットへのエクスポートには、ソーススクリプトの変更やサードパーティ製のフォークへの依存が頻繁に発生します。

YOLO11の学習

YOLO11 は ultralytics Python パッケージに深く統合されており、機械学習のライフサイクルを簡素化します。オブジェクト検出モデル のトレーニングはわずか数行のコードで完了し、フレームワークがデータダウンロード、ハイパーパラメータチューニング、キャッシングをネイティブに処理します。

from ultralytics import YOLO

# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")

さらに、YOLO11 は極めて高い汎用性を誇ります。モデルのサフィックスを変更するだけで、開発者は検出から インスタンスセグメンテーションマッピング姿勢推定トラッキング、または Oriented Bounding Box (OBB) 認識 へと即座に移行できます。これは YOLOv7 には欠けているレベルのネイティブなマルチタスクサポートです。

簡素化されたエクスポート

Apple CoreMLIntel OpenVINO フレームワーク などのエッジフォーマットへの YOLO11 のエクスポートは、単一の .export() コマンドで行えるため、旧世代のモデルで必要とされるような複雑なグラフ修正を回避できます。

理想的なデプロイシナリオ

各モデルの強みを理解することで、最適なユースケースを判断できます。

今後の展望:YOLO26 のパラダイムシフト

YOLO11 は非常に洗練された最先端のソリューションですが、機械学習の分野は絶えず進化しています。今日新たにビジョンプロジェクトを開始するユーザーには、新しくリリースされた Ultralytics YOLO26 を試すことを強く推奨します。

2026 年 1 月にリリースされた YOLO26 は、YOLOv7 と YOLO11 の両方を凌駕するいくつかの画期的な機能を導入しています。

  • ネイティブな NMS フリーアーキテクチャ: YOLO26 は、Non-Maximum Suppression (NMS) の後処理を不要にします。このエンドツーエンド設計により、展開パイプラインが簡素化され、レイテンシの変動が劇的に減少します。
  • 最大 43% 高速な CPU 推論: Distribution Focal Loss (DFL) モジュールを戦略的に削除することで、YOLO26 は専用の GPU を持たないエッジデバイスや環境向けに大幅に最適化されています。
  • MuSGD オプティマイザの統合: Moonshot AI の高度な LLM トレーニング手法に触発されたこのハイブリッドオプティマイザは、これまでにないトレーニングの安定性と高速な収束率を保証します。
  • 優れた小物体検出: ProgLoss および STAL 損失関数の導入により、微細な詳細を識別するための重要な精度向上が実現しており、ドローン空撮画像 や複雑な IoT センサーデータの分析に最適です。

YOLO26の詳細はこちら

Transformer ベースのアーキテクチャやその他のパラダイムに関心のあるユーザーのために、Ultralytics のドキュメントでは RT-DETR Transformer 検出器YOLO-World オープンボキャブラリーモデル といったモデルもカバーしています。

コメント