コンテンツにスキップ

YOLOv7 YOLO11:包括的な技術比較

コンピュータビジョンの分野は過去数年間で急速に進化を遂げてきた。開発者や研究者が適切な物体検出フレームワークを選択するには、世代を定義するモデル間のアーキテクチャ的・実用的な差異を理解することが極めて重要である。本ガイドでは、学術的ブレークスルーである YOLOv7 と、高度に洗練され実運用可能な Ultralytics YOLO11を詳細に技術比較します。

モデルの起源と建築哲学

YOLOv7は、中央研究院情報科学研究所のChien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liaoの各氏によって2022年7月6日にリリースされ、この分野にいくつかの斬新な概念を導入しました。arXivで公開されたYOLOv7研究論文で詳細に説明されているように、このモデルは「trainable bag-of-freebies」アプローチとExtended Efficient Layer Aggregation Networks (E-ELAN)に重点を置いています。これらのアーキテクチャの選択は、勾配経路の効率を最大化するように特別に設計されており、ハイエンドGPUでの学術的なベンチマークのための強力なツールとなっています。

YOLOv7について詳しくはこちら

YOLO11は、UltralyticsのGlenn JocherとJing Qiuによって開発され、2024年9月27日にリリースされました。YOLO11は、純粋なアーキテクチャの複雑さから、全体的で開発者第一のエコシステムへと焦点を移しています。Ultralytics GitHubリポジトリでホストされているYOLO11は、トレーニングと推論の両方でメモリ消費を劇的に削減する最適化されたアンカーフリー設計を特徴としています。データセットのアノテーションからエッジ展開まで、比類のない使いやすさを提供するUltralytics Platformにネイティブに統合されています。

YOLO11の詳細について。

エコシステムの利点

学術論文の発表後、単独のリポジトリはしばしば休止状態になるが、Ultralytics 継続的な更新の恩恵を受け、PyTorch や専用ハードウェアアクセラレータといった現代的な機械学習スタックとの長期的な互換性を保証している。

パフォーマンスメトリクスと効率

実世界のアプリケーションにモデルをデプロイする際には、生の精度と推論速度および計算オーバーヘッドのバランスを考慮する必要があります。以下は、標準的なCOCO ベンチマークで評価したYOLOv7 YOLO11 の直接比較です。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

注記:YOLOv7 CPU 欠落しているのは、ONNX CPU 標準化していなかった旧式のテスト環境YOLOv7 。同等クラスにおける最良の値は強調表示されています。

結果の分析

データは効率性の明らかな進化を示している。YOLO11l(Large)モデルは、YOLOv7lの51.4%に対し53.4%という優れたmAPvalを達成しつつ、パラメータ数を大幅に削減(2530万 vs 3690万)し、FLOPsを劇的に低減(869億 vs 1047億)している。 この計算複雑度の低減により、YOLO11 NVIDIA TensorRT 高速にYOLO11 、必要なVRAMも少なくて済むため、ハードウェア制約のある環境においてはるかに適した選択肢となります。

ユーザビリティとトレーニングワークフロー

両フレームワークの主な相違点は、開発者エクスペリエンスです。

YOLOv7トレーニング

YOLOv7 を使用するには、リポジトリのクローン作成、依存関係の手動解決、冗長なコマンドライン引数の使用が必要となる場合が多い。異なるタスクの管理やモバイルフォーマットへのエクスポートには、ソーススクリプトの修正やサードパーティのフォークへの依存が頻繁に発生する。

トレーニングYOLO11

YOLO11 深くYOLO11 ultralytics Python 、機械学習ライフサイクルを簡素化。トレーニングを 物体検出モデル わずか数行のコードで実現でき、フレームワークがデータダウンロード、ハイパーパラメータ調整、キャッシュ処理をネイティブに処理します。

from ultralytics import YOLO

# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")

さらに、YOLO11 極めて高い汎用性をYOLO11 。モデル接尾辞を変更するだけで、開発者は検出からインスタンスセグメンテーションマッピング姿勢推定トラッキング、あるいはオリエンテッドバウンディングボックス(OBB)認識へと瞬時に移行できる。YOLOv7 レベルのネイティブなマルチタスク対応である。

簡易輸出

YOLO11を次のようなエッジ形式にエクスポートする Apple CoreML または Intel OpenVINO たった一つだけ必要とする .export() コマンドで、旧世代モデルでしばしば必要とされた複雑なグラフ操作を回避します。

理想的な導入シナリオ

各モデルの強みを理解することは、それらの最適な使用事例を決定するのに役立ちます。

展望:YOLO26のパラダイムシフト

YOLO11 高度に洗練された最先端ソリューションYOLO11 一方、機械学習分野は絶え間なく進歩を続けています。新規のビジョンプロジェクトを今日開始するユーザーには、新たにリリースUltralytics 検討を強く推奨します。

2026年1月にリリースされたYOLO26は、YOLOv7 YOLO11 YOLOv7 機能を複数導入しています:

  • ネイティブNMSフリーアーキテクチャ: YOLO26は、Non-Maximum Suppressionの事後処理の必要性を排除します。このエンドツーエンド設計は、デプロイメントパイプラインを簡素化し、レイテンシの変動を劇的に低減します。
  • CPU推論が最大43%高速化: Distribution Focal Loss (DFL)モジュールを戦略的に削除することで、YOLO26はエッジデバイスや専用GPUを持たない環境向けに大幅に最適化されています。
  • MuSGDオプティマイザの統合: Moonshot AIの高度なLLMトレーニング技術に触発されたこのハイブリッドオプティマイザは、前例のないトレーニングの安定性とより速い収束率を保証します。
  • 優れた小オブジェクトdetect: ProgLossおよびSTAL損失関数の導入により、微細な詳細を識別するための重要な精度向上をもたらし、ドローン航空画像や複雑なIoTセンサーデータの分析に最適です。

YOLO26についてさらに詳しく

トランスフォーマーベースのアーキテクチャや代替パラダイムに興味があるユーザー向けに、Ultralyticsのドキュメントでは、RT-DETRトランスフォーマーdetect器YOLO-Worldオープンボキャブラリーモデルなどのモデルも扱っています。


コメント