YOLOv7 YOLOv8:リアルタイム検出器の技術的比較
コンピュータビジョンの急速な進化は、開発者や研究者向けに数多くの強力なツールを生み出しました。物体検出パイプラインに適したアーキテクチャを決定する際には、確立されたモデルを比較することが不可欠です。この技術ガイドでは、非常に影響力のある2つのモデル、YOLOv7 Ultralytics YOLOv8のアーキテクチャ、性能指標、および理想的なユースケースについて深く掘り下げます。
アーキテクチャ入門
両モデルはパフォーマンスにおいて大きな飛躍を意味しますが、それらはディープニューラルネットワークの最適化という課題に異なる構造哲学からアプローチしています。
YOLOv7:フリービーの袋の先駆者
2022年半ばに発表されたYOLOv7 、アーキテクチャの勾配経路最適化と「学習可能なフリービーの袋」という概念にYOLOv7 、高性能ハードウェア上でのリアルタイム検出の限界を押し広げた。
- 著者:王建耀、アレクセイ・ボチコフスキー、廖宏源マーク
- 組織名:台湾中央研究院情報科学研究所
- 日付: 2022年7月6日
- Arxiv:2207.02696
- GitHub:WongKinYiu/yolov7
- ドキュメント: Ultralytics YOLOv7 ドキュメント
アーキテクチャのハイライト: YOLOv7は主にアンカーベースの検出ヘッドを利用し(アンカーフリーブランチも実験されましたが)、拡張効率層集約ネットワーク(E-ELAN)を導入しています。この設計は、元の勾配パスを破壊することなく、ネットワークの学習能力を向上させます。サーバーグレードのGPUで非常に優れたパフォーマンスを発揮し、高負荷のビデオ分析に非常に適しています。
長所と短所: YOLOv7は専用ハードウェアで優れたレイテンシを達成しますが、そのエコシステムは非常に断片化されています。訓練には複雑なコマンドライン引数、手動でのリポジトリクローン、およびPyTorchにおける厳格な依存関係管理が必要です。さらに、訓練中のメモリ要件は、コンシューマーハードウェアでは法外なものとなる可能性があります。
Ultralytics YOLOv8: 多彩な標準
2023年初頭にリリースYOLOv8 、最先端の精度だけでなく、統一された実運用可能なフレームワークの提供に焦点を当て、開発者体験をYOLOv8 再定義しました。
- 著者:グレン・ジョッカー、アユシュ・チャウラシア、およびチン・チウ
- 組織: Ultralytics
- 日付: 2023年1月10日
- GitHub:ultralytics
- プラットフォーム: Ultralytics YOLOv8
アーキテクチャのハイライト: YOLOv8は、ネイティブなアンカーフリー検出ヘッドを導入し、MS COCOデータセットやカスタムデータ分布に基づいてアンカーボックスを手動で設定する必要をなくしました。C2fモジュールを組み込んで勾配フローを改善し、オブジェクトネス、分類、回帰タスクを分離するデカップリングされたヘッド構造を使用しています。これにより、収束が大幅に加速され、精度が向上します。
長所と短所: YOLOv8は、優れたメモリ要件効率を誇ります。YOLOv7やより重いTransformerモデルと比較して、訓練中に必要なCUDAメモリが大幅に少なく、開発者はより大きなバッチサイズを使用できます。その主な強みは、汎用性にあり、インスタンスsegment、画像分類、姿勢推定、およびOriented Bounding Boxes (obb)をネイティブにサポートしています。唯一の小さな欠点は、YOLOv7 tensor専用に構築された非常に特殊なレガシーパイプラインが、短いリファクタリング期間を必要とする可能性があることです。
エコシステムの利点
Ultralytics YOLOv8 、整備されたエコシステムをYOLOv8 。直感Python 、活発な開発、そして強力なコミュニティサポートにより、モデルをローカルテストからグローバル展開へ移行する時間は、単独のリポジトリと比較して大幅に短縮されます。
詳細な性能比較
以下の表は主要なモデルサイズごとの性能指標を比較したものです。YOLOv8 明確な性能バランスに注目してください。エッジデバイスでの高速推論を大幅に最適化しながら、世界トップクラスの精度を維持しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
注:mAP YOLOv8x 一方、YOLOv8n パラメータ効率と推論速度でYOLOv8n 、エッジAIデバイスへのコンピュータビジョン展開において圧倒的な優位性を確立している。
使いやすさとトレーニング効率
使いやすさという点では、Ultralytics YOLOv8 別格YOLOv8 。YOLOv7 のような古いアーキテクチャでは、特定のレポジトリをクローンし、データセットやパスを設定するために冗長なコマンドラインスクリプトを実行YOLOv7 。
一方、YOLOv8の ultralytics このパッケージは、非常に効率化された開発者体験を提供します。 トレーニング効率 自動データダウンロード、すぐに使える事前学習済み重み、シームレスな連携を通じて最大化される エクスポート機能 次のような形式に ONNX および TensorRT.
Ultralytics Python を使用すると、データの読み込み、トレーニング、推論の実行が驚くほど簡単に行えます。
from ultralytics import YOLO
# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()
実験追跡
YOLOv8 、以下のような一般的なMLOpsツールとネイティブにYOLOv8 Weights & Biases や ClearMLなどの主要なMLopsツールとネイティブに連携し、ハイパーパラメータ調整やトレーニング指標をリアルタイムで監視できます。
理想的なユースケース
これらのアーキテクチャの選択は、多くの場合、デプロイ環境の特定の制約が決め手となります。
YOLOv7を選択すべき時
- レガシーベンチマーク: 2022年のアーキテクチャ標準と比較するための固定されたベースラインを必要とする研究者に適しています。
- 既存の重厚なインフラ: NVIDIA V100またはA100 GPUに多額の投資が行われている環境で、YOLOv7の特定のtensor構成がレガシーなC++パイプラインに深く組み込まれている場合。
YOLOv8を選択すべき時
- クロスプラットフォームでの本番運用: クラウドGPU、モバイルデバイス、ブラウザ間でシームレスにデプロイする必要があるチームに最適です。
- マルチタスク要件: プロジェクトがバウンディングボックスを超えて、豊富なインスタンスsegmentマスクや姿勢キーポイントを活用する必要がある場合。
- リソース制約のあるエッジ: YOLOv8 (
yolov8n)は、ロボット工学、ドローン、IoTセンサー向けに驚異的な精度と速度の比率を提供します。
展望:YOLO26への世代を超えた飛躍
YOLOv8 非常に堅牢な選択肢ですが、コンピュータビジョン分野は急速に進化しています。全く新規の高性能プロジェクトを開始する開発者向けに、Ultralytics AIモデルの次世代進化形を導入しました。高度に洗練された YOLO11 と新たにリリースされたYOLO26の両方を検討することを強く推奨します。
2026年1月にリリースされたYOLO26は、エッジデバイスで実現可能な限界を押し広げます:
- エンドツーエンドのNMSフリー設計: YOLO26はネイティブにエンドツーエンドであり、Non-Maximum Suppression (NMS) の後処理を完全に排除します。これにより、従来の密予測モデルにおけるレイテンシのボトルネックなしに、大幅に高速でシンプルなデプロイメントパイプラインが保証されます。
- DFLの削除: Distribution Focal Lossを削除することで、YOLO26はよりシンプルなモデルデプロイオプションと優れたエッジ互換性を実現します。
- CPU推論が最大43%高速化: Raspberry Piや組み込みシステムのような制約のある環境向けに大幅に最適化されており、CPUスループットにおいてこれまでの全世代を凌駕します。
- MuSGDオプティマイザ: 大規模言語モデル (LLM) の学習パラダイムに触発され、YOLO26はSGDとMuonのハイブリッドを組み込んでいます。これにより、前例のない学習安定性と超高速の収束が実現されます。
- ProgLoss + STAL: これらの高度な損失関数は、小さなオブジェクトの認識において著しい改善をもたらし、航空画像、自動農業、およびロボット工学にとって非常に重要です。
YOLOv8 を用いた大規模な動画解析クラスターの拡張からYOLOv8 最先端のYOLO26による小型エッジデバイスへの推論処理のYOLOv8 Ultralytics はAIライフサイクル全体をシームレスに管理するツールを提供します。