YOLOv7 YOLOv8:リアルタイム検出器の技術的比較
コンピュータビジョンの急速な進化は、開発者や研究者向けに数多くの強力なツールを生み出しました。物体検出パイプラインに適したアーキテクチャを決定する際には、確立されたモデルを比較することが不可欠です。この技術ガイドでは、非常に影響力のある2つのモデル、YOLOv7 Ultralytics YOLOv8のアーキテクチャ、性能指標、および理想的なユースケースについて深く掘り下げます。
アーキテクチャ入門
両モデルとも性能面で大きな飛躍を遂げているが、深層ニューラルネットワークの最適化という課題へのアプローチは、異なる構造的哲学に基づいている。
YOLOv7:フリービーの袋の先駆者
2022年半ばに発表されたYOLOv7 、アーキテクチャの勾配経路最適化と「学習可能なフリービーの袋」という概念にYOLOv7 、高性能ハードウェア上でのリアルタイム検出の限界を押し広げた。
- 著者:王建耀、アレクセイ・ボチコフスキー、廖宏源マーク
- 組織名:台湾中央研究院情報科学研究所
- 日付: 2022年7月6日
- Arxiv:2207.02696
- GitHub:WongKinYiu/yolov7
- ドキュメント:Ultralytics YOLOv7
アーキテクチャの主な特徴: YOLOv7 アンカーベースの検出ヘッドを採用(アンカーフリーの分岐も実験的に導入)し、拡張効率的層集約ネットワーク(E-ELAN)を導入しています。この設計により、元の勾配経路を損なうことなくネットワークの学習能力が向上します。サーバーグレードのGPU上で非常に優れた性能を発揮するため、高負荷な動画解析に極めて適しています。
長所と短所: YOLOv7 専用ハードウェア上で優れたレイテンシYOLOv7 一方、そのエコシステムは高度に分断されている。トレーニングには複雑なコマンドライン引数、手動でのリポジトリクローン、および PyTorchでの厳密な依存関係管理を必要とする。さらに、トレーニング時のメモリ要件は一般向けハードウェアでは現実的でない場合がある。
Ultralytics YOLOv8: 多彩な標準
2023年初頭にリリースYOLOv8 、最先端の精度だけでなく、統一された実運用可能なフレームワークの提供に焦点を当て、開発者体験をYOLOv8 再定義しました。
- 著者:グレン・ジョッカー、アユシュ・チャウラシア、およびチン・チウ
- 組織: Ultralytics
- 日付: 2023年1月10日
- GitHub:ultralytics
- プラットフォーム: Ultralytics YOLOv8
アーキテクチャの主な特徴: YOLOv8 MSCOCO カスタムデータ分布に基づくアンカーボックスの手動設定を不要とする、ネイティブのアンカーフリー検出ヘッドYOLOv8 。勾配の流れを改善するC2fモジュールを組み込み、物体検出・分類・回帰タスクを分離するデカップリングヘッド構造を採用しています。これにより収束が大幅に加速され、精度が向上します。
長所と短所: YOLOv8 卓越したメモリ要件効率YOLOv8 。YOLOv7 重いトランスフォーマーYOLOv7 、CUDA 大幅に少なく、開発者はより大きなバッチサイズを使用できます。その主な強みは汎用性にあり、インスタンスセグメンテーション、画像分類、姿勢推定、オリエンテッドバウンディングボックス(OBB)をネイティブでサポートします。 唯一の小さな欠点は、YOLOv7 専用に構築された高度に特殊化されたレガシーパイプラインの場合、短期間のリファクタリングが必要になる可能性がある点です。
エコシステムの利点
Ultralytics YOLOv8 、整備されたエコシステムをYOLOv8 。直感Python 、活発な開発、そして強力なコミュニティサポートにより、モデルをローカルテストからグローバル展開へ移行する時間は、単独のリポジトリと比較して大幅に短縮されます。
詳細な性能比較
以下の表は主要なモデルサイズごとの性能指標を比較したものです。YOLOv8 明確な性能バランスに注目してください。エッジデバイスでの高速推論を大幅に最適化しながら、世界トップクラスの精度を維持しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
注:mAP YOLOv8x 一方、YOLOv8n パラメータ効率と推論速度でYOLOv8n 、エッジAIデバイスへのコンピュータビジョン展開において圧倒的な優位性を確立している。
使いやすさとトレーニング効率
使いやすさという点では、Ultralytics YOLOv8 別格YOLOv8 。YOLOv7 のような古いアーキテクチャでは、特定のレポジトリをクローンし、データセットやパスを設定するために冗長なコマンドラインスクリプトを実行YOLOv7 。
逆に、YOLOv8 ultralytics このパッケージは、非常に効率化された開発者体験を提供します。 トレーニング効率 自動データダウンロード、すぐに使える事前学習済み重み、シームレスな連携を通じて最大化される 輸出能力 次のような形式に ONNX および TensorRT.
Ultralytics Python を使用すると、データの読み込み、トレーニング、推論の実行が驚くほど簡単に行えます。
from ultralytics import YOLO
# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()
実験追跡
YOLOv8 、以下のような一般的なMLOpsツールとネイティブにYOLOv8 Weights & Biases や ClearMLなどの主要なMLopsツールとネイティブに連携し、ハイパーパラメータ調整やトレーニング指標をリアルタイムで監視できます。
理想的なユースケース
これらのアーキテクチャの選択は、多くの場合、デプロイ環境の具体的な制約条件によって決まります。
YOLOv7を選択すべき時
- レガシーベンチマーク:2022年のアーキテクチャ基準と比較するための固定されたベースラインを必要とする研究者に適しています。
- 既存の重厚なインフラストラクチャ: NVIDIA 100 GPUに多大な投資がなされた環境において、YOLOv7特定のtensor レガシーなC++パイプラインに深く組み込まれている状態。
YOLOv8を選択すべき時
- クロスプラットフォーム開発:クラウドGPU、モバイルデバイス、ブラウザ間でシームレスに展開する必要があるチームに最適です。
- マルチタスク要件:プロジェクトがバウンディングボックスを超え、豊富なインスタンスセグメンテーションマスクや姿勢キーポイントを活用する必要がある場合。
- リソース制約のあるエッジ: YOLOv8 (
yolov8nロボット工学、ドローン、IoTセンサー向けに驚異的な精度対速度比を実現します。
展望:YOLO26への世代を超えた飛躍
YOLOv8 非常に堅牢な選択肢ですが、コンピュータビジョン分野は急速に進化しています。全く新規の高性能プロジェクトを開始する開発者向けに、Ultralytics AIモデルの次世代進化形を導入しました。高度に洗練された YOLO11 と新たにリリースされたYOLO26の両方を検討することを強く推奨します。
2026年1月にリリースされたYOLO26は、エッジデバイスで実現可能な限界を押し広げます:
- エンドツーエンドNMS設計:YOLO26はネイティブにエンドツーエンドであり、ノンマキシマムサプレッション(NMS)後処理を完全に排除します。これにより、従来の密予測モデルに見られる遅延ボトルネックがなく、大幅に高速かつシンプルなデプロイメントパイプラインが実現されます。
- DFL除去:分布焦点損失を除去することで、YOLO26はより簡素なモデル展開オプションと優れたエッジ互換性を実現する。
- 最大43%高速CPU :Raspberry Piや組込みシステムなどの制約環境向けに高度に最適化され、CPU において過去全世代を上回る性能を実現。
- MuSGDオプティマイザ:大規模言語モデル(LLM)の学習パラダイムに着想を得たYOLO26は、SGD ミューオンのハイブリッド方式を採用。これにより、前例のない学習安定性と驚異的な収束速度を実現します。
- ProgLoss + STAL:これらの高度な損失関数は、航空画像、自動農業、ロボット工学において極めて重要な小規模物体認識において顕著な改善をもたらす。
YOLOv8 を用いた大規模な動画解析クラスターの拡張からYOLOv8 最先端のYOLO26による小型エッジデバイスへの推論処理のYOLOv8 Ultralytics はAIライフサイクル全体をシームレスに管理するツールを提供します。