YOLOv8 YOLOv7:アーキテクチャの進化と性能分析
急速に進歩するコンピュータビジョン分野において、「You Only Look Once」(YOLO)モデル群はリアルタイム物体検出の基準を常に確立してきた。本比較では、 Ultralytics YOLOv8 と研究志向の YOLOv7の間の技術的な差異を比較検討する。両モデルともAI史上の重要なマイルストーンではあるが、開発および展開のニーズに応える段階が異なる。
開発者が最もシームレスな体験を求める場合、Ultralytics 統一されたインターフェースを提供します。ただし、特定のコンピュータビジョンタスクに適したツールを選択するには、YOLOv7連結YOLOv8アンカーフリー設計へのアーキテクチャの移行を理解することが極めて重要です。
性能指標の比較
以下の表は性能のトレードオフを強調しています。 YOLOv8 一般的に速度と精度の優れたバランスを提供し、特にUltralytics トレーニングおよびデプロイ効率を考慮すると顕著です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Ultralytics YOLOv8: 現代の標準
YOLOv8 、アンカーフリー検出ヘッドと分離型アーキテクチャを採用することで、YOLO 重要な転換点YOLOv8 。この設計選択により、手動でのアンカーボックス計算が不要となり、トレーニングプロセスが簡素化され、多様なデータセットにおいてモデルの頑健性が向上した。
YOLOv8の詳細:
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023-01-10
- GitHub:Ultralytics リポジトリ
アーキテクチャとイノベーション
YOLOv8 、従来のC3モジュールに代わるC2fモジュール(二つの畳み込み層を備えたクロスステージ部分ボトルネック)YOLOv8 。C2fモジュールは勾配の流れを改善し、軽量性を維持しながらより複雑な特徴表現を学習可能とする。
YOLOv8 主要な強みは、そのネイティブな汎用性 YOLOv8 。異なるタスクごとに別々のブランチを必要とした従来のリポジトリとは異なり、YOLOv8 単一のフレームワーク内で物体検出、インスタンスセグメンテーション、姿勢推定、分類、およびオリエンテッドバウンディングボックス(OBB) YOLOv8 。
YOLOv7:研究上の画期的な成果
2022年半ばに発表されたYOLOv7 、「Trainable bag-of-freebies」によるアーキテクチャ最適化に重点YOLOv7 。当時、アンカーベース検出器で可能な限界を押し広げた。
YOLOv7の詳細:
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2022-07-06
- Arxiv:YOLOv7: トレーナブルな無料のバッグが最新のステート・オブ・ジ・アートを実現
- GitHub:WongKinYiu/yolov7
建築的アプローチ
YOLOv7 はE-ELAN(拡張効率的層集合ネットワーク)アーキYOLOv7 。この設計は、ネットワークがより効果的に学習できるように、最短および最長の勾配経路の制御に重点を置いている。高い精度を誇る一方で、このアーキテクチャは複雑であり、アンカーボックスに依存しているため、カスタムデータ上で最適な性能を発揮するには特定の調整が必要となる場合がある。
技術比較とユースケース
1. 使いやすさとエコシステム
最も重要な差別化要因はエコシステムである。 YOLOv8 経由で配布される ultralytics pipパッケージは、「ゼロからヒーローへ」の体験を提供します。開発者はアクセスできます 事前学習済みモデル 数分でトレーニングを開始できます。
対照的に、YOLOv7 主に研究リポジトリYOLOv7 。強力ではあるものの、Ultralytics 標準化されたAPI、TensorBoardなどのツールとのシームレスな統合、そして充実したドキュメントが欠けている。
2. 学習効率とメモリ
Ultralytics トレーニング効率の高さで知られています。CUDA YOLOv8 、TransformerベースのモデルやYOLOv7 、より大きなバッチサイズを可能にすることが多いです。この効率性により、クラウドコンピューティングコストの削減と反復時間の短縮が実現します。
統合エクスポート
デプロイにおける最大の課題の一つはモデルの変換です。YOLOv8 これをYOLOv8 、ワンラインのコマンドで ONNX、 TensorRT、CoreML、TFLiteへのエクスポートを1行のコマンドで実現し、あらゆるエッジデバイスでのモデル実行を保証します。
3. 理想的な使用例
- YOLOv8、メンテナンスが容易で、追跡やセグメンテーションなど複数のコンピュータビジョンタスクをサポートし、ラズベリーパイなどのエッジデバイスへの展開が容易な、実運用可能なソリューションが必要な場合に選択してください。
- 学術研究において、従来のアンカーベースのアーキテクチャとの比較を特に目的とする場合、または2022年のベンチマーク結果を再現する必要がある場合は、 YOLOv7。
未来:YOLO26
YOLOv8 YOLOv7 優れたモデルYOLOv7 、この分野は急速に進化しています。Ultralytics 、新規プロジェクトすべてに推奨されるモデルとしてYOLO26をリリースしました。
YOLO26はエンドツーエンドNMS設計を導入し、非最大抑制(NMS)後処理を不要にしました。これにより、デプロイメントパイプラインが大幅に簡素化され、レイテンシが低減されます。さらに、YOLO26は分布焦点損失(DFL)を排除し、LLMトレーニングに着想を得たSGD ミューオンのハイブリッドであるMuSGDオプティマイザーを採用することで、安定したトレーニングと高速な収束を実現しています。
ProgLoss とSTAL(Soft-Target Anchor Loss)により、YOLO26 CPU 最大43%高速化し、エッジコンピューティングとリアルタイム分析における究極の選択肢となります。
コード例
Ultralytics はワークフローを統一します。最小限のコードで最先端YOLOv8 をトレーニングしたり、レガシー設定を読み込んだりできます。
from ultralytics import YOLO
# Load the recommended model (YOLO26 or YOLOv8)
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
# The unified API handles data augmentation and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
他のアーキテクチャに関心のある研究者のために、Ultralytics 以下の内容も扱っています YOLOv5、 YOLOv9、および YOLO11を網羅し、あらゆるシナリオに最適なツールを提供します。