YOLOv7 .YOLOv6.0:物体検出における革新性と速度のバランス
リアルタイム物体検出の急速に進化する分野において、適切なアーキテクチャの選択は性能と効率の最適化に極めて重要です。この詳細な比較では YOLOv7YOLOv6、この分野に多大な影響を与えた二つの重要なモデルを詳細に比較検討します。両モデルのアーキテクチャ上の革新点、ベンチマーク指標、および様々なコンピュータビジョンタスクへの適性を分析します。さらに、これらの基盤をさらに発展させ、優れた性能と使いやすさを提供する次世代モデルYOLOv26を紹介します。
モデル概要
YOLOv7
YOLOv7 は、速度と精度の両面で従来の最先端検出器を凌駕するよう設計された。推論コストを増加させることなく学習を最適化する、学習可能な「フリービーの袋」を導入している。
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織:中央研究院情報科学研究所
- 日付:2022年7月6日
- Arxiv:YOLOv7: 学習可能なbag-of-freebiesがリアルタイム物体検出器の新たなSOTAを確立
- GitHub:WongKinYiu/yolov7
YOLOv6-3.0
YOLOv6.YOLOv6(YOLOv6 .0)は産業応用を強く重視し、GPU上のハードウェアスループットを最適化している。これは「リローディング」アップデートの一部であり、YOLOv6 大幅に改善した。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織:Meituan
- 日付: 2023年1月13日
- Arxiv:YOLOv6 v3.0: 全面的なリローディング
- GitHub:meituan/YOLOv6
技術比較
両モデルともリアルタイム性能を目標としているが、異なるアーキテクチャの理念を通じてそれを達成している。
アーキテクチャ
YOLOv7 拡張効率的層集約ネットワーク(E-ELAN)を採用している。このアーキテクチャは最短および最長の勾配経路を制御し、勾配の流れを損なうことなくネットワークがより多様な特徴量を学習できるようにする。また、深さや幅を単純に拡大縮小するのではなく、層を連結するモデルスケーリングを採用しており、スケーリング時にも最適な構造を維持する。
YOLOv6、ネック部分に双方向連結(BiC)モジュールを採用し、純粋なアンカーフリー設計を採用している。ハードウェアに優しい構造に焦点を当て、GPUのメモリアクセスコストを最適化している。バージョン3.0のアップデートでは、特に検出ヘッドとラベル割り当て戦略を刷新し、収束速度と最終精度を向上させた。
パフォーマンス指標
以下の表は、COCO における主要な性能指標を比較したものです。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
長所と短所
YOLOv7の強み:
- 特徴の豊富さ:E-ELAN構造は微細な詳細を捉えることに優れており、小さな物体の検出に有益である。
- 補助ヘッド:粗いから細かいへの段階的なラベル割り当てを採用し、トレーニング中の監督を強化します。
YOLOv7の弱み:
- 複雑性:特定の組み込みハードウェア向けに修正または最適化を行う場合、アーキテクチャは複雑になる可能性がある。
- NMS :標準的な非最大抑制後処理が必要であり、これにより遅延変動が生じる。
YOLOv6-3.0の強み:
- スループット: TensorRTを使用したTesla T4および類似のGPUにおける高スループットシナリオ向けに特に最適化されています。
- 量子化:量子化対応トレーニング(QAT)を考慮して設計されており、エッジデバイスへのINT8展開を容易にします。
YOLOv6-3.0の弱み:
- CPU : GPU上では優れた性能を発揮するが、そのアーキテクチャ設計は、新しい「Lite」版やモバイル専用モデルと比較して、純粋なCPU 向けに最適化されていない。
現実世界のアプリケーション
これらのモデル間の選択は、主に導入環境のハードウェアと具体的な使用ケースによって決まります。
YOLOv6.0を用いた産業用検査
高速製造ラインでは、スループットが最優先事項である。YOLOv6.YOLOv6、コンベアベルト上の欠陥検出に好んで選ばれることが多い。TensorRT との互換性TensorRT 、エッジGPU上で毎秒数百フレームを処理TensorRT 、不良品が混入するのを確実に防ぐ。
YOLOv7を用いた複合監視
混雑したシーンや長距離監視を伴うセキュリティ用途において、 YOLOv7 は非常に効果的です。特徴の詳細を保持する能力により、都市部の維持管理に適しており、例えば道路損傷の特定や、物体が小さかったり部分的に遮蔽されたりする可能性のある交通流の監視などに活用できます。
デプロイの柔軟性
両モデルとも高性能ですが、導入方法には大きな違いがあります。YOLOv6 積極的な量子化(INT8)を活用できる環境YOLOv6 、YOLOv7 FP16モードでも高い精度を維持YOLOv7 。
Ultralyticsの利点
YOLOv6 堅牢なYOLOv6 、Ultralytics 内でこれらを活用することで、開発者や研究者にとって明確な利点が得られます。Ultralytics Python は、これらの異なるモデルを単一の合理化されたAPIの下で統合します。
- 使いやすさ:1行のコードで、YOLOv7 トレーニングと新しいアーキテクチャのトレーニングを切り替えることができます。
- 整備されたエコシステム: Ultralyticsは頻繁なアップデートを提供し、最新のPyTorchバージョンとCUDAドライバーとの互換性を確保しています。
- 汎用性:標準的な検出機能に加え、互換性のあるモデルファミリー全体で姿勢推定とインスタンスセグメンテーションをサポートします。
- トレーニング効率: Ultralytics パイプラインはメモリ効率を最適化しており、多くの場合、消費者向けハードウェア上で元の研究リポジトリよりも大きなバッチサイズを可能にします。
コード例
Ultralyticsを使用すれば、これらのモデルを驚くほど簡単に試すことができます:
from ultralytics import YOLO
# Load a YOLOv7 model (or swap to 'yolov6n.pt')
model = YOLO("yolov7.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
未来:YOLO26
YOLOv7 YOLOv6依然として有用であるが、この分野は進歩を続けている。2026年1月にリリースされたYOLO26は、効率性と性能における新たな基準を確立し、先行モデルの限界を克服している。
YOLO26は、エッジとクラウドの両方の展開における究極のソリューションとして設計されており、以下の特徴を備えています:
- エンドツーエンドNMS設計: YOLOv7異なり、YOLO26はネイティブにエンドツーエンドです。NMS が不要となり、リアルタイムロボティクスに不可欠な高速で決定論的な推論レイテンシを実現します。
- MuSGDオプティマイザー:LLMトレーニングにおける革新(Moonshot AIのKimi K2など)に着想を得たこのハイブリッドオプティマイザーは、SGD ミューオンSGD 組み合わせることで、トレーニングを安定化させ収束を加速します。
- 最大43%高速CPU :分布焦点損失(DFL)の除去とアーキテクチャの最適化により、YOLO26はCPU上で大幅な高速化を実現し、ラズベリーパイなどのエッジデバイスに最適です。
- ProgLoss + STAL:先進的な損失関数が、従来モデルがしばしば苦戦してきた重要な領域である微小物体認識を改善する。
速度、精度、導入の容易さの最適なバランスを求める開発者には、YOLO26への移行を強く推奨します。
その他の検討すべきモデル
Ultralytics アーキテクチャを探索したい場合は、以下をご検討ください:
- YOLO11: 従来の最先端世代であり、機能の優れたバランスを提供します。
- YOLOv10:YOLO におけるNMS学習戦略の先駆者。
- RT-DETR: 変圧器ベースの検出器で、精度に優れるがよりGPU 必要とする。
Ultralytics を活用することで、これらのモデルを特定のデータセットに対して容易にベンチマークし、アプリケーションに最適なモデルを見つけることができます。