YOLOv7 YOLOv10:リアルタイム検出のためのアーキテクチャ比較
物体検出モデルの進化は、精度向上と遅延低減への不断の追求によって特徴づけられてきた。この道のりにおける二つの重要なマイルストーンは YOLOv7(2022年半ばにリリース)と YOLOv10である。両アーキテクチャは発表時に最先端技術を更新したが、根本的に異なる設計思想を体現している。YOLOv7 「bag-of-freebies」による学習プロセスの最適化にYOLOv7 、YOLOv10 非最大抑制(NMS)を不要とするエンドツーエンドアプローチをYOLOv10 。
このガイドは、研究者やエンジニアがコンピュータビジョンプロジェクトに適したツールを選択できるよう、詳細な技術比較を提供します。アーキテクチャ、性能指標、デプロイワークフローを分析し、YOLOv10のような現代的な反復版や、さらに新しい YOLO26—がスケーラブルなAIソリューションにおいて好まれる選択肢となる理由を明らかにします。
モデル性能比較
以下の表は、2つのモデルの性能差を比較したものです。YOLOv10 、特に小型モデルにおいて、YOLOv7と比較してYOLOv10 低いレイテンシと高い効率性(より少ないパラメータとFLOPs)を実現しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7: Bag-of-Freebiesの強力なモデル
2022年7月にリリースされた、 YOLOv7 は推論コストを増加させることなく学習プロセスを最適化するために開発された。著者らは「trainable bag-of-freebies」という概念を導入した。これは学習中に精度を向上させるが推論時には破棄される最適化手法を指し、モデルを高速に保つものである。
主要な技術詳細:
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織: 台湾、中央研究院 情報科学研究所
- 日付: 2022-07-06
- リンク:ArXiv論文 | GitHubリポジトリ
YOLOv7 拡張効率的層集約ネットワーク(E-ELAN)YOLOv7 。このアーキテクチャは、最短および最長の勾配経路を効果的に制御することで、モデルがより多様な特徴を学習することを可能にする。 さらに、深さや幅といったアーキテクチャ属性を同時に変更するモデルスケーリング技術を採用し、異なるサイズ全体で最適な性能を確保している。COCO での高い性能にもかかわらず、YOLOv7 主にアンカーベースの検出器YOLOv7 、現代的なアンカーフリーの代替手法と比較すると、ハイパーパラメータ調整が複雑になる場合がある。
YOLOv10: リアルタイムエンドツーエンド物体検出
清華大学の研究者により2024年5月に発表された YOLOv10NMSを導入したことで、YOLO における重要な転換点となった。
主要な技術詳細:
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織:清華大学
- 日付: 2024-05-23
- リンク:ArXiv論文 | GitHubリポジトリ
YOLOv10 、リアルタイム検出における長年のボトルネックである後処理における非最大抑制(NMS)へのYOLOv10 。一貫した二重割り当てを採用することで、YOLOv10 エンドツーエンドのトレーニングYOLOv10 、モデルが直接最終予測を出力できるようにします。NMS 排除により、特に後処理のオーバーヘッドが大きなエッジデバイスにおいて、推論の遅延がNMS 削減され、デプロイメントパイプラインが簡素化されます。 さらに、効率性と精度を統合的に追求したモデル設計により、軽量分類ヘッドや空間-チャネル分離型ダウンサンプリングなど各コンポーネントを最適化し、計算上の冗長性を削減している。
批判的比較:建築とユーザビリティ
両モデルとも高性能ではあるものの、アーキテクチャの違いが最適な使用ケースを決定づける。
NMS対アンカーベース
最も決定的な違いは後処理の必要性である。YOLOv7 重複する境界ボックスNMS YOLOv7 。効果的ではあるものの、NMS 検出されたオブジェクトの数に応じて遅延NMS 、予測時間を変動させる。一方、YOLOv10設計YOLOv10決定論的な推論時間を提供し、自律走行車のような安全性が極めて重要なリアルタイムアプリケーションにおいて極めて重要である。
効率性とリソース使用量
YOLOv10 優れた効率性をYOLOv10 。比較表に示す通り、YOLOv7精度を達成しながら、パラメータ数を約65%削減している。この大幅なモデルサイズの縮小はメモリ消費量の低減につながり、YOLOv10 モバイルアプリやIoTデバイスなどのメモリ制約環境においてYOLOv10 適している。
メモリ効率
エッジデバイス向け開発者にとって、YOLOv10 パラメータ数が削減されたことは、推論時のRAM使用量が大幅に減少YOLOv10 。これにより、より大きなバッチサイズでの実行や、同じハードウェア上で他のAIモデルとのマルチタスク処理が可能になります。
トレーニングとエコシステム
モデルを取り巻くエコシステムは、開発者にとっての実用性を決定づけます。Ultralytics 真価を発揮するのはこの点です。Ultralytics Python アクセス可能であり、これによりユーザー体験が統一されます。
- 使いやすさ: モデルを切り替えるには、単一の文字列を変更するだけで済みます(例:
model = YOLO("yolov10n.pt"))。 - 統一モード: Ultralytics 、トレーニング、検証、ONNX、TensorRT、CoreMLなどの形式へのエクスポートに関するコマンドをUltralytics 。
- トレーニング効率: Ultralytics 、生のPyTorch と比較してCUDA 低減するよう最適化されており、コンシューマー向けGPU上でより大きなバッチサイズを実現します。
from ultralytics import YOLO
# Load a pre-trained YOLOv10 model (swappable with YOLOv7)
model = YOLO("yolov10n.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("path/to/image.jpg")
未来:YOLO26
YOLOv10 、この分野は急速に進化しています。新たに発表されたYOLO26(2026年1月)はYOLOv10 NMSをYOLOv10 さらなる速度と精度向上のための革新を導入しています。
- エンドツーエンドNMS: YOLOv10と同様に、YOLO26はネイティブにエンドツーエンドであり、確定的なレイテンシを保証します。
- MuSGDオプティマイザー:大規模言語モデル(LLM)のトレーニングに着想を得たこのハイブリッドオプティマイザーは、安定したトレーニングとより速い収束を保証します。
- エッジ最適化:分布焦点損失(DFL)の除去により、YOLO26 CPU上で最大43%高速化され、エッジコンピューティングにおける優れた選択肢となっています。
- 汎用性:YOLO26はOBB、姿勢推定、セグメンテーションを含む全てのタスクをサポートします。
結論
YOLOv7 YOLOv10 の選択は、具体的な制約条件によってYOLOv10 。
- YOLOv7、その特定のアーキテクチャ向けに最適化されたレガシーシステムを維持している場合、または研究比較のために特定の「bag-of-freebies」機能が必要な場合に選択してください。
- 低遅延かつ高効率が求められる新規デプロイメントには YOLOv10を選択してください。NMS設計とパラメータ数の削減により、リアルタイムエッジアプリケーションに最適です。
ただし、速度、精度、使いやすさの最適なバランスを求めるなら、最新のYOLO26を検討することをお勧めします。堅牢なUltralytics によって支えられ、コンピュータビジョン開発において最も将来性のあるソリューションを提供します。