YOLOv5 vs YOLOv7:詳細な比較
適切な物体検出モデルの選択は、速度、精度、デプロイの容易さの必要性のバランスを取る重要な決定です。このページでは、Ultralytics YOLOv5とYOLOv7という、コンピュータビジョンの分野における2つの影響力のあるモデルの技術的比較を提供します。どちらも大きな貢献をしていますが、Ultralytics YOLOv5は、パフォーマンス、ユーザーフレンドリーな設計、包括的で十分にメンテナンスされたエコシステムの卓越したバランスで際立っており、幅広い現実世界のアプリケーションにとって好ましい選択肢となっています。
Ultralytics YOLOv5:確立された業界標準
Glenn Jocherによって2020年にリリースされたUltralytics YOLOv5は、その卓越した速度、精度、使いやすさの組み合わせにより、瞬く間に最も人気のある物体検出モデルの1つになりました。PyTorchで完全に開発されたYOLOv5は高度に最適化されており、トレーニングからデプロイメントまでの合理化されたエクスペリエンスを提供します。
Author: Glenn Jocher
Organization: Ultralytics
Date: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Docs: https://docs.ultralytics.com/models/yolov5/
YOLOv5 のアーキテクチャと主な機能
YOLOv5は、CSPDarknet53バックボーンと効果的な特徴集約のためのPANetネック上に構築された、柔軟で効率的なアーキテクチャを備えています。多数のリリースで改良されたアンカーベースの検出ヘッドを使用しています。その主な強みの1つは、モデルサイズの多様性(n、s、m、l、x)であり、開発者はパフォーマンスと計算リソースの間の最適なトレードオフを選択できます。このスケーラビリティにより、軽量なエッジデバイスから強力なクラウドサーバーまで、あらゆるものに適しています。
YOLOv5の長所
- 使いやすさ: YOLOv5は、シンプルなPythonおよびCLIインターフェース、充実したドキュメント、および簡単なトレーニングと推論のパイプラインで知られています。
- 優れたメンテナンス体制: 活発な開発、大規模なコミュニティ、頻繁なアップデート、そしてノーコードトレーニングとデプロイメントのためのUltralytics HUBのような強力なツールを含む、堅牢なUltralyticsエコシステムによって支えられています。
- パフォーマンスのバランス: YOLOv5は、推論速度と検出精度の間で優れたトレードオフを実現しており、多様な現実世界のシナリオに非常に適しています。
- 多様性とトレーニング効率: オブジェクト検出、インスタンスセグメンテーション、画像分類など、複数のビジョンタスクをサポートしています。トレーニングプロセスは効率的で、すぐに利用できる事前トレーニング済みの重みと、より複雑なアーキテクチャと比較して低いメモリ要件を備えています。
YOLOv5 の弱点
- 精度の限界: 非常に正確ですが、より新しいモデルは、COCOのような標準的なベンチマークでそのmAPスコアを上回っています。
- Anchor-Based Design: 事前に定義されたアンカーボックスに依存しているため、最新のアンカーフリーアプローチと比較して、異常な形状のオブジェクトを持つデータセットではより多くの調整が必要になる場合があります。
YOLOv5のユースケース
- リアルタイムアプリケーション: ロボティクス、AIドローン運用におけるコンピュータビジョンアプリケーションのドローンビジョン、リアルタイムビデオ分析など、高速な推論を必要とするアプリケーションに最適です。
- エッジデプロイメント: 効率的な設計と小型モデルサイズにより、リソースが限られたエッジデバイスへのデプロイに適しています。NVIDIA Jetsonデプロイメントガイドをご覧ください。
- 迅速なプロトタイピング:使いやすさと広範なサポートにより、オブジェクト検出ソリューションの迅速なプロトタイピングと展開に最適です。
YOLOv7:高精度にフォーカス
Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liaoによって作成されたYOLOv7は、2022年7月6日にリリースされました。これは、リアルタイムの速度を維持しながら精度の限界を押し広げることを目指して、「trainable bag-of-freebies」として知られるいくつかのアーキテクチャ最適化とトレーニング戦略を導入しました。
著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
所属: Institute of Information Science, Academia Sinica, Taiwan
日付: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
ドキュメント: https://docs.ultralytics.com/models/yolov7/
YOLOv7 のアーキテクチャと主な機能
- E-ELAN: 学習能力を高めるために、バックボーンでExtended Efficient Layer Aggregation Network (E-ELAN)を利用しています。
- モデルスケーリング: さまざまな計算予算に合わせて最適化するために、モデルの深度と幅に対する複合スケーリングを実装します。
- Auxiliary Head Training: 特徴学習を改善するために、学習中に補助ヘッドを使用します(推論中に削除)。
- Bag-of-Freebies: 推論コストを増加させることなく精度を向上させるために、高度な学習テクニックを活用します。
YOLOv7の長所
- 高精度:特に大規模なモデルバリアントにおいて、COCOのようなベンチマークで高いmAPスコアを達成しています。
- Efficient Training Techniques: パフォーマンスを最大化するための新しいトレーニング戦略を組み込んでいます。
YOLOv7の弱点
- 複雑さ: アーキテクチャとトレーニングプロセスは、Ultralytics YOLOv5の合理化されたアプローチと比較して、より複雑になる可能性があります。
- エコシステムとサポート: YOLOv5に関して、Ultralyticsが提供する広範なドキュメント、チュートリアル、統合されたエコシステムが不足しています。
- リソース集約的: 大規模なモデルはかなりの計算リソースを必要とするため、制約のあるデバイスへのデプロイメントが制限される可能性があります。
YOLOv7のユースケース
- 高性能検出: 絶対的に最高の精度を達成することが重要であり、計算リソースの制約が少ないアプリケーション(自動運転車など)に適しています。
- 研究:最先端の物体検出技術を研究する学術研究で使用されます。
性能と技術比較
COCOデータセットでのYOLOv5とYOLOv7の直接比較により、パフォーマンスプロファイルの重要な違いが明らかになります。YOLOv7モデルは一般的に高いmAPスコアを達成しますが、多くの場合、複雑さとリソース要件の増加を伴います。対照的に、Ultralytics YOLOv5は、よりバランスの取れたプロファイルを提供し、CPU推論速度に優れ、競争力のある精度を維持しており、これは多くの現実世界のデプロイメントにとって重要です。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
結論: どのモデルを選ぶべきか?
YOLOv5とYOLOv7のどちらを選択するかは、プロジェクトの優先順位に大きく依存します。
YOLOv7は、標準的なベンチマークで可能な限り最高の精度を必要とし、十分な計算リソースにアクセスできる研究者や開発者にとって、強力な選択肢です。その革新的なトレーニング手法は、パフォーマンスの境界をどのように押し広げるかを示しています。
しかし、圧倒的多数の実用的なアプリケーションにとって、Ultralytics YOLOv5が依然として優れた選択肢です。その主な利点である、使いやすさ、迅速なデプロイメント、優れた速度と精度のバランス、そして活気のあるエコシステムにより、非常に効率的で信頼性の高いツールとなっています。初期のプロトタイプから本番環境へのデプロイメントまで、開発者が堅牢なコンピュータビジョンソリューションを迅速に構築できるようにします。
さらに、Ultralyticsのエコシステムは進化を続けています。YOLOv8やYOLO11のような新しいモデルはYOLOv5の基盤の上に構築されており、セグメンテーション、ポーズ推定、トラッキングなどのタスクにおいて、より優れたパフォーマンスと汎用性を提供します。現代的で将来性があり、ユーザーフレンドリーなフレームワークを求める開発者にとって、Ultralytics YOLOファミリーは最も魅力的で包括的なソリューションを提供します。
その他のモデルを見る
物体検出モデルを検討されている場合は、これらの他の比較にも興味があるかもしれません。
- YOLOv5 vs YOLOv8
- YOLOv5 vs YOLOv9
- YOLOv7 対 YOLOv8
- YOLOv7 対 YOLO11
- RT-DETR vs YOLOv7
- YOLOv10やYOLO11のような最新モデルをご覧ください。