モデル比較:物体検出におけるYOLOv5対YOLOv6-3.0
最適な物体検出モデルの選択は、コンピュータビジョンアプリケーションを成功させるために非常に重要です。Ultralytics YOLOv5とMeituan YOLOv6-3.0はどちらも、その効率と精度で知られる一般的な選択肢です。このページでは、お客様のプロジェクトのニーズに最適なモデルを決定するのに役立つ技術比較を提供します。Ultralyticsエコシステムの強みを強調しながら、アーキテクチャのニュアンス、パフォーマンスベンチマーク、トレーニングアプローチ、および適切なアプリケーションについて掘り下げて解説します。
Ultralytics YOLOv5:確立された業界標準
著者: Glenn Jocher
所属: Ultralytics
日付: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
ドキュメント: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5は、そのスピード、使いやすさ、適応性で有名なシングルステージのオブジェクト検出モデルです。Ultralytics開発されたこのモデルは、高性能な物体検出を利用しやすくするための重要な一歩です。完全に PyTorchYOLOv5 、CSPDarknet53バックボーンと、効率的な特徴抽出と融合のためのPANetネックを備えています。そのアーキテクチャは高度にモジュール化されており、異なるモデルサイズ(n, s, m, l, x)間で容易に拡張でき、多様な性能要件を満たすことができます。
YOLOv5の長所
- 速度と効率性: YOLOv5は推論速度に優れており、リアルタイムアプリケーションやリソース制約のあるエッジデバイスへのデプロイに最適です。パフォーマンスの表に見られるように、YOLOv5nモデルは、より小型のモデルの中で最速のCPUおよびGPU推論時間を提供します。
- 使いやすさ: シンプルさで知られるYOLOv5は、シンプルなAPI、充実したドキュメント、および多数のチュートリアルを備えた、効率化されたユーザーエクスペリエンスを提供します。
- 優れたエコシステム: 活発な開発、Discordを介した強力なコミュニティサポート、頻繁なアップデート、MLOpsのためのUltralytics HUBとのシームレスな統合を含む、統合されたUltralyticsエコシステムの恩恵を受けられます。
- 多様性: 物体検出、インスタンスセグメンテーション、画像分類など、複数のタスクをサポートしており、シングルタスクモデルよりも包括的なソリューションを提供します。
- 学習効率: 効率的な学習プロセス、すぐに利用できる事前学習済みの重み、特にTransformerベースのモデルと比較して、より低いメモリ要件を提供します。
YOLOv5 の弱点
- 精度: 非常に高精度かつ効率的ですが、YOLOv6-3.0やUltralytics YOLOv8のような新しいモデルは、特定のベンチマーク、特に大型モデルバリアントでわずかに高いmAPを提供する可能性があります。
- Anchor-Based Detection: アンカーボックスに依存しているため、最新のアンカーフリー検出器と比較して、多様なデータセットで最適なパフォーマンスを得るには調整が必要になる場合があります。
Meituan YOLOv6-3.0:産業界の有力候補
著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
所属: Meituan
日付: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
ドキュメント: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0はMeituanによって開発された、主に産業用アプリケーション向けに設計された物体検出フレームワークです。2023年初頭にリリースされ、現実世界の展開シナリオに適した速度と精度のバランスを提供することを目指していました。YOLOv6は、効率的なバックボーンやネックの設計などのアーキテクチャの変更を導入しました。バージョン3.0では、これらの要素がさらに改良され、トレーニング中の自己蒸留などの手法が組み込まれてパフォーマンスが向上しました。また、モバイル展開向けに最適化された特定のモデル(YOLOv6Lite)も提供しています。
YOLOv6-3.0の強み
- 優れた速度と精度のトレードオフ:特に GPU 上で mAP を最大化することが目標となる産業用物体検出タスクにおいて、競争力のあるパフォーマンスを提供します。
- 量子化サポート: リソースが限られたハードウェアへの展開に役立つモデル量子化のためのツールとチュートリアルを提供します。
- モバイル最適化:モバイルまたはCPUベースの推論用に特別に設計されたYOLOv6Liteバリアントが含まれています。
YOLOv6-3.0の弱点
- 限定的なタスクの多様性: 主に物体検出に焦点が当てられており、YOLOv5やYOLOv8のようなUltralyticsモデルにある、セグメンテーション、分類、またはポーズ推定のネイティブサポートがありません。
- エコシステムとメンテナンス: オープンソースですが、エコシステムはUltralyticsプラットフォームほど包括的または活発にメンテナンスされていません。そのため、アップデートが遅れたり、コミュニティサポートが少なくなる可能性があります。
- 高いリソース使用率: より大きな YOLOv6 モデルは、同様の mAP に対して YOLOv5 相当のモデルよりもパラメータと FLOPs が大幅に多くなる可能性があり、より多くの計算リソースが必要になる可能性があります。
性能直接対決
以下の表は、COCOデータセットにおけるYOLOv5とYOLOv6-3.0モデル間のパフォーマンス指標の直接的な比較を示しています。Ultralytics YOLOv5は、小型モデルでCPUとGPUの両方で優れた速度を示し、リアルタイムエッジアプリケーションに最適です。より大型のYOLOv6-3.0モデルはより高いピークmAPを達成できますが、YOLOv5は、特にパラメータとFLOPの数が少ないことを考慮すると、全体的にバランスの取れた効率的なパフォーマンスを提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
トレーニング方法
どちらのモデルも、COCOなどの大規模なデータセットでトレーニングするために、標準的な深層学習技術を活用しています。ただし、Ultralytics YOLOv5は、Ultralyticsエコシステムから大きな恩恵を受けており、合理化されたトレーニングワークフロー、広範なガイド、AutoAnchor最適化、および実験追跡のためのWeights & BiasesやClearMLなどのツールとの統合を提供します。この統合されたアプローチは、開発サイクルを簡素化し、展開までの時間を短縮します。YOLOv6-3.0のトレーニングは、その公式リポジトリに概説されている手順に従います。
理想的なユースケース
- Ultralytics YOLOv5: 特にCPUまたはエッジデバイス上でのリアルタイム性能とデプロイの容易さが要求されるアプリケーションに強く推奨されます。その汎用性、広範なサポート、効率的なリソース使用により、迅速なプロトタイピング、モバイルアプリケーション、ビデオ監視(盗難防止のためのコンピュータビジョン)、および成熟した、十分に文書化されたエコシステムから恩恵を受けるプロジェクトに最適です。
- Meituan YOLOv6-3.0: GPUで精度を最大化することが主な目標であり、高速な推論も必要な場合に有力な候補となります。YOLOv5と比較してわずかなmAPの改善が、潜在的な複雑さの増加またはエコシステムのサポートの低下を正当化できる産業用アプリケーションに適しています。
結論
Ultralytics YOLOv5は、特にその卓越した速度、使いやすさ、堅牢なエコシステムが評価されており、依然として優れた選択肢です。優れたパフォーマンスと効率のバランスを提供し、広範なドキュメントとコミュニティサポートによって支えられており、開発者や研究者にとって非常にアクセスしやすいものとなっています。
YOLOv6-3.0は、特にGPU上の大型モデルのピークmAPに関して、競争力のある性能を提供します。特殊な産業タスク向けに、YOLOフレームワーク内で可能な限り最高の精度を優先するユーザーにとって、実行可能な代替手段となります。
最新の進歩を求めている方は、YOLOv8、YOLOv9、YOLOv10、YOLO11のような、より新しい Ultralytics モデルを検討してください。これらのモデルは、性能、汎用性、効率がさらに向上しています。RT-DETRのような特殊なモデルも、特定のユースケースに独自の利点を提供します。
Ultralyticsモデルのドキュメントで、すべてのオプションをご確認ください。