モデル比較:オブジェクト検出におけるYOLOv6-3.0とYOLOv5
最適な物体検出モデルの選択は、コンピュータビジョンアプリケーションを成功させるために非常に重要です。Meituan YOLOv6-3.0とUltralytics YOLOv5はどちらも、その効率と精度で知られる一般的な選択肢です。このページでは、お客様のプロジェクトのニーズに最適なモデルを決定するのに役立つ技術比較を提供します。Ultralyticsエコシステムの強みを強調しながら、アーキテクチャのニュアンス、パフォーマンスベンチマーク、トレーニングアプローチ、および適切なアプリケーションについて掘り下げて解説します。
Meituan YOLOv6-3.0
Meituanによって開発されたYOLOv6-3.0は、主に産業用アプリケーション向けに設計された物体検出フレームワークです。2023年初頭にリリースされ、実際の展開シナリオに適した速度と精度のバランスを提供することを目指していました。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- ドキュメント: https://docs.ultralytics.com/models/yolov6/
アーキテクチャと主な機能
YOLOv6は、効率的な再パラメータ化可能なバックボーンや合理化されたネックデザインなどのアーキテクチャの変更を導入しました。バージョン3.0では、これらの要素がさらに洗練され、パフォーマンスを向上させるためにトレーニング中の自己蒸留などの手法が組み込まれました。また、モバイル展開に最適化された特定のモデル(YOLOv6Lite)も提供しています。
長所
- 優れた速度と精度のトレードオフ:特に GPU 上での産業用物体検出タスクにおいて、競争力のあるパフォーマンスを提供します。
- 量子化サポート: リソースが限られたハードウェアへの展開に役立つモデル量子化のためのツールとチュートリアルを提供します。
- モバイル最適化:モバイルまたはCPUベースの推論用に特別に設計されたYOLOv6Liteバリアントが含まれています。
弱点
- 限定的なタスクの多様性: 主に物体検出に焦点が当てられており、YOLOv8のようなUltralyticsモデルにある、インスタンスセグメンテーション、画像分類、およびポーズ推定のネイティブサポートがありません。
- エコシステムとメンテナンス: オープンソースですが、エコシステムはUltralyticsプラットフォームほど包括的または活発にメンテナンスされていません。これにより、アップデートが遅くなり、コミュニティサポートが少なくなり、ユーザーエクスペリエンスがより複雑になる可能性があります。
- 高いリソース使用率: パフォーマンスの表に見られるように、より大きな YOLOv6 モデルは、同等の YOLOv5 モデルよりも多くのパラメータと FLOPs を持つ可能性があり、より多くの計算リソースが必要になる可能性があります。
Ultralytics YOLOv5
Ultralytics YOLOv5は、その速度、使いやすさ、および適応性で有名なシングルステージの物体検出モデルです。Ultralyticsによって開発され、高性能な物体検出を幅広い視聴者がアクセスできるようにするための重要なステップとなります。
- 著者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- ドキュメント: https://docs.ultralytics.com/models/yolov5/
完全に PyTorchYOLOv5 、CSPDarknet53バックボーンと、効率的な特徴抽出と融合のためのPANetネックを備えています。そのアーキテクチャは高度にモジュール化されており、異なるモデルサイズ(n, s, m, l, x)間で容易に拡張でき、多様な性能要件を満たすことができます。
YOLOv5の長所
- 速度と効率性: YOLOv5は推論速度に優れており、リアルタイムアプリケーションやリソース制約のあるエッジデバイスへのデプロイに最適です。特にCPUパフォーマンスは注目に値します。
- 使いやすさ: シンプルさで知られるYOLOv5は、シンプルなAPI、充実したドキュメント、および多数のチュートリアルを備えた、効率化されたユーザーエクスペリエンスを提供します。
- 優れたエコシステム: 活発な開発、強力なコミュニティサポート、頻繁なアップデート、MLOpsのためのUltralytics HUBとのシームレスな統合を含む、統合されたUltralyticsエコシステムの恩恵を受けられます。
- パフォーマンスのバランス:速度と精度の間で強力なトレードオフを実現し、多様な現実世界のデプロイメントシナリオに適しています。
- 学習効率: 効率的な学習プロセスを提供し、すぐに利用できる事前学習済みの重みと、特にTransformerベースのモデルと比較して、より低いメモリ要件を提供します。
- 多様性: 物体検出、インスタンスセグメンテーション、画像分類など、複数のタスクを統合フレームワーク内でサポートします。
YOLOv5 の弱点
- ピーク精度: 非常に正確で効率的ですが、YOLOv6-3.0やUltralytics YOLOv8のような新しいモデルは、特定のベンチマーク、特にGPU上のより大きなモデルバリアントで、わずかに高いmAPを提供する可能性があります。
性能の直接対決:YOLOv6-3.0 vs. YOLOv5
以下の表は、COCOデータセットにおけるYOLOv6-3.0とYOLOv5モデル間の詳細なパフォーマンス比較を示しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
データから、YOLOv6-3.0モデルは、GPU上でのそれぞれのサイズに対して、より高いmAPスコアを達成する傾向があります。ただし、Ultralytics YOLOv5は、特にCPU速度とモデル効率の点で、優れたパフォーマンスバランスを示しています。たとえば、YOLOv5nはCPU上で大幅に高速であり、YOLOv6-3.0モデルよりもパラメータとFLOPsが少ないため、軽量なリアルタイムアプリケーションに最適です。YOLOv6-3.0lが最高のmAPを持っていますが、YOLOv5xは、十分に文書化され、サポートされているフレームワークで競争力のあるmAPを提供します。
トレーニング方法
どちらのモデルも、COCOなどの大規模なデータセットでトレーニングするために、標準的な深層学習技術を活用しています。Ultralytics YOLOv5は、Ultralyticsエコシステムから大きな恩恵を受けており、合理化されたトレーニングワークフロー、広範なガイド、AutoAnchor最適化、および実験追跡のためのWeights & BiasesやClearMLなどのツールとの統合を提供します。YOLOv6-3.0のトレーニングは、そのリポジトリに概説されている手順に従いますが、より手動でのセットアップが必要になる場合があり、Ultralyticsプラットフォームの統合されたMLOpsツールがありません。
理想的なユースケース
- Meituan YOLOv6-3.0: GPUで精度を最大化することが主な目標であり、高速な推論も必要な場合に有力な候補となります。特殊な産業オートメーションなど、YOLOv5と比較してわずかなmAPの改善が、潜在的な複雑さの増加またはエコシステムのサポートの低下を正当化できるアプリケーションに適しています。
- Ultralytics YOLOv5: 特にCPUまたはエッジデバイス上でのリアルタイム性能とデプロイの容易さが要求されるアプリケーションに強く推奨されます。その汎用性、広範なサポート、効率的なリソース使用により、迅速なプロトタイピング、モバイルアプリケーション、ビデオ監視、および成熟した、十分に文書化されたエコシステムから恩恵を受けるプロジェクトに最適です。
結論
Ultralytics YOLOv5は、特にその卓越した速度、使いやすさ、堅牢なエコシステムが評価されており、依然として優れた選択肢です。優れたパフォーマンスと効率のバランスを提供し、広範なドキュメントとコミュニティサポートによって支えられており、開発者や研究者にとって非常にアクセスしやすいものとなっています。
YOLOv6-3.0は、特にGPU上の大型モデルのピークmAPに関して、競争力のある性能を提供します。特に産業用アプリケーションにおいて、YOLOフレームワーク内で可能な限り最高の精度を優先するユーザーにとって、実行可能な代替手段となります。
最新の進歩を求めている方は、YOLOv8、YOLOv9、YOLOv10、YOLO11のような、より新しい Ultralytics モデルを検討してください。これらのモデルは、性能、汎用性、効率がさらに向上しています。RT-DETRのような特殊なモデルも、特定のユースケースに独自の利点を提供します。
Ultralyticsモデルのドキュメントで、すべてのオプションをご確認ください。