YOLOv10 vs. YOLOv6-3.0: 技術的な比較
最適な物体検出モデルの選択は、精度、速度、計算コストのバランスを取る上で重要な決定です。このページでは、エンドツーエンドの効率に重点を置いた最近のイノベーションであるYOLOv10と、産業用アプリケーション向けに設計されたモデルであるYOLOv6-3.0の詳細な技術比較を提供します。アーキテクチャ、パフォーマンス指標、およびプロジェクトに最適なモデルを選択するのに役立つ理想的なユースケースを分析し、包括的なUltralyticsエコシステム内でのYOLOv10の利点を強調します。
YOLOv10:リアルタイムエンドツーエンド効率
2024年5月に清華大学の研究者によって発表されたYOLOv10は、リアルタイム物体検出における大きな進歩を示しています。その主な革新は、Non-Maximum Suppression (NMS)の必要性を排除することで、エンドツーエンドの検出を実現し、ポストプロセッシングのレイテンシを削減し、デプロイメントパイプラインを簡素化することです。
Authors: Ao Wang, Hui Chen, Lihao Liu, et al.
Organization: Tsinghua University
Date: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Docs: https://docs.ultralytics.com/models/yolov10/
アーキテクチャと主な機能
YOLOv10の設計は、効率と精度の両方を最大化するための包括的なアプローチによって推進されています。
- NMS不要の学習: ラベルに一貫した二重割り当てを使用することにより、YOLOv10はNMSポストプロセスステップを削除します。これにより、計算オーバーヘッドが削減され、推論レイテンシが削減されるため、リアルタイム推論にとって大きな利点となります。
- 全体的な効率と精度の設計: モデルアーキテクチャは包括的に最適化されています。これには、軽量な分類ヘッドと空間チャネル分離ダウンサンプリングが含まれており、計算の冗長性を低減しながら、重要な特徴を保持するモデルの能力を向上させます。
- 優れたパラメータ効率: YOLOv10モデルは、多くの代替モデルと比較して、より少ないパラメータとFLOPで一貫してより高い精度を実現するため、リソースが限られたエッジデバイスへの展開に最適です。
- シームレスなUltralytics統合: Ultralyticsエコシステムの一部として、YOLOv10は合理化されたユーザーエクスペリエンスの恩恵を受けます。シンプルなPython APIとCLIを介して簡単に使用でき、広範なドキュメントによってサポートされており、効率的なトレーニングとデプロイメントのためにUltralytics HUBなどのツールと統合されています。
長所
- 最先端のパフォーマンス: 速度と精度の優れたバランスを実現し、多くの場合、以前のモデルを凌駕します。
- End-to-End Deployment: NMSフリー設計により、トレーニングからデプロイメントまでのパイプライン全体が簡素化されます。
- 高い効率性: 同等またはそれ以上の精度を得るために、より少ないパラメータと計算リソースを必要とするため、ロボティクスや自律システムなどのアプリケーションに非常に適しています。
- 優れた維持管理体制のエコシステム: Ultralyticsフレームワーク内での活発な開発、強力なコミュニティサポート、頻繁なアップデートの恩恵を受けています。
弱点
- 最新性: 非常に新しいモデルであるため、コミュニティやサードパーティのツールは、Ultralytics YOLOv8のようなより確立されたモデルと比較して、まだ成長段階にあります。
理想的なユースケース
YOLOv10は、低レイテンシと高効率が最重要視されるアプリケーションに非常に適しています。
- Edge AI: 携帯電話、NVIDIA Jetson、Raspberry Piなど、計算能力に制約のあるデバイスへのデプロイに最適です。
- リアルタイム分析: 交通管理やライブビデオ監視など、即時のオブジェクト検出を必要とするペースの速い環境に最適です。
- 産業オートメーション: 製造業における高速品質管理およびプロセス監視に使用できます。
YOLOv6-3.0:産業用アプリケーション向けに最適化
YOLOv6-3.0はMeituanによって開発され、2023年初頭にリリースされた、産業用アプリケーションに重点を置いて設計された物体検出フレームワークです。現実世界の展開シナリオにおいて、推論速度と精度の実用的なバランスを提供することを目指しています。
著者: Chuyi Li, Lulu Li, Yifei Geng, et al.
所属: Meituan
日付: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
ドキュメント: https://docs.ultralytics.com/models/yolov6/
アーキテクチャと主な機能
YOLOv6-3.0では、特にさまざまなハードウェアプラットフォームへの実装において、パフォーマンスを向上させるために、いくつかのアーキテクチャの変更が導入されています。
- ハードウェアを考慮した設計: このネットワークは、Efficient Reparameterization Backboneのような技術を活用して、異なるハードウェア間で効率的になるように設計されています。これにより、トレーニング後にネットワーク構造を最適化して、より高速な推論が可能になります。
- ハイブリッドブロック: アーキテクチャは、特徴抽出能力と計算効率のバランスを取るために、ハイブリッドブロックを使用します。
- 自己蒸留: トレーニング戦略には、推論コストを追加せずにパフォーマンスを向上させるための自己蒸留が組み込まれています。
長所
- 高速な推論速度: 高速なパフォーマンスのために最適化されており、リアルタイムの産業ニーズに適しています。
- 良好な精度: 特に大型モデルバリアントにおいて、競争力のある精度を提供します。
- 量子化サポート: リソースが限られたハードウェアへの展開に役立つモデル量子化に対する堅牢なサポートとチュートリアルを提供します。
弱点
- 限定的なタスクの多様性: YOLOv6-3.0は主に物体検出に焦点が当てられています。YOLOv8やYOLO11のようなUltralyticsモデルで標準となっている、セグメンテーション、分類、ポーズ推定のような他のコンピュータビジョンタスクの組み込みサポートがありません。
- 高いリソース使用率: 同様の mAP に対して、YOLOv6-3.0 モデルは YOLOv10 相当のモデルよりもパラメータと FLOPs が大幅に多くなる可能性があり、より多くの計算能力が必要になる可能性があります。
- エコシステムとメンテナンス: オープンソースですが、そのエコシステムはUltralyticsプラットフォームほど包括的または活発にメンテナンスされていません。これにより、アップデートが遅くなり、コミュニティサポートが少なくなる可能性があります。
理想的なユースケース
YOLOv6-3.0の速度と精度の組み合わせにより、特定の高性能アプリケーションにとって確実な選択肢となります。
- 産業品質管理: 検出速度が重要な自動検査システムに効果的です。
- 高度なロボティクス: ナビゲーションとインタラクションのために高速かつ正確な物体検出を必要とするロボットシステムに適しています。
- リアルタイム監視: セキュリティシステムなど、タイムリーな分析のために精度と速度の両方が重要なシナリオに展開できます。
性能の直接対決:YOLOv10 vs. YOLOv6-3.0
YOLOv10とYOLOv6-3.0の性能比較は、YOLOv10による効率と精度の向上を強調しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
表に見られるように、YOLOv10モデルは、YOLOv6-3.0モデルと比較して、一貫してより少ないパラメータとFLOPsで、より高いmAPスコアを達成しています。たとえば、YOLOv10-Sはわずか7.2Mのパラメータで46.7のmAPを達成していますが、YOLOv6-3.0sはより低い45.0のmAPに到達するために18.5Mのパラメータを必要とします。YOLOv6-3.0nはT4 GPUでわずかに高速な推論速度を示していますが、YOLOv10nはほぼ半分のパラメータで、はるかに優れた精度と効率のトレードオフを提供します。これは、最新のハードウェアに対するYOLOv10の優れたアーキテクチャ設計を示しています。
結論: どのモデルを選ぶべきか?
ほとんどの開発者や研究者にとって、YOLOv10が推奨される選択肢です。堅牢でユーザーフレンドリーなエコシステム内で、優れた精度、速度、効率の組み合わせを提供します。NMSフリー設計は、展開を簡素化し、パフォーマンスを向上させる真のエンドツーエンドソリューションであり、エッジからクラウドまで、幅広いアプリケーションに最適です。Ultralyticsツールとのシームレスな統合は、使いやすさ、アクティブなメンテナンス、包括的なサポートの点で大きな利点を提供します。
YOLOv6-3.0は、特に特定のハードウェア最適化が有益な産業用アプリケーションにおいては、依然として有能なモデルです。ただし、その焦点は狭く、Ultralyticsモデルが提供する多様性と合理化されたエコシステムがありません。
他の最先端モデルの調査に関心のある方のために、Ultralytics は、非常に汎用性の高いYOLOv8や最新のYOLO11を含む、さまざまなオプションを提供しています。また、プロジェクトに最適な決定を下せるように、YOLOv10 と YOLOv8やYOLOv9 と YOLOv8のような、より詳細な比較も見つけることができます。