YOLOv10 vs. YOLOv5: 詳細な技術比較
適切な物体検出モデルの選択は、あらゆるコンピュータビジョンプロジェクトにとって非常に重要であり、パフォーマンスはアプリケーションの成功に直接影響します。You Only Look Once (YOLO)モデルファミリーは、その速度と精度で知られています。このページでは、清華大学の最先端モデルであるYOLOv10と、汎用性が高く広く採用されている業界標準であるUltralytics YOLOv5の詳細な技術比較を提供します。この分析は、開発者や研究者が特定のニーズに基づいて情報に基づいた意思決定を行うのに役立ちます。
YOLOv10:最先端のリアルタイム検出器
YOLOv10は、Non-Maximum Suppression(NMS)ポストプロセッシングの必要性を排除することにより、真のエンドツーエンド効率の達成に焦点を当てた、リアルタイムオブジェクト検出における重要な進歩を表しています。
技術詳細:
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織: 清華大学
- Date: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- ドキュメント: https://docs.ultralytics.com/models/yolov10/
アーキテクチャと主な機能
YOLOv10は、速度と精度のトレードオフの限界を押し広げるために、いくつかのアーキテクチャの革新を導入しています。arXiv論文で詳しく説明されているように、そのコア機能には以下が含まれます。
- NMS不要の学習: 学習中に一貫した二重割り当てを採用しており、モデルはNMSステップなしでクリーンな予測を生成できます。このイノベーションは、デプロイメントパイプラインを簡素化し、多くのリアルタイムシステムにおける重要なボトルネックである推論レイテンシを削減します。
- 全体的な効率と精度の設計: モデルアーキテクチャは、バックボーンからネック、ヘッドまで包括的に最適化されました。これには、軽量な分類ヘッドと空間チャネル分離ダウンサンプリングが含まれており、計算の冗長性を低減し、モデルの能力を向上させます。
- Anchor-Free Detection: 多くの最新の検出器と同様に、YOLOv10はアンカーフリーアプローチを使用しており、アーキテクチャを簡素化し、多様なオブジェクトサイズとアスペクト比にわたる汎化を改善します。
長所と短所
長所:
- 優れた速度と効率性: リアルタイム推論に最適化されており、低遅延が求められる場合に不可欠な、より高速な処理を提供します。
- NMSフリーアーキテクチャ: NMSポストプロセッシングを排除し、デプロイメントを簡素化し、全体的な推論時間を短縮します。
- 少ないパラメータで高精度: より小さなモデルサイズで競争力のある精度を実現し、リソースに制約のある環境へのデプロイに最適です。
- End-to-End Deployment: シームレスなエンドツーエンドのデプロイメントのために設計されており、これは本番システムにとって大きな利点です。
- Ultralyticsの統合: 外部で開発されましたが、YOLOv10はUltralyticsエコシステムに適切に統合されており、トレーニング、検証、および推論のためのシンプルなPythonおよびCLIインターフェースの恩恵を受けています。
弱点:
- 新しいモデル: 最近リリースされたモデルであるため、そのコミュニティサポートとサードパーティの統合の数は、YOLOv5などの確立されたモデルと比較してまだ発展している可能性があります。
- 最適化の複雑さ: ピークパフォーマンスを達成するには、特定のハードウェアおよびデータセットに対して特定の微調整と最適化が必要になる場合があります。これは、より成熟したモデルよりも複雑になる可能性があります。
ユースケース
YOLOv10は、超高速で効率的なオブジェクト検出を必要とするアプリケーションに優れています。
- 高速ロボティクス: ダイナミックな環境におけるロボットのリアルタイム視覚処理を可能にし、ロボティクスの未来における重要な要素となります。
- 先進運転支援システム(ADAS): 道路安全を強化するための迅速な物体検出を提供し、自動運転車におけるAIのようなソリューションを補完します。
- リアルタイムビデオ分析: 高フレームレートのビデオを処理して即座に洞察を得ることができ、交通管理などのアプリケーションに役立ちます。
Ultralytics YOLOv5:汎用性が高く、広く採用されているモデル
Ultralytics YOLOv5は、その優れたスピード、精度、そして驚くほどの使いやすさで知られる業界標準となっています。リリース以来、数千人の開発者や研究者にとって頼りになるモデルとなっています。
技術詳細:
- 著者: Glenn Jocher
- 組織: Ultralytics
- Date: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Docs: https://docs.ultralytics.com/models/yolov5/
アーキテクチャと主な機能
PyTorch上に構築されたYOLOv5は、特徴集約のためにCSPDarknet53バックボーンとPANetネックを利用しています。そのアーキテクチャは高度にスケーラブルであり、さまざまな計算予算に合わせてさまざまなサイズ(n、s、m、l、x)で提供されます。その人気の主な理由は、Ultralyticsが提供する合理化されたユーザーエクスペリエンスであり、これには以下が含まれます。
- シンプルで一貫性のある API: トレーニング、検証、および推論のための簡単なインターフェース。
- 豊富なドキュメント: カスタムデータのトレーニングからデプロイメントまで、すべてを網羅した包括的なガイドとチュートリアル。
- 統合されたエコシステム: コード不要のトレーニングとMLOps管理のためのUltralytics HUBなどのツールを含む、Ultralyticsエコシステム内での完全なサポート。
長所と短所
長所:
- 卓越した使いやすさ: シンプルなAPI、包括的なドキュメント、シームレスな統合で知られており、初心者から専門家まで非常にアクセスしやすくなっています。
- 成熟した堅牢なエコシステム: 大規模で活発なコミュニティ、頻繁なアップデート、すぐに利用できる事前トレーニング済みの重み、および豊富なリソースから恩恵を受けています。
- パフォーマンスのバランス: 速度と精度の間で優れたトレードオフを提供し、幅広い現実世界のアプリケーションにとって実用的な選択肢となります。
- 学習効率: 効率的な学習プロセス、多くの複雑なアーキテクチャと比較して低いメモリ要件、事前学習済みウェイトによる高速な収束で知られています。
- 多様性: インスタンスセグメンテーションや画像分類など、物体検出以外の複数のタスクをサポートします。
弱点:
- Anchor-Based Detection: アンカーボックスに依存しており、型破りなオブジェクトの形状を持つデータセットで最適なパフォーマンスを得るには、調整が必要になる場合があります。
- 精度に関するトレードオフ: 非常に高性能ではあるものの、小型のYOLOv5モデルは速度を優先し、YOLOv10のような新しいアーキテクチャは、標準的なベンチマークでより高いmAPスコアを達成できます。
ユースケース
YOLOv5の汎用性と効率性により、非常に多くの分野に適しています。
- エッジコンピューティング: 高速性と小型モデルサイズにより、Raspberry PiやNVIDIA Jetsonのようなデバイスへの実装に最適です。
- 産業オートメーション: 製造業における品質管理やプロセス自動化に広く利用されています。
- セキュリティと監視: セキュリティシステムおよび公共安全アプリケーションでのリアルタイム監視に最適です。
- モバイルアプリケーション: リソース消費が重要な懸念事項であるオンデバイスオブジェクト検出タスクに適しています。
直接対決: パフォーマンスの内訳
以下の表は、COCOデータセットでベンチマークされた、さまざまなYOLOv10およびYOLOv5モデルバリアントの詳細な比較を示しています。この指標は、精度(mAP)、推論速度、およびモデルの複雑さ(パラメータとFLOP)の間のトレードオフを強調しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.20 | 56.9 | 160.4 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
データから、YOLOv10モデルは、YOLOv5モデルと比較して、パラメータ数とFLOPsが大幅に少ないにもかかわらず、一貫して高いmAPスコアを達成していることが明らかです。たとえば、YOLOv10-Sは、YOLOv5-mよりも精度が高く(46.7対45.4 mAP)、パラメータ数はおよそ3分の1です。これは、YOLOv10の優れたアーキテクチャ効率を示しています。
しかし、Ultralytics YOLOv5は、特に特定のハードウェアでの推論速度に関して、依然として強力な地位を維持しています。YOLOv5nモデルは、CPUとT4 GPUの両方で驚くべき速度を示し、1ミリ秒が重要な意味を持ち、リソースが非常に限られているアプリケーションにとって優れた選択肢となります。
結論: どのモデルを選ぶべきか?
YOLOv10とUltralytics YOLOv5はいずれも優れたモデルですが、それぞれ異なる優先順位に対応しています。
YOLOv10は、パフォーマンスと効率の限界を押し広げる必要のある開発者や研究者にとって理想的な選択肢です。そのNMSフリーのアーキテクチャは、遅延が重要なアプリケーションにおいて明確な利点を提供し、より小さなモデルフットプリントで高い精度を実現できることは、エッジデバイスへの展開にとって革新的なことです。プロジェクトで最高の速度と精度のトレードオフが求められ、比較的新しい進化し続けるモデルに抵抗がない場合、YOLOv10は魅力的な選択肢となります。
Ultralytics YOLOv5は、特に使いやすさ、迅速な開発、安定した、十分にサポートされたエコシステムを優先する大多数のユーザーにとって、推奨される選択肢であり続けています。実績、豊富なドキュメント、Ultralytics HUBのようなツールとのシームレスな統合により、非常にアクセスしやすくなっています。パフォーマンスの優れたバランスを備えた、信頼性が高く、汎用性が高く、デプロイが容易なモデルを必要とするプロジェクトにとって、YOLOv5は傑出した信頼できる選択肢です。
最終的に、決定はプロジェクトの具体的な制約と目標によって異なります。最先端の効率を求めるなら、YOLOv10をご検討ください。堅牢でユーザーフレンドリー、かつ汎用性の高いソリューションをお探しなら、Ultralytics YOLOv5が最適です。
その他の YOLO モデルを調べる
YOLO の状況は常に進化しています。YOLOv10 と YOLOv5 を超えて探求することに興味がある方のために、Ultralytics はさまざまな強力なモデルを提供しています。複数のビジョンタスクをサポートし、パフォーマンスと多様性の優れたバランスを提供するUltralytics YOLOv8、または最新のYOLO11を検討して、最先端の結果を得てください。
ニーズに最適なモデルを選択できるように、さらに比較をご利用いただけます。