YOLOv5 vs. YOLOv10:詳細な技術比較
適切な物体検出モデルの選択は、アプリケーションのパフォーマンス、速度、リソース要件に直接影響するため、あらゆるコンピュータビジョンプロジェクトにとって重要な決定です。このページでは、2つの画期的なモデル、確立され広く採用されている業界標準のUltralytics YOLOv5と、リアルタイム効率の限界を押し広げる最先端のモデルであるYOLOv10との詳細な技術的比較を提供します。この分析では、アーキテクチャの違い、パフォーマンス指標、理想的なユースケースを検証し、情報に基づいた選択ができるよう支援します。
Ultralytics YOLOv5:確立された汎用性の高い標準
Ultralytics YOLOv5は、その卓越したスピード、精度、そして比類のない使いやすさで評価され、業界のベンチマークとなっています。リリース以来、さまざまな分野で数え切れないほどのアプリケーションを支えてきました。
技術詳細:
- 著者: Glenn Jocher
- 組織: Ultralytics
- Date: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Docs: https://docs.ultralytics.com/models/yolov5/
アーキテクチャと主な機能
PyTorchで開発されたYOLOv5は、堅牢な特徴集約のためのCSPDarknet53バックボーンとPANetネックを備えた柔軟なアーキテクチャを特徴としています。そのアンカーベースの検出ヘッドは非常に効率的です。その特徴の1つはスケーラビリティであり、多様な計算予算とパフォーマンスニーズに対応するために、さまざまなモデルサイズ(n、s、m、l、x)を提供します。
長所
- 卓越した速度と効率性: YOLOv5は高速な推論のために高度に最適化されており、CPUとGPU両方のハードウェアでのリアルタイムシステムに最適な選択肢となっています。
- 使いやすさ: YOLOv5はその効率的なユーザーエクスペリエンス、シンプルなPython API、および広範なドキュメントで知られており、高度なコンピュータビジョンソリューションの開発への参入障壁を大幅に下げています。
- 充実したエコシステム: Ultralyticsモデルとして、これは大規模で活発なコミュニティ、頻繁なアップデート、そしてノーコードトレーニングとデプロイメントのためのUltralytics HUBのようなツールとのシームレスな統合の恩恵を受けています。
- 多様性: YOLOv5は物体検出だけのものではありません。インスタンスセグメンテーションや画像分類もサポートしており、さまざまなビジョンタスクに対応できる汎用性の高いツールとなっています。
- 学習効率: このモデルは、すぐに利用できる事前学習済みのウェイトを備えた効率的な学習プロセスを提供し、一般的に、より複雑なアーキテクチャと比較して、学習に必要なメモリが少なくなります。
弱点
- Anchor-Based Detection: 事前に定義されたアンカーボックスに依存しているため、最新のアンカーフリー検出器と比較して、型破りなオブジェクトの形状またはサイズを持つデータセットで最適なパフォーマンスを達成するには、追加の調整が必要になる場合があります。
- 精度 vs. より新しいモデル: 高い精度を誇りますが、YOLOv10のようなより新しいアーキテクチャは、mAPにおいてCOCOのような標準的なベンチマークを上回っています。
ユースケース
YOLOv5の汎用性と効率性により、多くのアプリケーションにとって信頼できる主力製品となっています。
- エッジコンピューティング: 小型バリアントは、Raspberry PiやNVIDIA Jetsonのようなリソース制約のあるデバイスへの実装に最適です。
- 産業オートメーション: 製造業における品質管理やプロセス自動化に広く利用されています。
- セキュリティと監視: セキュリティシステムおよび公共安全アプリケーションでのリアルタイム監視を強化します。
- 迅速なプロトタイピング: 使いやすさにより、新しいアイデアを迅速に開発およびテストするのに理想的です。
YOLOv10:最先端のリアルタイム検出器
YOLOv10は、Non-Maximum Suppression(NMS)の必要性を排除することにより、真にエンドツーエンドの効率的なパイプラインの構築に焦点を当て、リアルタイムオブジェクト検出における大きな飛躍を遂げています。
技術詳細:
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織: 清華大学
- Date: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- ドキュメント: https://docs.ultralytics.com/models/yolov10/
アーキテクチャと主な機能
YOLOv10の核となる革新は、NMSフリーのトレーニング戦略であり、トレーニング中に競合する予測を解決するための一貫したデュアル割り当てを使用します。arXiv論文で詳述されているように、これにより、従来推論レイテンシを増加させるボトルネックとなっていたNMS後処理ステップが不要になります。さらに、YOLOv10は、全体的な効率と精度を重視したモデル設計を採用し、バックボーンやネックなどのコンポーネントを最適化して、計算の冗長性を削減しながら検出能力を向上させています。
パフォーマンス分析と比較
YOLOv10は、速度と精度のトレードオフに関する最新のベンチマークを打ち立てます。下の表は、YOLOv10モデルが、YOLOv5の対応モデルと比較して、より少ないパラメータとFLOPで一貫して高い精度を達成していることを示しています。たとえば、YOLOv10-Mは、YOLOv5-xをmAPで上回りながら、パラメータが約6分の1、FLOPが4分の1です。この驚くべき効率により、最新のアプリケーションにとって強力な候補となっています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
長所
- 優れた速度と効率性: NMSフリー設計は、推論中に大幅な速度向上をもたらし、超低レイテンシ要件を持つアプリケーションにとって不可欠です。
- 少ないパラメータで高精度: 最小限のモデルサイズで最先端の精度を実現し、リソースに制約のある環境へのデプロイに最適です。
- End-to-End Deployment: NMSを削除することで、YOLOv10はデプロイメントパイプラインを簡素化し、真のエンドツーエンドを実現します。
- Ultralyticsエコシステムとの統合: YOLOv10はUltralyticsエコシステムに完全に統合されており、他のUltralyticsモデルと同様に、使いやすさ、広範なドキュメント、およびサポートを提供します。
弱点
- 新しいモデル: 最近リリースされたモデルであるため、そのコミュニティとサードパーティツールのサポートは、YOLOv5を取り巻く広大なエコシステムと比較してまだ成長しています。
- タスクの特化: YOLOv10は主に物体検出に焦点が当てられています。セグメンテーションや姿勢推定のような複数のタスクに単一のモデルを必要とするプロジェクトの場合、YOLOv8のようなモデルの方が適しているかもしれません。
ユースケース
YOLOv10は、1ミリ秒と1パラメータが重要なアプリケーションに最適です。
- 高速ロボティクス: ダイナミックで複雑な環境で動作するロボットのために、リアルタイムの視覚処理を可能にします。
- 高度な運転支援システム(ADAS): 道路の安全性を高めるための迅速な物体検出を提供し、自動運転車向けAIの重要な要素となります。
- リアルタイムビデオ分析: 高フレームレートのビデオを処理して即座に洞察を得ることができ、交通管理などのアプリケーションに役立ちます。
結論
YOLOv5とYOLOv10はいずれも優れたモデルですが、それぞれ異なるニーズに対応しています。
Ultralytics YOLOv5は、成熟した、信頼性の高い、汎用性の高いモデルを必要とする開発者にとって、依然として最良の選択肢です。その使いやすさ、広範なドキュメント、および強力なコミュニティサポートにより、幅広いアプリケーションにわたる迅速な開発とデプロイメントに最適です。その速度と精度のバランスは、数え切れないほどの現実世界のシナリオで証明されています。
YOLOv10は、リアルタイム物体検出の未来です。その革新的なNMSフリーのアーキテクチャは、比類のない効率性を提供し、遅延が重要なアプリケーションやエッジデバイスへの展開に最適なソリューションとなっています。比較的新しいモデルですが、Ultralyticsエコシステムへの統合により、スムーズなユーザーエクスペリエンスが保証されます。
最先端のオプションを検討している方は、YOLOv8、YOLOv9、そして最新のYOLO11のような他のモデルも検討してみてください。これらのモデルは、YOLO アーキテクチャの強固な基盤の上に構築され続けています。