YOLOv10 vs YOLOv8:オブジェクト検出に関する技術比較
適切な物体検出モデルの選択は、あらゆるコンピュータビジョンプロジェクトの成功にとって非常に重要です。このページでは、この分野の2つの最先端モデルであるYOLOv10とUltralytics YOLOv8の詳細な技術比較を提供します。速度、精度、リソース効率に関する特定のニーズに基づいて情報に基づいた意思決定を行うのに役立つように、アーキテクチャの違い、パフォーマンス指標、および理想的なアプリケーションを分析します。
YOLOv10:効率性の限界を押し広げる
Authors: Ao Wang, Hui Chen, Lihao Liu, et al.
Organization: Tsinghua University
Date: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Docs: https://docs.ultralytics.com/models/yolov10/
YOLOv10は、2024年5月に発表され、真のエンドツーエンドのリアルタイム物体検出の実現に向けた重要な一歩となります。その主なイノベーションは、後処理のボトルネックを排除し、効率を最大化するためにモデルアーキテクチャを最適化することに重点を置いていることです。主な機能は、一貫したデュアルアサインメントを使用してNon-Maximum Suppression (NMS)の必要性を排除し、それによって推論遅延を削減するNMSフリーのトレーニングアプローチです。
アーキテクチャと主な機能
YOLOv10は、全体的な効率と精度を重視したモデル設計を導入しています。軽量な分類ヘッドの実装や、空間チャネル分離ダウンサンプリングの使用など、さまざまなコンポーネントを最適化して、計算の冗長性を減らし、検出能力を高めています。清華大学によって開発されましたが、YOLOv10はUltralyticsフレームワーク上に構築され、統合されているため、使い慣れたUltralytics APIでアクセスしやすく、使いやすくなっています。
長所
- 効率性の向上: 直接比較において、より高速な推論速度とより小さなモデルサイズを提供し、エッジデバイスのようなリソースが限られた環境に非常に有益です。
- NMS不要の設計: NMSのポストプロセスステップを排除することで、デプロイメントパイプラインを簡素化し、エンドツーエンドのレイテンシを低減します。
- 最先端のパフォーマンス: 特にレイテンシに重点を置いたベンチマークで優れたパフォーマンスを達成し、速度と精度のトレードオフの最先端を押し広げています。
弱点
- Newer Model: 最新のリリースであるため、確立されたYOLOv8と比較して、コミュニティが小さく、サードパーティの統合が少なくなっています。
- タスクの特化: YOLOv10は主に物体検出に焦点が当てられています。セグメンテーションや姿勢推定のような他のビジョンタスクに対する組み込みの汎用性がありません。これらのタスクはYOLOv8にネイティブに備わっています。
- エコシステムの成熟度: Ultralyticsエコシステムに統合されていますが、YOLOv8ほどの豊富なリソースとコミュニティ主導の例はまだありません。
理想的なユースケース
YOLOv10は、リアルタイム性能とリソース効率が最優先事項であるアプリケーションに特に適しています。
- エッジAI: 携帯電話やNVIDIA Jetsonのような組み込みシステムなど、計算能力が限られたデバイスへの展開に最適です。
- 高速処理: 自律型ドローンやロボティクスなど、非常に低い遅延を必要とするアプリケーションに適しています。
- リアルタイム分析: 交通管理など、即時のオブジェクト検出を必要とするペースの速い環境に最適です。
Ultralytics YOLOv8:多用途性と成熟度
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8は、2023年1月に発表され、成熟した汎用性の高いモデルであり、YOLOの前身の強みを基盤としています。幅広いビジョンAIタスクにわたる速度、精度、そして使いやすさのために設計されています。これにより、開発者と研究者の両方にとって、強力で信頼性の高い選択肢となっています。
アーキテクチャと主な機能
YOLOv8は、アンカーフリーの検出アプローチを特徴としており、モデルアーキテクチャを簡素化し、汎化性能を向上させます。柔軟なバックボーンと最適化された損失関数が、より高い精度とより安定したトレーニングに貢献します。YOLOv8の際立った特徴は、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および向き付きバウンディングボックス(OBB)を含む、複数のビジョンタスクに対するネイティブサポートです。
長所
- 成熟しており、ドキュメントが充実: 広範なドキュメント、大規模なコミュニティ、およびすぐに利用できるリソースから恩恵を受け、シンプルな Python および CLI インターフェースを介してユーザーフレンドリーで実装が容易になっています。
- 多用途かつマルチタスク: 幅広いビジョンタスクをすぐにサポートし、検出以上のものを必要とする複雑なプロジェクトに比類のない柔軟性を提供します。
- 優れたメンテナンス体制: Ultralytics HUBや他のMLOpsツールとシームレスに統合され、トレーニングからデプロイメントまでのワークフローを効率化します。活発な開発と頻繁なアップデートによって支えられています。
- パフォーマンスのバランス: 幅広い現実世界の展開シナリオに適した、速度、精度、モデルサイズの優れたトレードオフを提供します。
- 学習効率: 効率的な学習プロセスと、すぐに利用できる事前学習済みウェイトを提供し、開発サイクルを加速します。また、他の多くのアーキテクチャ、特にTransformerベースのモデルと比較して、メモリ要件が低くなります。
弱点
- 非常に効率的ですが、YOLOv10のような新しいモデルは、極めて制約の厳しいシナリオにおいて、パラメータ数や遅延時間などの特定の指標でわずかな改善をもたらす可能性があります。
理想的なユースケース
YOLOv8は、汎用性と使いやすさにより、幅広い用途に最適な選択肢です。
- セキュリティシステム: セキュリティアラームシステムにおけるリアルタイムのオブジェクト検出に最適です。
- 小売分析: スマートリテールにおいて、顧客行動と在庫管理の理解に役立ちます。
- 産業品質管理: 自動化された外観検査のために製造業で適用できます。
- マルチタスクプロジェクト: 単一の効率的なモデルから検出、セグメンテーション、およびポーズ推定を同時に必要とするプロジェクトに最適です。
性能分析:YOLOv10 vs. YOLOv8
COCOデータセットでの性能指標は、2つのモデル間の主な違いを明らかにしています。YOLOv10は、同様のサイズのYOLOv8モデルと比較して、より少ないパラメータとFLOPsで、一貫して高いmAPスコアを達成しています。例えば、YOLOv10-Sは7.2Mのパラメータで46.7%のmAPを達成し、YOLOv8-Sは11.2Mのパラメータで44.9%のmAPを達成しています。これは、YOLOv10の優れたアーキテクチャ効率を強調しています。
しかし、YOLOv8は、特にGPUにおいて、非常に競争力のある推論速度を維持しています。最小のモデルであるYOLOv8nは、TensorRTを搭載したT4 GPUでYOLOv10nよりもわずかに高速です(1.47ms対1.56ms)。さらに、YOLOv8は、確立されたCPUベンチマークの完全なスイートを提供し、GPUアクセスがない可能性のあるデプロイメントに対して、堅牢で信頼性の高いパフォーマンスを実証しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
結論と推奨事項
YOLOv10とYOLOv8はいずれも強力なモデルですが、それぞれ異なる優先順位に対応しています。YOLOv10は純粋な効率に優れており、より低いレイテンシとより少ないパラメータで最先端のパフォーマンスを提供し、特殊な、レイテンシが重要なアプリケーションにとって優れた選択肢となります。
しかし、圧倒的多数の開発者と研究者にとって、Ultralytics YOLOv8 が推奨される選択肢です。その主な利点は、成熟度、汎用性、堅牢なエコシステムにあります。YOLOv8 は、複数のタスク(検出、セグメンテーション、ポーズ、分類、OBB)をネイティブにサポートしているため、複雑で多面的な AI ソリューションを構築する上で大きなメリットとなります。広範なドキュメント、活発なコミュニティ、Ultralytics HUBのようなツールとのシームレスな統合により、優れた、より効率的な開発体験が実現します。最も幅広い実世界のアプリケーションに対応できる、速度と精度の卓越した実績のあるバランスを提供します。
その他のモデルについて
他の最先端モデルの検討にご興味のある方には、Ultralyticsは、基礎となるYOLOv5、効率的なYOLOv9、最新のYOLO11など、包括的なスイートを提供しています。YOLOv9 vs. YOLOv8やYOLOv5 vs. YOLOv8などの詳細な比較も、プロジェクトに最適なモデルを選択するのに役立ちます。