YOLO11 vs YOLOv10:詳細な技術比較
最適な物体検出モデルの選択は、精度、速度、およびデプロイメントの制約のバランスを取る上で重要な決定です。このページでは、コンピュータビジョンの最前線にある2つの強力なモデルであるUltralytics YOLO11とYOLOv10の包括的な技術比較を提供します。YOLOv10は注目すべき効率向上をもたらしましたが、Ultralytics YOLO11はYOLOアーキテクチャの頂点を表しており、優れたパフォーマンス、比類のない汎用性、そして成熟した、十分にメンテナンスされたエコシステムという大きな利点を提供します。
Ultralytics YOLO11:最新の最先端技術
Ultralytics YOLO11は、Ultralytics YOLOシリーズの最新かつ最先端のモデルであり、リアルタイムオブジェクト検出の新たなベンチマークを打ち立てています。非常に成功したYOLOv5およびYOLOv8モデルの作成者によって作成されたYOLO11は、最大の精度、速度、および汎用性を実現するように設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は実績のあるアーキテクチャ基盤の上に構築されており、洗練された特徴抽出ネットワークと最適化された検出ヘッドを組み込むことで、最先端の精度を実現します。YOLO11の重要な強みは、その驚くべき汎用性です。特殊なモデルとは異なり、これはマルチタスクの強力なツールであり、単一の統合フレームワーク内で、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および指向性バウンディングボックス(OBB)をネイティブにサポートします。
この多様性は、Ultralyticsの堅牢なエコシステムによって支えられており、使いやすさと開発者の生産性を優先しています。シンプルなPython APIとCLI、広範なドキュメント、およびUltralytics HUBのようなツールとのシームレスな統合により、開発者はこれまで以上に迅速にコンセプトからデプロイメントに移行できます。このモデルは、効率的なトレーニングプロセス、すぐに利用できる事前トレーニング済みの重み、およびTransformerのようなより複雑なアーキテクチャと比較してより低いメモリ要件の恩恵を受けています。
長所
- 優れたパフォーマンスバランス: 速度と精度の並外れたトレードオフを実現し、さまざまなハードウェアプラットフォームで他のモデルを上回ります。
- 比類なき汎用性: 単一のモデルファミリーが5つの主要なビジョンAIタスクを処理し、複雑なアプリケーションの開発を簡素化します。
- 充実したエコシステム: 活発な開発、大規模なコミュニティ、頻繁なアップデート、そして信頼性とサポートを保証する包括的なリソースによって支えられています。
- 使いやすさ: ユーザーエクスペリエンスが効率化されるように設計されており、初心者から専門家まで、最小限の労力でモデルの学習とデプロイが可能です。
- Training and Deployment Efficiency: より高速なトレーニング時間とより低いメモリ使用量のために最適化されており、エッジデバイスからクラウドサーバーまで、幅広いハードウェアに適しています。
弱点
- 最先端のモデルとして、最大のYOLO11バリアントは、最大の精度を達成するためにかなりの計算リソースを必要としますが、そのパフォーマンスクラスに対して非常に効率的です。
理想的なユースケース
YOLO11は、高い性能と汎用性を兼ね備えているため、幅広い要求の厳しいアプリケーションに最適です。
- 産業オートメーション: 高精度による品質管理とコンベアベルトの自動化を強化。
- スマートシティ: 高度な交通管理と公共安全監視を可能にします。
- Healthcare: より迅速な診断のために、医療画像解析を支援します。
- 小売業: 在庫管理の最適化と顧客分析の強化。
YOLOv10:効率の限界を押し広げる
清華大学の研究者によって発表されたYOLOv10は、ポストプロセッシング中のNon-Maximum Suppression(NMS)の必要性を排除することにより、エンドツーエンドのレイテンシを最適化することに焦点を当てた物体検出モデルです。
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織: 清華大学
- Date: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- ドキュメント: https://docs.ultralytics.com/models/yolov10/
アーキテクチャと主な機能
YOLOv10の核となる革新は、NMSフリーのトレーニング戦略です。これは、トレーニング中に冗長な予測を処理するために一貫したデュアル割り当てを使用します。これにより、モデルをNMSステップなしでデプロイできるため、後処理のオーバーヘッドが削減され、推論レイテンシが向上します。このアーキテクチャはまた、計算負荷を軽減するための軽量な分類ヘッドなどの最適化を備えた、全体的な効率と精度を重視した設計を特徴としています。
長所
- NMSフリーデプロイメント: 主要なポストプロセッシングのボトルネックを排除し、レイテンシが重要なアプリケーションに役立ちます。
- 高い効率性: FLOPsとパラメータ数の点で優れた性能を発揮し、リソース制約のある環境に適しています。
- 優れた遅延時間と精度のトレードオフ: GPU上で非常に低い推論時間で、競争力のある精度を達成します。
弱点
- 汎用性の制限: YOLOv10は主に物体検出用に設計されており、YOLO11で標準となっているセグメンテーション、姿勢推定、分類に対する組み込みのマルチタスク機能がありません。
- エコシステムとサポート: 学術機関の研究主導型モデルであるため、Ultralyticsエコシステム内のモデルと同じレベルの継続的なメンテナンス、コミュニティサポート、または統合ツールがありません。
- ユーザビリティ: YOLOv10を本番パイプラインに統合するには、Ultralyticsが提供する合理化されたエクスペリエンスと比較して、より多くの手作業が必要になる場合があります。
理想的なユースケース
YOLOv10は、オブジェクト検出のエンドツーエンドのレイテンシが最も重要な要素となる特殊な用途に最適です。
- エッジAI: 1ミリ秒が重要な、計算能力が限られたデバイスへの展開。
- 高スループットシステム: 1秒あたりのフレーム数を大量に処理する必要があるリアルタイムビデオ分析などのアプリケーション。
- 自律型ドローン: ナビゲーションと障害物回避のための迅速な物体検出を可能にします。
性能対決:YOLO11 vs. YOLOv10
パフォーマンスを比較すると、どちらのモデルも非常に有能ですが、YOLO11は全体的に優れたバランスを示しています。以下の表に示すように、YOLO11モデルは、特定の精度レベルに対して、CPUとGPUの両方で一貫して高速な推論速度を達成しています。たとえば、YOLO11lはYOLOv10lよりも高いmAPを達成しながら、T4 GPU上で大幅に高速です。さらに、YOLO11xは、より高速な推論速度でYOLOv10xよりも高いmAPに到達します。
YOLOv10 は優れたパラメータ効率を示していますが、YOLO11 のアーキテクチャ最適化は、特にマルチタスク機能とデプロイの容易さを考慮すると、より優れた実際のパフォーマンスを提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
結論: どのモデルを選ぶべきか?
圧倒的多数の開発者、研究者、および企業にとって、Ultralytics YOLO11が推奨される選択肢です。最先端の精度と速度を提供し、複数のコンピュータビジョンタスクに取り組むための比類のない汎用性と組み合わされています。主な利点は、堅牢で適切にメンテナンスされたエコシステムにあり、使いやすさ、効率的なトレーニング、および生産へのスムーズなパスを保証します。この全体的なアプローチにより、YOLO11は単なる強力なモデルではなく、高度なAIシステムを構築するための完全なソリューションとなっています。
YOLOv10は、革新的なNMSフリー設計を備えた優れたモデルであり、高度に専門化された、レイテンシに敏感な物体検出タスクに最適な選択肢です。ただし、その狭い焦点と包括的なサポートエコシステムの欠如により、汎用的な使用や、追加のビジョン機能を必要とする可能性のあるプロジェクトにはあまり適していません。
他の最先端モデルの調査に関心がある場合は、YOLO11 vs. YOLOv9やYOLOv8 vs. YOLOv10など、ドキュメントでより多くの比較をご覧いただけます。