YOLO11 vs YOLOv7:詳細な技術比較
最適な物体検出モデルを選択するには、さまざまなアーキテクチャの特定の機能とトレードオフを理解する必要があります。このページでは、YOLOの系統における2つの強力なモデルであるUltralytics YOLO11とYOLOv7の技術比較を提供します。コンピュータビジョンプロジェクトに最適な選択を行うのに役立つように、アーキテクチャの違い、パフォーマンスベンチマーク、および理想的なユースケースについて詳しく説明します。YOLOv7はリアルタイム検出における重要な前進でしたが、Ultralytics YOLO11は現在の最先端技術を表しており、優れたパフォーマンス、より優れた汎用性、およびより合理化された開発者エクスペリエンスを提供します。
YOLOv7:効率的かつ正確なオブジェクト検出
YOLOv7は、推論コストを増加させることなく、トレーニング効率と精度を最適化することに重点を置いた、リアルタイム物体検出における主要な進歩として発表されました。
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- Date: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- ドキュメント: https://docs.ultralytics.com/models/yolov7/
アーキテクチャと主な機能
YOLOv7 は、いくつかの重要な技術革新を導入することで、従来の YOLO アーキテクチャを基に構築されています。Extended Efficient Layer Aggregation Networks (E-ELAN) などの技術や、連結ベースのモデルに最適化されたモデルスケーリング手法を採用しています。主な貢献として、「trainable bag-of-freebies」の概念があり、これは、推論時の計算量を増やすことなく、最終的なモデル精度を向上させるために、トレーニング中に適用される最適化戦略(補助ヘッドや粗から密へのガイダンスなど)を含みます。YOLOv7 は主に物体検出に焦点を当てていますが、姿勢推定などのタスクのためのコミュニティ拡張機能があります。
パフォーマンス指標とユースケース
YOLOv7はリリースされると、最先端のパフォーマンスを発揮し、速度と精度の間で説得力のあるバランスを提供しました。たとえば、YOLOv7xモデルは、640の画像サイズでMS COCOデータセットで53.1%のmAPtestを達成しています。その効率性により、高度なセキュリティシステムや、迅速かつ正確な検出を必要とする自律システムなどのリアルタイムアプリケーションに適しています。
長所
- High Accuracy and Speed Balance: リアルタイムタスクのために、mAPと推論速度の強力な組み合わせを提供します。
- 効率的な学習: 高度な学習テクニック("bag-of-freebies")を利用して、推論コストを増加させることなく精度を向上させます。
- 確立されたパフォーマンス: MS COCOのような標準的なベンチマークで実績のある結果。
弱点
- 複雑さ: アーキテクチャとトレーニング技術は、完全に把握し最適化することが複雑になる可能性があります。
- リソース集約的: 大規模なYOLOv7モデルは、学習にかなりのGPUリソースを必要とします。
- 限定的なタスクの多様性: 主に物体検出に焦点が当てられており、YOLO11のような統合モデルと比較して、セグメンテーションや分類などの他のタスクには個別の実装が必要です。
- 分断されたエコシステム: Ultralyticsのエコシステムに見られる統一されたフレームワーク、広範なドキュメント、活発なメンテナンスがありません。
Ultralytics YOLO11:最先端の効率と汎用性
Ultralytics YOLO11は、UltralyticsのGlenn JocherとJing Qiuによって作成され、YOLOシリーズの最新の進化を代表するものです。2024年9月27日にリリースされ、優れた精度、強化された効率、およびユーザーフレンドリーなフレームワーク内でのより広範なタスクの汎用性を実現するように設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11のアーキテクチャは、高度な特徴抽出技術と効率化されたネットワーク設計を組み込んでおり、YOLOv8やYOLOv7などの従来のモデルと比較して、多くの場合、高い精度を実現し、パラメータ数を削減しています。この最適化により、推論速度が向上し、計算需要が軽減されるため、エッジデバイスからクラウドインフラストラクチャまで、多様なプラットフォームへの展開に不可欠です。
YOLO11の主な利点は、その汎用性です。これは、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、傾斜バウンディングボックス(OBB)をネイティブにサポートするマルチタスクモデルです。Ultralyticsエコシステムにシームレスに統合され、シンプルなPythonおよびCLIインターフェース、広範なドキュメント、効率的なトレーニングのためにすぐに利用できる事前トレーニング済みの重みにより、合理化されたユーザーエクスペリエンスを提供します。
長所
- 最先端のパフォーマンス: より効率的なアーキテクチャで、より高いmAPスコアを達成します。
- 優れた効率性: CPUとGPUの両方で優れた速度を発揮し、同等の精度に対してYOLOv7よりもパラメータとFLOPが大幅に少なくなっています。
- 比類なき汎用性: 単一の統合フレームワークで、検出、セグメンテーション、分類、ポーズ、OBBをネイティブにサポートします。
- 使いやすさ: シンプルなAPI、包括的なドキュメント、およびノーコード学習とデプロイのためのUltralytics HUBのようなツールとのシームレスな統合が特徴です。
- 優れた維持管理体制のエコシステム: 活発な開発、強力なコミュニティ、頻繁なアップデート、豊富なリソースの恩恵を受けています。
- メモリ効率: 学習および推論中のメモリ使用量を削減するように設計されており、他のアーキテクチャよりもアクセスしやすくなっています。
弱点
- より新しいモデルとして、いくつかのニッチなサードパーティツールとの統合は、より古く、より確立されたモデルと比較して、まだ開発中である可能性があります。
- 最大のモデルは、非常に高精度ですが、トレーニングとデプロイメントには依然としてかなりの計算リソースを必要とする場合があります。
性能の直接対決:YOLO11 vs. YOLOv7
パフォーマンス指標を直接比較すると、Ultralytics YOLO11の利点が明確になります。これらのモデルは、全体的に精度と効率のより良いトレードオフを提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
表から、いくつかの重要な洞察が得られます。
- 精度と効率: YOLO11lは、YOLOv7x(53.1)よりも高いmAP(53.4)を達成しながら、パラメータ数(25.3M対71.3M)とFLOPs(86.9B対189.9B)を大幅に削減しています。
- 推論速度: YOLO11モデルは、特にTensorRTを使用したGPUで大幅に高速です。YOLO11lは、T4 GPUでYOLOv7xのほぼ2倍の速さです。さらに、YOLO11はONNXを介して堅牢なCPUパフォーマンスベンチマークを提供します。これは、YOLOv7データが利用できない多くの実際のデプロイメントにとって重要な指標です。
- スケーラビリティ: YOLO11ファミリーは、軽量なYOLO11n(1.5 msの遅延)から高精度のYOLO11x(54.7 mAP)まで、より広範で効率的なモデルを提供し、開発者は特定のニーズに最適なバランスを見つけることができます。
Ultralytics YOLO11を選ぶ理由
YOLOv7はその時代において強力なモデルでしたが、Ultralytics YOLO11は現代のコンピュータビジョンプロジェクトにとって明確な選択肢です。精度や速度などの主要な指標でYOLOv7を上回るだけでなく、非常に優れたユーザーエクスペリエンスと、より包括的な機能セットを提供します。
YOLO11を選択する主な利点は次のとおりです。
- 統合フレームワーク: 複数のビジョンタスクに対応する、単一の使いやすいパッケージで、異なるリポジトリや環境を使い分ける必要がありません。
- 活発な開発とサポート: 活発にメンテナンスされているUltralyticsエコシステムの一部として、YOLO11は継続的なアップデート、バグ修正、および大規模なコミュニティとコア開発チームからのサポートを受けています。
- 製品レベルの準備: 効率性、デプロイの容易さ、堅牢なツールに重点を置いているYOLO11は、プロトタイピングから大規模な本番環境まで、実際のアプリケーション向けに構築されています。
- 将来性: YOLO11を採用することで、開発者はオブジェクト検出研究の最先端に立ち、Ultralyticsからの継続的なイノベーションの恩恵を受けることができます。
堅牢なエコシステムに支えられた、最新の汎用性の高い高性能モデルを求める開発者にとって、Ultralytics YOLO11は決定的な選択肢です。
その他のモデル比較
さらに検討を深めるには、YOLOv7、YOLO11、およびその他の関連モデルを含むこれらの比較をご検討ください。
- YOLO11 vs YOLOv8
- YOLOv7 対 YOLOv8
- YOLOv7 vs YOLOv6
- RT-DETR vs YOLOv7
- YOLOv10のような最新モデルや、その他の比較については、メイン比較ページをご覧ください。