YOLO11 YOLOv7:物体検出の詳細な技術比較
適切な物体検出モデルを選択することは、コンピュータビジョンタスクで最適なパフォーマンスを達成するために非常に重要です。このページでは、Ultralytics YOLO11 YOLOv7、効率的で正確な物体検出のために設計された2つの高度なモデルの詳細な技術比較を提供します。それぞれのアーキテクチャのニュアンス、性能ベンチマーク、適切なアプリケーションを探求し、十分な情報に基づいた決断ができるように導きます。
Ultralytics YOLO11
Ultralytics YOLO11、Ultralytics Glenn JocherとJing Qiuが執筆し、2024-09-27にリリースされた、YOLO シリーズの最新の進化版です。物体検出の精度と効率を高めることに重点を置いており、実世界での幅広い用途に対応します。 Ultralytics YOLO11は、これまでのYOLO モデルをベースにネットワーク構造を改良し、リアルタイム性能を維持しながら最先端の検出精度を実現しました。
建築と主な特徴:
YOLO11アーキテクチャには高度な特徴抽出技術が組み込まれており、YOLOv8ようなモデルと比較して、少ないパラメータ数で高い精度を実現しています。この最適化により、推論エンジンの高速化と計算負荷の低減を実現し、エッジデバイスからクラウドインフラまで、多様なプラットフォームへの展開に適しています。YOLO11 、物体検出、インスタンス分割、画像分類、姿勢推定など、複数のコンピューター・ビジョン・タスクをサポートしている。モデルはGitHubで公開されている。
パフォーマンス メトリックとベンチマーク:
YOLO11 、異なるモデル・サイズにわたって、印象的な平均精度(mAP)スコアを示しています。例えば、YOLO11mは、640の画像サイズで51.5のmAPval50-95を達成し、速度と精度のバランスを効果的にとっています。YOLO11nやYOLO11sのような小型モデルは、スピードを優先するアプリケーション向けに、より高速なリアルタイム推論を提供し、YOLO11xのような大型モデルは精度を最大化します。YOLO 詳細な性能指標については、Ultralytics ドキュメントを参照してください。
使用例:
YOLO11 強化された精度と効率は、以下のような正確でリアルタイムの物体検出を必要とするアプリケーションに最適である:
- ロボット工学:ダイナミックな環境における正確なナビゲーションとオブジェクトの相互作用のために。
- セキュリティシステム正確な侵入検知と包括的な監視のための高度なセキュリティアラームシステム。
- リテール・アナリティクス 小売業におけるAIによる在庫管理と顧客行動の詳細な分析。
- 産業オートメーション:製造工程における厳格な品質管理と効率的な欠陥検出のために。
強みだ:
- 高精度:洗練されたアーキテクチャで最先端のmAPを実現。
- 効率的な推論:リアルタイムアプリケーションに適した高速処理
- 多彩なタスク:物体検出、セグメンテーション、分類、姿勢推定をサポート。
- スケーラビリティ:エッジデバイスからクラウドシステムまで、さまざまなハードウェアで効果的に動作します。
弱点がある:
- 大きなモデルは、スピードに最適化された小さなモデルに比べて、より多くの計算資源を要求する可能性がある。
- 特定のエッジ・デバイスに最適化するには、モデルの展開構成を追加する必要があるかもしれない。
YOLOv7
YOLOv7は、台湾中央研究院情報科学研究所のChien-Yao Wang氏、Alexey Bochkovskiy氏、Hong-Yuan Mark Liao氏によって2022年7月に発表された。YOLOv7は、arXivの論文や GitHubのリポジトリに詳述されているように、物体検出タスクにおいて高い精度を維持しながら、スピードと効率性を重視している。
建築と主な特徴:
YOLOv7は、Efficient Layer Aggregation Network (ELAN)をベースに、ネットワークの学習能力を高めるExtended-ELAN (E-ELAN)を導入している。モデルの再パラメータ化や動的なラベル割り当てなどの技術を採用し、学習効率と推論速度を向上させている。YOLOv7は、様々なアプリケーションで高性能な物体検出ができるように設計されています。
パフォーマンス メトリックとベンチマーク:
YOLOv7は、640画像サイズのCOCOデータセットで51.4%のmAPを達成し、優れた性能指標を示した。そのスピードも特筆すべきもので、ベースとなるYOLOv7モデルはバッチ1推論で161 FPSを達成している。詳細な性能ベンチマークについては、YOLOv7の公式GitHubリポジトリを参照してください。
使用例:
YOLOv7のスピードと精度のバランスは、以下のような幅広い用途に適している:
- リアルタイム物体検出:自律走行やテンポの速いビデオ分析など、迅速な検出を必要とするアプリケーションに最適。
- 高性能コンピューティング:計算リソースに余裕があり、スピードとともに高い精度が優先される環境に適しています。
- 研究開発:物体検出アーキテクチャとトレーニング方法論のさらなる研究のための強力なベースラインモデル。
強みだ:
- 高速:リアルタイムシステムに適した驚異的な推論速度を実現。
- 優れた精度:ベンチマークデータセットで競争力のあるmAPスコアを提供。
- 効率的なアーキテクチャ:E-ELANとモデルのリパラメータ化を利用してパフォーマンスを向上。
弱点がある:
- エッジ展開のシナリオでは、YOLO11nのような小規模で最新のモデルと比較して、より多くの計算リソースが必要になる可能性がある。
- このアーキテクチャは効率的ではあるが、YOLO11比較すると、物体検出以外の多様な視覚タスクをサポートする汎用性には劣る。
モデル比較表
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
結論
YOLO11 YOLOv7は、それぞれ独自の強みを持つ強力な物体検出モデルです。YOLO11 汎用性と効率性に優れ、最先端の精度と速度で複数の視覚タスクをサポートするため、多様なアプリケーションや展開環境に適した強力な選択肢となります。YOLOv7も効率的ですが、特に高速物体検出に最適化されており、リアルタイム・アプリケーションや研究目的に適しています。YOLOv7とYOLOv7のどちらを選択するかは、タスクの汎用性、精度のニーズ、配備の制約などの要素のバランスをとりながら、プロジェクトの具体的な要件によって決まります。
Ultralytics 、他のモデルを検討したいユーザーのために、合理的な効率性と多用途性で知られるYOLOv8、スピードと使いやすさで広く採用されているYOLOv5提供しています。また、YOLO11 YOLOv9の比較や、RT-DETR ような、オブジェクト検出への異なるアーキテクチャ・アプローチのモデルの検討も可能です。