YOLOv7 vs YOLO11:詳細な技術比較
最適な物体検出モデルを選択するには、さまざまなアーキテクチャの特定の機能とトレードオフを深く理解する必要があります。このページでは、YOLOの系統における2つの強力なモデルであるYOLOv7とUltralytics YOLO11の包括的な技術比較を提供します。アーキテクチャの違い、パフォーマンスベンチマーク、およびコンピュータビジョンプロジェクトに最適な選択を行うのに役立つ理想的なユースケースについて詳しく説明します。
YOLOv7:効率的かつ正確なオブジェクト検出
YOLOv7は、推論コストを増加させることなく、トレーニング効率と精度を最適化することに重点を置いた、リアルタイム物体検出における重要な進歩として発表されました。リリース時には、リアルタイム検出器の新たな最先端技術を確立しました。
著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
所属: Institute of Information Science, Academia Sinica, Taiwan
日付: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
ドキュメント: https://docs.ultralytics.com/models/yolov7/
アーキテクチャと主な機能
YOLOv7 は、いくつかの重要な技術革新を導入することで、従来の YOLO アーキテクチャを基に構築されています。バックボーンに Extended Efficient Layer Aggregation Networks (E-ELAN) などの技術を採用し、特徴抽出と学習を向上させています。主な貢献として、「trainable bag-of-freebies」の概念があり、これは、推論時の計算量を増やすことなく、最終的なモデル精度を向上させるために、トレーニング中に適用される最適化戦略(補助検出ヘッドの使用や粗から密へのガイダンスなど)を含みます。主に物体検出に焦点を当てていますが、公式リポジトリには、姿勢推定やインスタンスセグメンテーションなどのタスクに対するコミュニティ拡張機能が掲載されています。
パフォーマンスとユースケース
YOLOv7 は、リリース時に最先端の性能を発揮し、速度と精度のバランスが優れています。例えば、YOLOv7x モデルは、640 の画像サイズで MS COCO データセット上で 53.1% の mAPtestを達成しています。その効率性により、高度なセキュリティシステムや、迅速かつ正確な検出を必要とする自律システムなどのリアルタイムアプリケーションに適しています。
長所
- High Accuracy and Speed Balance: GPU上のリアルタイムタスクのために、mAPと推論速度の強力な組み合わせを提供します。
- 効率的な学習: 高度な学習テクニック("bag-of-freebies")を利用して、推論コストを増加させることなく精度を向上させます。
- 確立されたパフォーマンス: MS COCOのような標準的なベンチマークで実績のある結果。
弱点
- 複雑さ: アーキテクチャとトレーニング技術は、完全に把握し最適化することが複雑になる可能性があります。
- リソース集約的: 大規模なYOLOv7モデルは、学習にかなりのGPUリソースを必要とします。
- 限定的なタスクの多様性: 主に物体検出に焦点が当てられており、YOLO11のような統合モデルとは異なり、セグメンテーションや分類などの他のタスクには個別の実装が必要です。
- メンテナンスされていない: このフレームワークは、Ultralyticsのエコシステムほど活発に開発またはメンテナンスされていないため、アップデートが少なく、コミュニティサポートも少なくなっています。
Ultralytics YOLO11:最先端の効率と汎用性
Ultralytics YOLO11は、UltralyticsのYOLOシリーズの最新の進化を代表するものであり、優れた精度、強化された効率、およびユーザーフレンドリーなフレームワーク内でのより広範なタスクの汎用性を実現するように設計されています。YOLOv8などの前身の成功に基づいて、最先端のエクスペリエンスを提供します。
著者: Glenn Jocher and Jing Qiu
所属: Ultralytics
日付: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11のアーキテクチャは、高度な特徴抽出技術と効率化されたネットワーク設計を組み込んでおり、多くの場合、従来のモデルと比較して高い精度を実現し、パラメータ数を削減しています。この最適化により、推論速度が向上し、計算需要が軽減されるため、エッジデバイスからクラウドインフラストラクチャまで、多様なプラットフォームへの展開に不可欠です。
YOLO11の主な利点は、その汎用性です。物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、傾斜バウンディングボックス(OBB)など、複数のコンピュータビジョンタスクをネイティブにサポートしています。Ultralyticsエコシステムにシームレスに統合され、シンプルなPythonおよびCLIインターフェース、広範なドキュメント、効率的なトレーニングのためにすぐに利用できる事前トレーニング済みの重みにより、合理化されたユーザーエクスペリエンスを提供します。
パフォーマンスとユースケース
YOLO11は、異なるモデルサイズで優れた平均適合率(mAP)スコアを示し、速度と精度の間で有利なトレードオフを実現しています。たとえば、YOLO11mは、YOLOv7lよりもパラメータが大幅に少ない状態で、640の画像サイズで51.5のmAPvalを達成しています。YOLO11nのような小型バリアントは非常に高速な推論を提供し、YOLO11xのような大型モデルは精度を最大化します。特に、YOLO11モデルは、他のアーキテクチャと比較して、トレーニングおよび推論中にメモリ使用量が少ないことがよくあります。
YOLO11の強化された精度と効率により、正確なリアルタイム処理を必要とするアプリケーションに最適です。
- ロボティクス: 正確なナビゲーションと物体とのインタラクションを可能にします。AIのロボティクスにおける役割で探求されています。
- セキュリティシステム: 侵入検知のための高度なセキュリティアラームシステムを強化します。
- 小売分析: 在庫管理と顧客行動分析の改善。
- 産業オートメーション:製造における品質管理をサポート。
長所
- 最先端のパフォーマンス: 最適化されたアンカーフリーアーキテクチャによる高いmAPスコア。
- 効率的な推論: 特にCPUでの優れた速度は、リアルタイムのニーズに適しています。
- 多用途なタスクサポート: 単一のフレームワークで、検出、セグメンテーション、分類、ポーズ、OBBをネイティブに処理します。
- 使いやすさ: シンプルなAPI、広範なドキュメント、およびノーコードのトレーニングとデプロイメントのための統合されたUltralytics HUBサポート。
- 適切に管理されたエコシステム: アクティブな開発、強力なコミュニティ、頻繁なアップデート、および効率的なトレーニングプロセス。
- スケーラビリティ: より低いメモリ要件で、エッジからクラウドまで、ハードウェア全体で効果的に機能します。
弱点
- より新しいモデルとして、特定のサードパーティツールとの統合は、より古く、より確立されたモデルと比較して、まだ進化している可能性があります。
- より大きなモデルは、トレーニングにかなりの計算リソースを必要とする可能性がありますが、パフォーマンスのクラスにおいては非常に効率的です。
性能比較:YOLOv7 対 YOLO11
以下の表は、COCOデータセットにおけるYOLOv7とYOLO11モデルの詳細な性能比較を示しています。YOLO11モデルは、精度、速度、効率の優れたバランスを示しています。たとえば、YOLO11lは、パラメータとFLOPが半分以下でYOLOv7xよりも高いmAPを達成し、GPUでは大幅に高速です。同様に、YOLO11mは、パラメータと計算コストが約半分でYOLOv7lの精度に匹敵します。最小モデルであるYOLO11nは、CPUとGPUの両方で優れた速度を提供し、リソースの使用量が最小限であるため、エッジアプリケーションに最適です。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
結論: どのモデルを選ぶべきか?
YOLOv7はその時代において強力なモデルであり、リアルタイム物体検出において依然として優れた性能を発揮しますが、Ultralytics YOLO11は大きな飛躍を遂げています。YOLO11は、主要なパフォーマンス指標でYOLOv7を上回るだけでなく、はるかに汎用性が高く、ユーザーフレンドリーで、十分にサポートされたフレームワークを提供します。
最新のオールインワンソリューションを求める開発者や研究者にとって、YOLO11が明確な選択肢です。その利点は次のとおりです。
- 優れたパフォーマンスバランス: YOLO11は、精度、速度、および計算コストのより良いトレードオフを提供します。
- マルチタスクの汎用性: 検出、セグメンテーション、分類、ポーズ、OBBをネイティブにサポートしているため、複数のモデルは不要になり、開発ワークフローが簡素化されます。
- 使いやすさ: 効率化されたAPI、包括的なドキュメント、および簡単なトレーニング手順により、初心者と専門家の両方がアクセスできます。
- 活発な開発: Ultralyticsエコシステムの一環として、YOLO11は継続的なアップデート、強力なオープンソースコミュニティ、シームレスなMLOpsのためのUltralytics HUBのようなツールとの統合の恩恵を受けています。
要するに、デプロイの容易さと将来性を見据えた幅広いアプリケーションで、AIの最新の進歩を活用することが優先事項である場合は、Ultralytics YOLO11が推奨されるモデルです。
その他のモデルを見る
さらに検討を深めるには、Ultralyticsドキュメント内のYOLOv7、YOLO11、およびその他の関連モデルを含むこれらの比較をご検討ください。
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv10
- YOLOv7 対 YOLOv8
- YOLOv7 対 YOLOv5
- YOLOv9やYOLOv10のような最新モデルをご覧ください。