YOLOv10とYOLOv7の詳細比較
適切な物体検出モデルを選択することは、コンピュータビジョンプロジェクトにとって非常に重要です。Ultralytics YOLO 、様々なニーズに合わせたモデルを提供しています。このページでは、YOLOv10とYOLOv7を技術的に比較します。それぞれのアーキテクチャ、性能指標、理想的なアプリケーションを分析し、十分な情報に基づいた決断をお手伝いします。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10
清華大学の研究者が2024年5月に発表したYOLOv10は、リアルタイム物体検出の最先端を行くものだ。彼らのArxiv論文「YOLOv10: Real-Time End-to-End Object Detection」で詳しく述べられているように、Ao Wang、Hui Chen、Lihao Liuらは、YOLOv10を効率と精度の両方に焦点を当てた重要な進歩として発表している。正式な実装はGitHubで公開されている。YOLOv10は、エンドツーエンドの展開のために設計されており、以前のバージョンのYOLO 非最大抑制(NMS)に依存していたことに対処している。
建築と主な特徴:
YOLOv10は、スピードの向上と計算の冗長性の削減を目的としたいくつかの革新的なアーキテクチャを誇っている。主な特徴として、アンカーフリーのアプローチとNMSフリーの設計があり、後処理を合理化し、推論を高速化する。このモデルは、全体的な効率と精度を重視した設計戦略を採用し、オーバーヘッドを最小化し、能力を最大化するために様々なコンポーネントを最適化している。その結果、高速化だけでなく、競争力のある精度を維持し、エッジ・デバイスやリアルタイム・アプリケーションに適したモデルを実現している。
パフォーマンス メトリックとベンチマーク:
比較表に示すように、YOLOv10モデル、特にYOLOv10nとYOLOv10sは、TensorRT上でそれぞれ1.56msと2.66msという驚異的な推論速度を実現しています。YOLOv10nは、わずか2.3Mのパラメータと6.7B FLOPsで39.5のmAPval50-95を達成し、YOLOv10xは54.4のmAPval50-95を達成しています。これらの指標は、最適化された計算リソースで最先端の性能を実現するYOLOv10の能力を強調しています。YOLO パフォーマンス・メトリクスの詳細については、YOLO パフォーマンス・メトリクスの Ultralytics ドキュメントを参照してください。
使用例:
YOLOv10は、リアルタイムのパフォーマンスと効率性を重視しているため、限られた計算リソースで迅速な物体検出を必要とするアプリケーションに最適です。適したユースケースは以下の通りです:
- エッジAIアプリケーション:スマートカメラやIoTデバイスのようなリアルタイム処理のためのエッジデバイスへの展開。
- ロボット工学 ロボット工学におけるAIの役割で述べたように、ロボットシステムにおけるナビゲーションとインタラクションのために、より高速で効率的な物体認識を可能にする。
- 自律システム:低遅延が安全で効果的な運用に不可欠な自律走行車やドローンへの応用。
- モバイルと組込みシステム:計算能力に制約のあるモバイルアプリケーションや組込みシステムにおける物体検出。
強みだ:
- 高効率:NMSフリーの設計と最適化されたアーキテクチャにより、より高速な推論と待ち時間の短縮を実現。
- 競争力のある精度:スピードを大幅に向上させながら、高い精度を維持。
- エンド・ツー・エンドの展開:シームレスなエンド・ツー・エンドのリアルタイム物体検出を実現。
- より小さなモデルサイズ:効率的なアーキテクチャーは、いくつかの先行製品と比較して、より小さなモデルサイズとより少ないパラメータをもたらします。
弱点がある:
- 比較的新しい:新しいモデルであるYOLOv10は、YOLOv7のような確立されたモデルと比べると、コミュニティが小さく、導入事例も少ないかもしれない。
- パフォーマンスのチューニング:最適なパフォーマンスを達成するためには、モデルトレーニングのヒントで詳しく説明しているように、モデルのサイズや構成を変えて微調整や実験を行う必要があるかもしれません。
YOLOv7
Chien-Yao Wang氏、Alexey Bochkovskiy氏、Hong-Yuan Mark Liao氏によって2022年7月に発表されたYOLOv7は、その効率性と正確さで知られる、高い評価を得ている物体検出モデルである。このモデルの詳細はArxivの論文「YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors」に記載されており、公式のGitHubリポジトリには実装の詳細が記載されている。YOLOv7は、以前のYOLO バージョンをベースに、計算コストを大幅に増加させることなくパフォーマンスを最大化するためのアーキテクチャの改良を組み込んだものである。
建築と主な特徴:
YOLOv7は、その性能と効率を高めるために、いくつかの革新的なアーキテクチャを組み込んでいる。主な特徴は以下の通り:
- Extended Efficient Layer Aggregation Networks (E-ELAN):ネットワークの学習能力と勾配フローを強化。
- 連結ベースのモデルのスケーリング:効果的な深さと幅のスケーリングのガイドラインを提供します。
- 補助ヘッドと粗細リードヘッド:トレーニング効率と検出精度を向上させます。
これらの機能により、YOLOv7は速度と精度の面で最先端の結果を達成し、さまざまな物体検出タスクに適した選択肢となっている。
パフォーマンス メトリックとベンチマーク:
YOLOv7は、速度と精度の間で強力なバランスを示している。表に示すように、YOLOv7lは51.4のmAPval50-95を達成し、YOLOv7xは53.1のmAPval50-95を達成した。TensorRT 推論速度ではYOLOv10nとYOLOv10sよりわずかに遅いものの、YOLOv7モデルは、特にYOLOv7モデルのサイズが大きいことを考慮すると、依然として競争力のあるパフォーマンスを提供しています。詳細なメトリクスについては、YOLOv7のドキュメントを参照してください。
使用例:
YOLOv7の精度と効率のバランスは、リアルタイムのシナリオで信頼性の高い物体検出を必要とするアプリケーションに適しています。理想的な使用例
- 自律走行車: 自動運転車のAIに不可欠な、複雑な走行環境におけるロバストな物体検出。
- 高度な監視システム セキュリティシステムにおける潜在的なセキュリティ脅威を高い精度で特定。
- ロボット工学:YOLOv10と同様、ロボット工学における操作とナビゲーションのための正確な物体認識。
- 産業オートメーション精度が最優先される製造工程における品質管理と欠陥検出。
強みだ:
- 高いmAP:高い平均精度を達成し、優れた物体検出精度を示す。
- 効率的な推論:リアルタイムアプリケーションに適した高速推論を実現。
- 確立された成熟度:YOLOv7は、より大きなコミュニティと広範な利用から恩恵を受け、より多くのリソースとサポートを提供しています。
- 管理しやすいモデルサイズ:モデルサイズと性能のバランスが良い。
弱点がある:
- 複雑さ:アーキテクチャは、より単純なモデルよりも複雑であり、微調整や最適化により多くの専門知識を必要とする可能性がある。
- ナノ・モデルに比べて資源集約的:効率的ではあるが、YOLOv10nのような小さなモデルよりも計算量が多い。
その他のYOLO モデル
YOLOv10とYOLOv7に加え、Ultralytics 、それぞれ独自の強みを持つ様々なYOLO モデルを提供しています。ご検討ください YOLOv8多用途でユーザーフレンドリーなオプションのYOLOv8、ネットワーク・アーキテクチャの進歩に対応したYOLOv9、そして YOLO11をご検討ください。また、YOLOv7を以下のような他のモデルと比較することもできます。 YOLOv5やYOLOXといった他のモデルと比較して、それぞれのトレードオフを理解することもできます。