EfficientDet vs. YOLOv10:技術的比較
最適な物体検出モデルの選択は、精度、推論速度、計算コストのバランスを取る上で重要な決定です。このページでは、コンピュータビジョンにおける2つの影響力のあるモデルであるEfficientDetとYOLOv10の詳細な技術比較を提供します。アーキテクチャ、パフォーマンス指標、およびプロジェクトに最適なモデルを選択するのに役立つ理想的なユースケースを分析し、Ultralyticsエコシステム内でYOLOv10が提供する利点に焦点を当てます。
EfficientDet:スケーラブルで効率的なアーキテクチャ
EfficientDetは、非常に効率的でスケーラブルなオブジェクト検出器のファミリーとして、Google Brainチームによって導入されました。その核となるイノベーションは、モデルのスケーリングに対する体系的なアプローチであり、広範囲の計算予算にわたって精度と効率の両方を最適化することを目指しています。
技術詳細:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織: Google
- Date: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
アーキテクチャと主な機能
EfficientDetのアーキテクチャは、3つの主要なコンポーネントに基づいて構築されています。
- EfficientNet Backbone: 非常に効率的なEfficientNetを特徴抽出のためのバックボーンとして使用します。これは、ニューラルアーキテクチャ検索を使用して設計されました。
- BiFPN (双方向特徴ピラミッドネットワーク): 簡単かつ高速なマルチスケール特徴融合を可能にする、新しい特徴ネットワークです。従来のFPNとは異なり、BiFPNは双方向のクロススケール接続を持ち、重み付けされた特徴融合を使用して、異なる入力特徴の重要度を学習します。
- Compound Scaling: バックボーン、特徴ネットワーク、および予測ヘッドの深さ、幅、解像度を、単純な複合係数を使用して同時に均一にスケーリングする独自のスケーリング手法。これにより、あらゆるスケールでバランスの取れた最適化されたアーキテクチャが保証されます。
長所と短所
長所:
- 優れたスケーラビリティ: 複合スケーリング手法は、さまざまなリソース制約を満たすために、モデルをスケールアップまたはスケールダウン(EfficientDet-D0からD7まで)するための明確な道筋を提供します。
- パラメータとFLOP効率: リリース当時、効率性の新たな標準を確立し、従来の検出器よりも少ないパラメータとFLOPで高い精度を達成しました。
弱点:
- 年数とパフォーマンス: 基本的なアーキテクチャですが、数年前のものです。YOLOv10のような新しいモデルは、特にGPUのような最新のハードウェアでは、速度と精度効率のトレードオフの両方でそれを上回っています。
- エコシステムとメンテナンス: 元のリポジトリは、最近の代替手段ほど活発にメンテナンスされていません。Ultralyticsモデルに見られる包括的なエコシステム、広範なドキュメント、およびコミュニティサポートが不足しています。
- タスクの汎用性: EfficientDetは特に物体検出用に設計されており、インスタンスセグメンテーションや姿勢推定のような他のタスクをネイティブにサポートしていません。
理想的なユースケース
EfficientDetは、FLOPsとパラメータ数が最優先事項であるシナリオにおいては、依然として有効なモデルです。
- リソース制約のあるハードウェア: より小型のバリアントは、すべてのFLOPが重要な、計算能力が限られたデバイスへのデプロイメントに適しています。
- 学術的なベンチマーク: モデル効率とアーキテクチャ設計の研究における強力なベースラインとして機能します。
YOLOv10:リアルタイムエンドツーエンド検出
Ultralytics YOLOv10は、清華大学の最先端のリアルタイムオブジェクト検出器です。計算の冗長性を減らし、Non-Maximum Suppression (NMS)の必要性をなくすアーキテクチャの革新を導入することで、パフォーマンスの限界を押し広げ、真のエンドツーエンド検出を可能にします。
技術詳細:
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織: 清華大学
- Date: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- ドキュメント: https://docs.ultralytics.com/models/yolov10/
アーキテクチャと主な機能
YOLOv10の設計は、全体的な効率と精度に重点を置いています。
- NMS不要の学習: 学習中にラベルに一貫した二重割り当てを採用しており、ポストプロセス中にNMSを必要とせずに、競争力のあるパフォーマンスを実現できます。これにより、推論レイテンシが大幅に削減され、デプロイメントが簡素化されます。
- 全体的な効率と精度の設計: モデルアーキテクチャは、エンドツーエンドで最適化されています。これには、計算オーバーヘッドを削減するための軽量な分類ヘッドと、豊富な特徴情報をより効率的に保持するための空間チャネル分離ダウンサンプリングが含まれます。
- Ultralyticsエコシステムとの統合: YOLOv10はUltralyticsフレームワークにシームレスに統合されており、合理化されたユーザーエクスペリエンス、シンプルなPythonおよびCLIインターフェース、効率的なトレーニングプロセス、およびすぐに利用できる事前トレーニング済みの重みから恩恵を受けています。
長所と短所
長所:
- 最先端のパフォーマンス: 速度と精度の卓越したバランスを実現し、実際のレイテンシにおいてEfficientDetのような旧モデルを大幅に上回ることがよくあります。
- End-to-End Deployment: NMSフリー設計により、真のエンドツーエンドとなり、リアルタイム推論に大きな利点をもたらします。
- 使いやすさ: Ultralyticsエコシステムの一部として、YOLOv10は非常に使いやすいです。開発者は、わずか数行のコードでモデルをトレーニング、検証、およびデプロイできます。
- 優れた維持管理体制のエコシステム: 活発な開発、強力なオープンソースコミュニティ、頻繁なアップデート、シームレスなMLOpsのためのUltralytics HUBのようなツールとの統合の恩恵を受けています。
- メモリ効率: YOLOv10モデルは、効率的なメモリ使用のために設計されており、多くの場合、他の複雑なアーキテクチャと比較して、トレーニングおよび推論中に必要なCUDAメモリが少なくなります。
弱点:
- タスクの特化: EfficientDetと同様に、YOLOv10は主に物体検出に焦点が当てられています。マルチタスク機能を必要とするプロジェクトの場合、Ultralytics YOLOv8のようなモデルは、統一されたフレームワークでセグメンテーション、分類、姿勢推定をサポートするため、より適しているかもしれません。
理想的なユースケース
YOLOv10は、速度と効率が重要なアプリケーションに最適です。
- リアルタイムアプリケーション: 低レイテンシであるため、自律システム、ロボティクス、高速ビデオ監視に最適です。
- Edge AI: より小型のバリアント(YOLOv10n、YOLOv10s)は、NVIDIA JetsonやRaspberry Piのようなリソース制約のあるエッジデバイスへのデプロイ向けに高度に最適化されています。
- 産業オートメーション: 製造プロセスに合わせた高速かつ正確な検出が求められる生産ラインでの品質管理に最適です。
性能分析:速度、精度、効率
EfficientDetとYOLOv10の性能比較は、モデルアーキテクチャと最適化における急速な進歩を強調しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
- GPU速度: YOLOv10 は GPU レイテンシにおいて大きなアドバンテージを示しています。たとえば、YOLOv10-B は EfficientDet-d6 よりも高い mAP (52.7 対 52.6) を達成していますが、TensorRT を搭載した T4 GPU では 13 倍以上高速です。
- 精度 vs. パラメータ数: YOLOv10モデルは、特定のパラメータ数に対して、一貫してより優れた精度を提供します。YOLOv10-Lは、EfficientDet-d7の精度を上回り(53.3 vs. 53.7と非常に近い)、10倍以上高速で、パラメータ数もほぼ半分です。
- 全体的な効率: EfficientDet-d0はFLOPsが最も低いですが、YOLOv10nははるかに高いmAP(39.5対34.6)を提供し、同程度のパラメータ数でGPU上で大幅に高速です。これは、YOLOv10のような最新のアーキテクチャが、単にFLOPsを最小化するよりも、実際的な効率のトレードオフが優れていることを示しています。
結論: どのモデルを選ぶべきか?
EfficientDetはその時代において先駆的なモデルでしたが、YOLOv10はほぼすべての最新アプリケーションにとって明らかに勝者です。 優れた速度と精度を提供し、そのエンドツーエンドのNMSフリー設計は、現実世界の展開にとって大きな利点です。
開発者や研究者にとって、Ultralyticsエコシステムの利点により、選択はさらに明確になります。YOLOv10は以下を提供します。
- 優れたパフォーマンス: 最新のハードウェアで速度と精度のより良いトレードオフを実現します。
- 使いやすさ: トレーニング、検証、および推論のためのシンプルで統一されたAPI。
- 堅牢なエコシステム: 包括的なドキュメント、活発なコミュニティサポート、およびMLOpsパイプライン全体を効率化するUltralytics HUBなどのツールをご利用いただけます。
物体検出以上のものを必要とするプロジェクトには、検出、セグメンテーション、ポーズ推定、分類、およびトラッキングのための汎用性の高い最先端のフレームワークを提供するUltralytics YOLOv8を検討することをお勧めします。
その他のモデル比較
意思決定をさらに支援するために、これらおよびその他の最先端モデルを含む、他の比較を調べてください。
- EfficientDetとYOLOv8の比較
- YOLOv10 vs YOLOv8
- YOLOv10 vs RT-DETR
- YOLO11のような最新モデルで、Ultralyticsの最新の進歩をご体験ください。