EfficientDetとYOLO-YOLOの比較:物体検出のための詳細な比較
最適な物体検出モデルを選択することは、コンピュータビジョンプロジェクトにとって非常に重要な決定です。このページでは、物体検出の分野で著名な2つのモデル、EfficientDetとYOLO-YOLOの詳細な技術比較を行います。このページでは、EfficientDetとDAMO-YOLOのアーキテクチャ、性能ベンチマーク、様々なアプリケーションへの適合性を分析し、十分な情報に基づいた選択を支援します。
エフィシェントデット
EfficientDetは2019年にGoogle 導入され、オブジェクト検出における効率性とスケーラビリティで知られている。多くの現代的な検出器と比較して、大幅に少ないパラメータとFLOPで最先端の精度を達成している。
アーキテクチャと主な特徴
EfficientDetは、効率と精度の両方を高めるために、一連のアーキテクチャ上の革新を採用している:
- バックボーン・ネットワーク:バックボーンにEfficientNetを採用。ニューラル・アーキテクチャの探索により、その効率性とスケーラビリティで知られる。
- BiFPN (Bi-directional Feature Pyramid Network):効率的かつ効果的なマルチスケール特徴フュージョンを可能にする重み付き双方向特徴ピラミッドネットワーク。
- 複合スケール:複合係数を使用して、検出器のすべての次元(バックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度)を体系的にスケールアップします。
パフォーマンス指標
EfficientDetモデルには様々なサイズ(d0からd7)があり、異なる計算リソースに適合するように、様々な性能トレードオフを提供します。
- mAP:COCOデータセットで高い平均精度(mAP)を達成し、強力な検出精度を実証。
- 推論速度:モデルサイズに応じた推論速度を提供し、より小さなモデルはリアルタイムアプリケーションに適しています。
- モデルサイズ:EfficientDetモデルは、パラメータを効率的に使用できるように設計されているため、他の高精度ディテクタに比べてモデルサイズが小さくなっています。
強みと弱み
強みだ:
- 高効率:精度と計算コストのバランスに優れ、リソースに制約のある環境に適しています。
- スケーラビリティ:複合的なスケーリングにより、望ましい性能レベルを達成するためにモデルのスケーリングを容易に行うことができる。
- 精度:少ないパラメータで最先端の精度を実現。
- 文書化された実装:GoogleAutoMLリポジトリには、明確な実装と訓練済みモデルが用意されている。
弱点がある:
- 複雑さ:BiFPNと複合スケーリング戦略は、アーキテクチャに複雑さを加える。
- 推論速度:効率的ではあるが、推論速度はUltralytics YOLO モデルのようなリアルタイム検出器、特に大きなEfficientDetの亜種ほど速くないかもしれない。
使用例
EfficientDetは、精度と効率の両方が重要なアプリケーションに適しています:
- モバイルとエッジ・デバイス:その効率性から、モバイル機器やエッジ・コンピューティング・プラットフォームに導入することができる。
- ロボット工学:正確で効率的な物体検出を必要とするロボットアプリケーションに適しています。
- リソースに制約のあるアプリケーション:計算リソースが限られているが、高い精度が必要な場合に最適。
ダモYOLO
アリババ・グループが2022年に発表したDAMO-YOLO、高速かつ高精度な物体検出のために設計されており、特に産業用途に重点を置いている。スピードと精度のバランスを達成するために、いくつかの新しい技術を統合している。
アーキテクチャと主な特徴
DAMO-YOLO 、そのアーキテクチャにいくつかの革新的なコンポーネントを組み込んでいる:
- NASベースのバックボーンニューラル・アーキテクチャ・サーチ(NAS)バックボーンを採用し、速度と精度の両方を最適化。
- RepGFPN (Reparameterized Gradient Feature Pyramid Network):計算効率を維持しながら特徴表現を強化する効率的な特徴融合ネットワーク。
- ZeroHead:レイテンシーを最小限に抑えるように設計された軽量な検出ヘッド。
- AlignedOTA (アラインド・オプティマル・トランスポート・アサインメント):トレーニングと精度を向上させる高度な割り当て戦略。
パフォーマンス指標
DAMO-YOLO モデルには、様々なパフォーマンスニーズに応えるため、異なるサイズ(t、s、m、l)が用意されている。
- mAP:COCOデータセットで競争力のあるmAPを達成し、強力な物体検出性能を実証。
- 推論速度:推論速度の速さを優先し、リアルタイムでレイテンシーの影響を受けやすいアプリケーションに適しています。
- モデルサイズ:モデルサイズと性能のバランスが良く、効率的な設計。
強みと弱み
強みだ:
- 高速:リアルタイムアプリケーションに最適化された卓越した推論速度。
- 産業用フォーカス:産業用アプリケーションのために特別に設計され、実用的な展開に重点を置いている。
- 精度:高速推論を実現しながら高い精度を維持。
- 高度なテクニック:NASバックボーンやAlignedOTAなどの最先端技術を統合し、パフォーマンスを強化。
- オープンソース:コードと学習済みモデルが公開されている。
弱点がある:
- 比較的新しい:新しいモデルであるため、コミュニティやエコシステムは、より確立されたモデルに比べてまだ発展途上かもしれない。
- 複雑さ:複数の高度な技術を統合することで、アーキテクチャの変更やカスタマイズが複雑になる可能性がある。
使用例
DAMO-YOLO 、高精度でリアルタイムの物体検出を必要とするシナリオで特に効果を発揮する:
- 工業用検査:製造工程における品質管理や検査に最適。
- 自律走行:低遅延が重要な自律走行車や先進運転支援システム(ADAS)に適している。
- リアルタイムビデオ解析: 交通監視や セキュリティシステムなどのアプリケーション
- エッジAI:リアルタイム処理のためのエッジデバイスへの展開。
モデル比較表
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
ダモ・ヨロト | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
ダモヨロズ | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
ダモ・ヨロム | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
ダモヨロル | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
結論
EfficientDetとYOLO -YOLOはどちらも、明確な強みを持つ強力な物体検出モデルです。EfficientDetは、様々な効率的モデルを強力な精度で提供することに優れており、特にリソースに制約のある様々なアプリケーションに汎用的に使用できます。一方、DAMOYOLOYOLOは、精度を大幅に犠牲にすることなく、高速推論ができるように設計されており、リアルタイムの産業用アプリケーションやエッジ・アプリケーションに最適です。
その他の高性能物体検出モデルに興味のあるユーザーには、Ultralytics 以下のようなYOLO モデルを提供しています。 YOLOv5, YOLOv8そして最新の YOLO11.YOLOXのような他のモデルとの比較も可能で、特定のニーズに最適なモデルを見つけるのに役立ちます。YOLO モデルのトレーニングと展開を合理化するために、Ultralytics HUBをご検討ください。