EfficientDet vs. YOLO11:詳細な技術的比較
このページでは、GoogleのEfficientDetとUltralytics YOLO11という2つの主要な物体検出モデル間の詳細な技術比較を提供します。アーキテクチャ、パフォーマンスベンチマーク、およびさまざまなアプリケーションへの適合性を分析して、コンピュータビジョンのニーズに最適なモデルを選択できるよう支援します。どちらのモデルも効率的で正確な物体検出を目指していますが、異なる研究ライン(GoogleとUltralytics)から派生しており、異なるアーキテクチャ哲学を採用しています。
EfficientDet
EfficientDetは、Google Brainの研究者によって開発されたオブジェクト検出モデルのファミリーです。2019年に発表され、強力なバックボーンと新しい特徴融合メカニズム、および独自のスケーリング方法を組み合わせることで、効率の新しい標準を打ち立てました。
技術詳細:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織: Google
- Date: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- ドキュメント: https://github.com/google/automl/tree/master/efficientdet#readme
アーキテクチャと主な機能
EfficientDetのアーキテクチャは、3つのコアコンポーネント上に構築されています。
- EfficientNet Backbone: 非常に効率的なEfficientNetを特徴抽出のためのバックボーンとして使用します。
- BiFPN (双方向特徴ピラミッドネットワーク): シンプルかつ高速なマルチスケール特徴融合を可能にする、新しい重み付けされた特徴ピラミッドネットワークです。異なる入力特徴の重要度を理解するために学習可能な重みを導入し、トップダウンとボトムアップの両方の接続を適用します。
- Compound Scaling: モデルの深さ、幅、解像度を単一の複合係数を使用してまとめてスケールアップする主要なイノベーションです。これにより、モデルファミリー(D0からD7)は、幅広いリソース制約にわたって効率的にスケールできます。
長所
- 高い効率性: EfficientDetモデルは、その少ないパラメータ数とFLOPsで有名であり、計算量の割に高い精度を達成します。
- スケーラビリティ: 複合スケーリング手法により、モデルをスケールアップまたはスケールダウンするための明確な方法が提供され、モバイルデバイスからデータセンターまで、さまざまなハードウェアプロファイルに適応可能です。
- 強力な学術ベンチマーク: リリース当初は最先端のモデルであり、効率性を重視した研究において強力なベースラインとなっています。
弱点
- GPU推論の低速化: FLOP効率にもかかわらず、EfficientDetは、並列処理ハードウェア向けに特別に設計されたYOLO11のようなモデルと比較して、GPUでの実際の推論レイテンシの点で遅くなる可能性があります。
- 汎用性の制限: EfficientDetは主に物体検出器です。Ultralyticsのような最新のフレームワークに統合されている、インスタンスセグメンテーション、ポーズ推定、または分類のような他のタスクに対するネイティブサポートがありません。
- メンテナンスされていないエコシステム: 公式リポジトリは、Ultralyticsのエコシステムほど活発には開発されていません。これにより、ユーザビリティ、コミュニティサポート、および最新のツールやデプロイメントプラットフォームとの統合において課題が生じる可能性があります。
Ultralytics YOLO11
Ultralytics YOLO11は、Ultralyticsが開発したYOLO(You Only Look Once)シリーズの最新の進化です。YOLOv8などの前身の成功に基づいて構築されており、比類のない使いやすさと汎用性を提供しながら、精度とリアルタイムパフォーマンスの両方の限界を押し広げることに重点を置いています。
技術詳細:
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は、速度と精度に最適化されたシングルステージのアンカーフリー検出器アーキテクチャを採用しています。その設計は、洗練された特徴抽出レイヤーと合理化されたネットワーク構造を特徴としており、精度を犠牲にすることなく、パラメータ数と計算負荷を削減します。これにより、NVIDIA Jetsonのようなエッジデバイスから強力なクラウドサーバーまで、多様なハードウェアで卓越したパフォーマンスが保証されます。
YOLO11 の大きな利点は、包括的な Ultralytics エコシステムに統合されていることです。これにより、開発者は以下を利用できます。
- 使いやすさ: シンプルで直感的なPython APIとCLIにより、トレーニング、検証、および推論が簡単になります。
- 多様性: YOLO11は、単一の統合フレームワーク内で物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および傾斜バウンディングボックス(OBB)をサポートするマルチタスクモデルです。
- 優れたメンテナンス体制: このモデルは、活発な開発、大規模で支援的なオープンソースコミュニティ、頻繁なアップデート、そしてエンドツーエンドのMLOpsのためのUltralytics HUBのようなツールとのシームレスな統合から恩恵を受けています。
- Training and Memory Efficiency: YOLO11は効率的なトレーニングのために設計されており、多くの場合、CUDAメモリの使用量が少なく、代替手段よりも高速に収束します。COCOのようなデータセットで事前にトレーニングされた重みがすぐに利用できます。
長所
- 最先端のパフォーマンス: 特にGPU上で、高いmAPスコアと高速な推論速度との間で優れたバランスを実現します。
- Deployment Flexibility: 幅広いハードウェア向けに最適化されており、ONNXやTensorRTなどの形式に簡単にエクスポートして、最大限のパフォーマンスを実現します。
- ユーザーフレンドリーなフレームワーク: 広範なドキュメント、チュートリアル、および強力なコミュニティによってサポートされており、初心者と専門家の両方にとって参入障壁を下げています。
- マルチタスク対応: 単一のYOLO11モデルでさまざまなビジョンタスクに対応できるように学習できるため、開発の複雑さと時間が軽減されます。
弱点
- CPUパフォーマンストレードオフ: GPU 向けに高度に最適化されていますが、大規模な YOLO11 モデルは、最小の EfficientDet バリアントと比較して、CPU のみの環境では遅くなる可能性があります。
- 小物体検出: 他のOne-Stage検出器と同様に、高密度なシーンにおいて、極めて小さい物体や、大きく遮蔽された物体の検出で課題が生じることがありますが、各バージョンで継続的な改善が行われています。
性能とベンチマーク
COCO val2017データセットでの性能比較は、EfficientDetとYOLO11の異なる設計思想を明確に示しています。EfficientDetは、特に小型モデルにおいて、理論的な効率(パラメータ/FLOPあたりのmAP)に優れています。しかし、実際のデプロイメント、特にGPUにおいては、YOLO11が推論速度において明確な優位性を示しています。
例えば、YOLO11sはEfficientDet-d3(47.5)と同等のmAP(47.0)を達成していますが、T4 GPU上での推論速度は2.9倍も高速です。最大のモデルであるYOLO11xは、すべてのEfficientDetモデルを精度(54.7 mAP)で上回り、GPU上での速度も中規模のEfficientDetモデルよりも大幅に高速です。これにより、リアルタイム推論が重要なアプリケーションにおいて、YOLO11は優れた選択肢となります。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
理想的なユースケース
EfficientDet
EfficientDetは、計算リソースが主なボトルネックであり、GPU最適化の重要度が低いシナリオに最適です。
- 学術研究: モデル効率とアーキテクチャ設計に焦点を当てた研究に最適です。
- CPUバウンドアプリケーション: より小型のバリアント(D0-D2)は、専用GPUのない環境でも十分に機能します。
- コスト重視のクラウドデプロイメント: 課金が FLOP または CPU 使用量に直接結び付けられている場合。
YOLO11
YOLO11は、高い精度、速度、および開発効率が要求される広範な現実世界のアプリケーションで優れた性能を発揮します。
- 自律システム: 低遅延認識でロボティクスや自動運転車を強化。
- セキュリティと監視: セキュリティシステムと公共の安全のためのリアルタイム監視を可能にします。
- 産業オートメーション: 生産ラインにおける高速品質管理と欠陥検出に利用されます。
- 小売分析: 在庫管理や顧客行動分析などのアプリケーションを推進します。
結論
EfficientDetは、モデル効率の限界を押し広げた画期的なアーキテクチャです。そのスケーラブルな設計は、特にリソースが限られた環境において、この分野への貴重な貢献であり続けています。
ただし、最先端で汎用性が高く、ユーザーフレンドリーなソリューションを求めている開発者および研究者にとって、Ultralytics YOLO11 が明確な選択肢です。特に最新のハードウェアでは、精度と現実世界の速度の優れた組み合わせを提供します。YOLO11 の主な利点は、そのパフォーマンスだけでなく、それを取り巻く堅牢なエコシステムにもあります。合理化された API、広範なドキュメント、マルチタスク機能、および活発なコミュニティサポートにより、開発と展開のライフサイクルが大幅に加速され、今日の広範なコンピュータビジョンの課題に対する最も実用的で強力なオプションとなっています。
その他のモデルを見る
さらに検討を深めるには、他の最先端モデルとの比較をご検討ください。
- YOLO11 vs. YOLOv10
- YOLO11 vs. YOLOv9
- YOLO11 vs. RT-DETR
- EfficientDet vs. YOLOv8
- EfficientDet vs. YOLOX