YOLO11 vs EfficientDet:詳細な技術比較
このページでは、Ultralytics YOLO11とEfficientDetという2つの主要な物体検出モデル間の詳細な技術比較を提供します。アーキテクチャ、パフォーマンスベンチマーク、およびさまざまなアプリケーションへの適合性を分析して、コンピュータビジョンのニーズに最適なモデルを選択できるよう支援します。どちらのモデルも効率的で正確な物体検出を目指していますが、異なる研究ライン(UltralyticsとGoogle)から派生しており、異なるアーキテクチャ哲学を採用しています。
Ultralytics YOLO11
Ultralytics YOLO11は、Ultralyticsによって開発され、その卓越したリアルタイム物体検出機能で知られるYOLO(You Only Look Once)シリーズの最新の進歩を代表しています。YOLOv8のような前身の成功を基に、精度と計算効率の両方を向上させることに重点を置いています。
技術詳細:
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は、速度と精度に最適化されたシングルステージのアンカーフリーアーキテクチャを利用しています。主な機能には、改良された特徴抽出レイヤーと合理化されたネットワーク構造が含まれており、パラメータ数と計算負荷を削減しています。この設計により、エッジデバイス(NVIDIA Jetson、Raspberry Pi)からクラウドサーバーまで、多様なハードウェアで優れた性能が保証されます。
YOLO11の主な利点は、Ultralyticsエコシステム内での汎用性と統合です。物体検出だけでなく、インスタンスセグメンテーション、画像分類、ポーズ推定、傾斜バウンディングボックス(OBB)など、複数のタスクをサポートしています。Ultralyticsフレームワークは、シンプルなPython APIとCLI、広範なドキュメント、すぐに利用できる事前トレーニング済みの重み、および他の多くのアーキテクチャと比較して、より低いメモリ要件で効率的なトレーニングプロセスを提供します。このエコシステムは、活発な開発、強力なコミュニティサポート、および合理化されたMLOpsのためのUltralytics HUBなどのツールとのシームレスな統合の恩恵を受けています。
長所
- 高い速度と効率: 優れた推論速度、リアルタイムアプリケーションに最適です。
- 高い精度: モデルサイズ全体で、最先端のmAPスコアを達成します。
- 多様性: 単一のフレームワーク内で、検出、セグメンテーション、分類、ポーズ、OBBタスクをサポートします。
- 使いやすさ: シンプルなAPI、包括的なドキュメント、およびユーザーフレンドリーなエコシステム。
- 適切に管理されたエコシステム: 活発な開発、強力なコミュニティ、頻繁なアップデート、およびUltralytics HUBのようなツール。
- トレーニング効率: 多くの代替手段と比較して、より高速なトレーニング時間とより低いメモリ使用量。
- Deployment Flexibility: エッジからクラウドまで、多様なハードウェア向けに最適化されています。
弱点
- 小型モデルは速度を優先するため、最大のバリアントと比較して、達成可能な最大精度においてトレードオフが生じる可能性があります。
- ワンステージ検出器として、特定の複雑なシーンにおいて極めて小さいオブジェクトに対して課題が生じる可能性があります。
理想的なユースケース
YOLO11は、リアルタイム性能と高精度が要求されるアプリケーションで優れた性能を発揮します。
GoogleのEfficientDet
EfficientDetは、Google Brainチームによって導入されたオブジェクト検出モデルのファミリーです。精度と計算リソース(パラメータとFLOP)の間のトレードオフを最適化することにより、高い効率を達成するように設計されています。
技術詳細:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織: Google
- Date: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- ドキュメント: https://github.com/google/automl/tree/master/efficientdet#readme
アーキテクチャと主な機能
EfficientDetのアーキテクチャは、3つの主要なイノベーションに基づいて構築されています。
- EfficientNet Backbone: 非常に効率的なEfficientNetを特徴抽出のためのバックボーンとして使用します。
- BiFPN (Bi-directional Feature Pyramid Network): 単純かつ高速なマルチスケール特徴融合を可能にする新しい特徴ネットワークであり、重み付けされた接続を追加することで従来のFPNを改善します。
- Compound Scaling: バックボーン、特徴ネットワーク、およびボックス/クラス予測ネットワークの深さ、幅、解像度を均一にスケーリングする手法。これにより、モデルを小(D0)から大(D7)のバリアントにスケーリングして、さまざまなリソース制約に適合させることができます。
長所
- 高いパラメータ効率: 比較的少ないパラメータとFLOPで、強力な精度を実現します。
- スケーラビリティ: 複合スケーリング手法により、さまざまなパフォーマンス目標に合わせてモデルをスケーリングするための明確な方法が提供されます。
- 強力なベンチマーク性能: リリース当時、COCOデータセットで最先端の結果を達成しました。
弱点
- 推論速度が遅い: EfficientDetはFLOP効率が良いにもかかわらず、特にGPUではYOLOモデルと比較して推論レイテンシが高くなることが多く、多くのリアルタイムアプリケーションには適していません。
- 汎用性の制限: 主に物体検出用に設計されており、Ultralytics YOLOフレームワークに統合されているインスタンスセグメンテーション、ポーズ推定、OBBのような他のタスクに対するネイティブサポートがありません。
- 統合されたエコシステムが少ない: 元のリポジトリは主に研究成果物です。トレーニングからデプロイメントまでのエンドツーエンドのワークフローを簡素化する包括的なドキュメント、シンプルなAPI、およびUltralytics HUBのような統合ツールがありません。
- フレームワークの依存関係: 公式実装はTensorFlowであるため、主にPyTorchエコシステムで作業する開発者や研究者にとっては制約となる可能性があります。
理想的なユースケース
EfficientDetは、モデルサイズと理論的な計算コストが最も重要な制約となるシナリオに適しています。
- エッジAI: メモリと処理能力が著しく制限されているモバイルまたは組み込みデバイスへの展開。
- 学術研究: モデルのスケーリング則とアーキテクチャ効率の研究。
- クラウドアプリケーション: 推論あたりの計算コストを最小限に抑えることが、可能な限り低いレイテンシーを達成することよりも重要なシナリオ。
性能とベンチマーク:YOLO11 vs. EfficientDet
性能を比較する際、mAPだけでなく、より広い視点を持つことが重要です。両モデルファミリーはさまざまな精度レベルを提供していますが、YOLO11は実際の速度で優位に立つように設計されています。下の表に示すように、類似したmAPの場合、YOLO11モデルは特にTensorRTでGPUを加速した場合に大幅に高速です。
たとえば、YOLO11mはEfficientDet-d5と同じ51.5 mAPを達成していますが、T4 GPUでは14倍以上高速(4.7 ms対67.86 ms)で、パラメータの使用量は40%少なくなっています。これは、YOLO11の優れた精度、速度、モデルサイズのバランスを強調しており、リアルタイム処理を必要とするアプリケーションにとって、はるかに実用的な選択肢となっています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
結論: どのモデルを選ぶべきか?
EfficientDetはモデル効率において重要な一歩を踏み出しましたが、Ultralytics YOLO11は、大多数のコンピュータビジョンアプリケーションにとって、より現代的で実用的で強力なソリューションを表しています。
-
主な制約が理論上のFLOPsまたはパラメータ数の最小化であり、研究指向のフレームワーク内で作業することに抵抗がない場合は、EfficientDetを選択してください。
-
ほぼすべての他のシナリオでは、Ultralytics YOLO11を選択してください。その優れた速度と精度のトレードオフ、複数のビジョンタスクにわたる信じられないほどの汎用性、使いやすさにより、開発者や研究者にとって決定的な選択肢となります。包括的なドキュメント、活発なコミュニティサポート、Ultralytics HUBのようなツールを含む十分に管理されたエコシステムは、初期の実験から大規模な本番環境まで、スムーズな開発とデプロイメントのエクスペリエンスを保証します。
その他のモデル比較
さらに検討を深めるには、YOLO11およびその他の関連モデルを含むこれらの比較をご検討ください。
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv9
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv7
- YOLO11 vs RT-DETR
- YOLOX vs EfficientDet
- YOLOv8 vs EfficientDet