YOLO11 EfficientDet: 視覚アーキテクチャの技術的比較
コンピュータビジョンの急速に進化する環境において、適切な物体検出モデルを選択することはプロジェクトの成功に極めて重要です。本比較では、 Ultralytics YOLO11(2024年末に発表された最先端のリアルタイム検出器)と、Google (2019年に発表された複合スケーリングを分野に導入した極めて影響力のあるアーキテクチャ)の技術的差異を比較検討する。
EfficientDetはリリース時にパラメータ効率のベンチマークを確立しましたが、YOLO11 その後数年にわたる革新YOLO11 、現代のエッジAIおよびクラウドアプリケーション向けに推論速度、精度、実用性を最大化することに焦点を当てています。
新型モデルがご利用いただけます
YOLO11 強力なYOLO11 、Ultralytics (2026年1月リリース)が最新の推奨選択肢です。YOLO26はエンドツーエンドNMS設計、高速推論、精度向上を実現しています。
パフォーマンスメトリクスと分析
以下の表は、COCO 性能指標の直接比較を示しています。主要な指標には、精度を示す平均精度(mAP)、異なるハードウェアでの推論速度(レイテンシ)、モデルサイズ(パラメータ数)、および計算複雑度(FLOPs)が含まれます。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
主なポイント
- 推論レイテンシ: Ultralytics YOLO11 レイテンシにおいてEfficientDetをYOLO11 上回る。例えば、YOLO11x GPU 10倍以上の高速処理 GPU 11.3ms対128.07ms)を実現しながら、EfficientDet-d7(53.7mAP)を上回る精度(54.7mAP)を達成している。
- アーキテクチャ効率:EfficientDetがFLOPs(浮動小数点演算)の最適化を図る一方、YOLO11 ハードウェア利用率の最適化YOLO11 。これはAI性能指標における重要な差異を浮き彫りにする:メモリアクセスコストや並列処理の制約により、低いFLOPsが必ずしも実世界の推論速度向上に直結しないことを示している。
- モデルの拡張性: YOLO11 より実用的なスケーリング曲線YOLO11 。「nano」モデル(YOLO11n)mAP 実用的な39.5mAP を達成する一方、最小のEfficientDet-d0は34.6mAP遅れをとっている。
Ultralytics YOLO11: アーキテクチャと機能
Ultralytics YOLO11 、YOLO You Only Look Once)ファミリーの遺産をYOLO11 、現代のコンピュータビジョン時代に適したアーキテクチャを洗練させています。特徴抽出と処理速度を向上させるため、バックボーンとネックに大幅な変更を導入しています。
注目すべきアーキテクチャの改良点には、以前のバージョンで使用されていたクロスステージ部分(CSP)のボトルネックを改良したC3k2ブロックと、C2PSA(クロスステージ部分空間注意)モジュールが含まれる。これらのコンポーネントにより、モデルはより少ないパラメータで画像内の複雑なパターンと文脈を捕捉できる。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLO11ドキュメント
YOLO11の強み
- 統合エコシステム: YOLO11 単なる検出モデルYOLO11 、インスタンスセグメンテーション、姿勢推定、OBB、分類を標準でサポートします。
- デプロイ準備:組み込みのエクスポートモードにより、ユーザーは単一のTFLite モデルをONNX、TensorRT、CoreML、TFLite に変換でき、モバイルおよびエッジデバイスへのシームレスなデプロイを保証します。
- トレーニング効率: YOLO11 、最新の拡張パイプラインと最適化された損失関数を活用することで、EfficientDetなどの従来アーキテクチャよりも大幅に高速にYOLO11 。
Google : アーキテクチャとレガシー
Google チームが開発したEfficientDetは、物体検出に複合スケーリングの概念を導入した。著者らは、手動でより大きなモデルを設計する代わりに、ネットワークの解像度、深さ、幅を同時にスケーリングする手法を提案した。
EfficientDetの中核はBiFPN(双方向特徴ピラミッドネットワーク)であり、これにより容易なマルチスケール特徴融合が可能となる。これはEfficientNetバックボーンを使用しており、これもまたニューラルアーキテクチャサーチ(NAS)を用いて設計されたものである。
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織: Google
- 日付: 2019-11-20
- Arxiv:1911.09070
- GitHub:google/automl
長所と限界
- パラメータ効率:EfficientDetは、非常に少ないパラメータで高い精度を達成した点で歴史的に注目に値する。
- 理論上の効率性:FLOPSは低いものの、BiFPN層の複雑な接続はメモリ集約的であり、YOLOの単純な畳み込み経路と比較してGPU上での実行速度が遅くなる可能性がある。
- 汎用性の制限:元のリポジトリは主に検出に焦点を当てており、Ultralytics に見られるようなネイティブなマルチタスク柔軟性(セグメンテーション、姿勢推定、OBB)を欠いている。
比較分析:なぜUltralyticsを選ぶのか?
2025年と2026年の生産環境におけるこれら2つのモデルを比較すると、Ultralytics 優位性が明らかになる。
使いやすさと開発者体験
Ultralytics 合理化されたユーザー体験をUltralytics 。YOLO11 の実装にはわずか数行のPython のみYOLO11 、EfficientDetを利用するには複雑なレガシーコードベースやTensorFlow 扱う必要がある場合が多くあります。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
適切に維持されたエコシステム
Ultralytics 頻繁な更新により積極的に維持管理されています。GitHubで提起された課題は迅速に対処され、コミュニティサポートも充実しています。一方、オリジナルのEfficientDetのような古い研究リポジトリは更新頻度が低く、長期的な商用プロジェクトでの維持が困難になる傾向があります。
パフォーマンスのバランスとメモリ
YOLO11 速度と精度の優れたバランスYOLO11 。YOLO11 アーキテクチャ設計はGPU YOLO11 、理論上のFLOP数がEfficientDetを上回る場合でも、実効的な推論時間を短縮します。さらに、Ultralytics トレーニング時のメモリ使用量を低減するよう最適化されているため、大量のVRAMを必要とする多くのTransformerベースの代替モデルとは異なり、一般消費者向けGPUでも効果的なモデルをトレーニングできます。
タスクを横断する汎用性
EfficientDetは主に物体検出器である一方、YOLO11 様々なタスクの基盤としてYOLO11 。この汎用性により、異なる問題ごとに異なるフレームワークを習得する必要性が軽減されます。
一つのフレームワーク、複数のタスク
- 検出:物体とその位置を特定する。
- セグメンテーション:オブジェクトのピクセルレベルでの理解。
- 姿勢推定:人体上のキーポイントを検出する。
- 方向付き境界ボックス(OBB):航空写真における船舶などの回転した物体を検出する。
- 分類:画像全体を効率的に分類する。
結論
両アーキテクチャはコンピュータビジョン史における重要なマイルストーンである。EfficientDetはニューラルアーキテクチャ探索と複合スケーリングの威力を実証した。しかし、今日の実用的なアプリケーションにおいては、 Ultralytics YOLO11 が優れた選択肢です。より高速な推論速度、高い精度、そして市場投入までの時間を大幅に短縮する開発者向けのエコシステムを提供します。
パフォーマンスの究極を追求する開発者には、YOLO11 の成功を基盤とし、さらに高い効率YOLO11 NMS設計YOLO11 YOLO26の検討をお勧めします。トランスフォーマーベースの手法に関心のある方は、 RT-DETR も検討するとよいでしょう。
Ultralytics アクセスし、クラウド上でモデルのトレーニング、デプロイ、管理を行い、ビジョンAIの真の可能性を発見してください。