EfficientDet vsYOLO11:物体検出技術の進化を評価する
コンピュータビジョンアプリケーション向けの最適なアーキテクチャを選択する際には、計算効率と検出精度のトレードオフをバランスさせることが往々にして必要となる。本包括的比較では、Google2019年に発表したスケーラブルな検出アーキテクチャであるEfficientDetとYOLO11(Ultralytics社による2024年リリース)の技術的差異を検証する。 Ultralytics がリアルタイム性能を再定義した2024年発表のYOLO11との技術的差異を検証する。
EfficientDetがモデルスケーリングにおいて画期的な概念を導入した一方で、YOLO11 使いやすさ、推論速度、マルチタスク対応性において大きな飛躍をYOLO11 。2026年に新規プロジェクトを開始する開発者には、ここで紹介した革新技術を基盤とし、ネイティブなエンドツーエンド処理を実現した最新のYOLO26の検討も推奨します。
パフォーマンスベンチマーク分析
物体検出の風景は、理論上のFLOPs最適化から実世界のレイテンシ最適化へと劇的に変化した。下表は推論速度の顕著な対比を示している。EfficientDet-d0CPU に約10msを要するのに対し、YOLO11nのような現代的アーキテクチャは同等のハードウェア上で競合可能な平均精度(mAP)を維持しつつ、同様のタスクを大幅に高速に実行する。多くの場合2ms未満である。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 1.5 | 2.6 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 2.5 | 9.4 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 4.7 | 20.1 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 6.2 | 25.3 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 11.3 | 56.9 | 56.9 | 194.9 |
効率的検出:複合スケーリングの先駆者
Google チームが開発したEfficientDetは、モデルスケーリングへの体系的なアプローチとして登場した。EfficientNetバックボーンを基盤とし、多階層特徴量の容易かつ高速な融合を可能とする加重双方向特徴ピラミッドネットワーク(BiFPN)を導入した。
中核となる革新は複合スケーリングであり、ネットワークのバックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深さ、幅を均一にスケーリングする手法である。これによりEfficientDetファミリー(D0からD7)は、モバイルデバイスから高電力GPU まで、幅広いリソース制約に対応可能となった。
学術的な成功とFLOPsにおける高い効率性にもかかわらず、EfficientDetは複雑なBiFPN接続と深度方向分離型畳み込みのメモリアクセスコストにより、実世界のハードウェアではレイテンシに悩まされることが多い。これらはTensorRTのようなアクセラレータによって常に最適化されるとは限らない。 TensorRTによって最適化されるとは限らない。
効率的な検出メタデータ:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019-11-20
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:google/automl
Ultralytics YOLO11:リアルタイム最先端技術の再定義
2024年9月発売 YOLO11 は、実用的な高速物体検出と即時展開を目的に設計されています。パラメータ効率を重視するEfficientDetとは異なり、YOLO11 ハードウェア利用率のYOLO11 、エッジCPUとエンタープライズGPUの両方で極めて高速なモデル実行を実現します。
YOLO11 、C3k2ブロックや 改良版SPPF(空間ピラミッドプーリング - 高速版)モジュールといったアーキテクチャ上の改良YOLO11 。これらの変更により、従来の特徴ピラミッド設計で見られた遅延のペナルティなしに、様々なスケールでの特徴抽出能力が強化されています。YOLO11 、インスタンスセグメンテーション、姿勢推定、オリエンテッドバウンディングボックス(OBB)検出など、複数のビジョンタスクに対応する統一フレームワークYOLO11 。これらの機能はEfficientDetでは複雑なカスタム実装を必要としていました。
エコシステムの利点
Ultralytics Ultralytics と完全に統合されており、クラウド上でのシームレスなデータセット管理、自動アノテーション、ワンクリックでのモデルトレーニングを実現します。
YOLO11 :
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLO11ドキュメント
主要な技術的相違点
アーキテクチャと特徴量融合
EfficientDetは、特徴マップをトップダウンとボトムアップで繰り返し接続する複雑な重み付き特徴融合層であるBiFPNに依存している。理論的には効率的だが、不規則なメモリアクセスパターンがGPU上での推論速度を低下させる可能性がある。
対照的に、YOLO11はC3k2ブロックを用いた簡素化されたPANet(Path Aggregation Network)に着想を得たYOLO11 。この設計は、CUDA NPUアーキテクチャと高い親和性を持つ、高密度で規則的なメモリアクセスパターンを優先する。その結果、ベンチマーク表で確認できる大幅な高速化が実現されている(例:YOLO11xはEfficientDet-d7よりもはるかに高速でありながら、より高い精度を維持している)。
トレーニング効率と使いやすさ
効率的なDetモデルのトレーニングには、通常、TensorFlow Detection APIまたはAutoMLライブラリが使用されますが、これらは習得が難しく、設定ファイルも複雑になる場合があります。
Ultralytics 開発者体験をUltralytics 。YOLO11 トレーニングは、Python コマンドラインインターフェース(CLI)経由で利用YOLO11 ライブラリはハイパーパラメータ調整、データ拡張、データセットのフォーマットを自動的に処理します。
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
汎用性と展開
EfficientDetは主に物体検出アーキテクチャである。セグメンテーションや姿勢推定などのタスクに適応させるには、大幅なアーキテクチャ変更が必要となる。
YOLO11 ネイティブにマルチYOLO11 。同じバックボーンとトレーニングパイプラインが以下をサポートします:
- 検出: 標準的なバウンディングボックス。
- セグメンテーション:正確な物体境界のためのピクセルレベルマスク。
- 分類: 画像全体のカテゴリ分類。
- ポーズ:骨格追跡のためのキーポイント検出
- OBB:空中画像および文字検出用の回転ボックス
この汎用性により、YOLO11 AIエンジニアにとって「万能YOLO11 」となり、単一のリポジトリで医療画像処理から自律ロボットまで多様なアプリケーションを駆動することが可能となる。
Ultralyticsモデルを選ぶ理由
現代の生産システム向けにこれら2つのアーキテクチャを比較すると、Ultralytics 明確な利点があります:
- メモリ使用量の削減: YOLO コンシューマー向けハードウェアでのトレーニングに最適化されています。膨大なCUDA 必要とするトランスフォーマーベースのモデルや従来の重厚なアーキテクチャとは異なり、効率的なYOLO ハイエンドAIトレーニングへのアクセスを民主化します。
- 効率化されたデプロイメント:ONNX、 TensorRT、CoreML、TFLite エクスポートは、Ultralytics では1行のコマンドTFLite 。
- 積極的なサポート: Ultralytics で活気に満ちています。頻繁な更新により、フレームワークはCUDATorchとCUDAの最新バージョンとの互換性を保証します。
結論:現代の選択
EfficientDetは複合スケーリングの威力を実証した、コンピュータビジョン研究史における重要なマイルストーンであり続ける一方で、 YOLO11 およびより新しいYOLO26が、今日の実用的な展開において優れた選択肢である。これらは速度と精度のバランスがより良く、ユーザー体験が大幅に容易であり、単一フレームワーク内で複数のコンピュータビジョンタスクを処理する柔軟性を提供する。
最先端技術を追求する開発者には、YOLO26の調査をお勧めします。これはエンドツーエンドNMS設計を導入し、さらに低いレイテンシと簡素化されたデプロイメントパイプラインを実現します。
他の高性能オプションを探るには、以下の比較記事をご参照ください YOLOv10 または RT-DETRをご参照ください。