EfficientDet vs YOLO11: 包括的な技術比較

最適なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンアプリケーションを成功させるための基盤です。この包括的なガイドでは、GoogleのEfficientDetとUltralytics YOLO11の技術的な比較を詳細に行い、アーキテクチャの違い、性能指標、および理想的なデプロイメントシナリオを分析します。

エッジAIデバイスでのミリ秒単位の低遅延をターゲットにする場合でも、クラウドベースの推論でスケーラブルな精度が必要な場合でも、これらのモデルの微妙な違いを理解することは極めて重要です。

モデルのプロファイルと技術的な詳細

各アーキテクチャの系譜と根底にある設計思想を理解することは、実際の物体検出タスクにおける性能を文脈化するのに役立ちます。

EfficientDet

Google Brainの研究者によって開発されたEfficientDetは、物体検出ネットワークのスケーリングに対する原則に基づいたアプローチと、新しいBiFPN(Bidirectional Feature Pyramid Network)を導入しました。

EfficientDetについて詳しくはこちら

YOLO11

YOLO11はUltralyticsエコシステムにおける重要な進化を象徴するものであり、リアルタイム性能、パラメータ効率、およびマルチタスク学習の限界を押し広げています。

YOLO11の詳細はこちら

アーキテクチャの比較

これら2つのモデル間のアーキテクチャ上の違いは、長年にわたる設計戦略の乖離を浮き彫りにしています。

EfficientDetはEfficientNetバックボーンを活用し、トップダウンおよびボトムアップのマルチスケール特徴融合を可能にするBiFPNを導入しています。これは、すべてのバックボーン、特徴ネットワーク、およびボックス/クラス予測ネットワークに対して、解像度、深さ、幅を均一にスケーリングする複合スケーリング法を使用します。平均精度(mAP)を最大化するのには非常に効果的ですが、BiFPN内の複雑なルーティングは、推論中にメモリ帯域幅のボトルネックになることがあります。

一方、YOLO11は最適化されたC2fモジュールと高度なアンカーフリー検出ヘッドを採用しています。この合理化されたアプローチにより、特徴抽出時のオーバーヘッドを最小限に抑えています。Ultralyticsは、GPUハードウェアの利用率を最大化するようにYOLO11を設計しており、古いアーキテクチャや重いTransformerモデルと比較して、トレーニング時および推論時のメモリ要件が大幅に低減されています。

マルチタスクの汎用性

EfficientDetが純粋な物体検出器であるのに対し、YOLO11は極めて高い汎用性を誇ります。単一のYOLO11アーキテクチャで、インスタンスセグメンテーション画像分類姿勢推定、および指向性バウンディングボックス (OBB)をネイティブにサポートしています。

パフォーマンスベンチマーク

下の表は、COCOデータセットにおける両モデルファミリーの様々なスケールでの性能を対比させたものです。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

バランスの取れた分析:強みと弱み

GPU加速: YOLO11はGPU環境で圧倒的な強みを発揮します。例えば、YOLO11mはTensorRTを利用したT4 GPU上で、4.7msという驚異的な速度で51.5%のmAPを実現します。同等の精度を達成するために、EfficientDet-d5は67.86msを要し、14倍以上低速です。これは、リアルタイムアプリケーションに対するUltralyticsモデルの優れた性能バランスを強調するものです。

CPU環境: EfficientDetは、ONNXを使用して、小型バリアント(d0やd1など)で高度に最適化されたCPU推論速度を発揮します。しかし、d7のような大型バリアントでは、GPUの大幅な遅延ペナルティを伴わずに精度をスケーリングすることが困難です。

トレーニング手法とエコシステム

開発者体験は、モデルの理論的な能力と同じくらい重要であることがよくあります。ここでUltralyticsエコシステムが真価を発揮します。

EfficientDetは、従来のTensorFlowエコシステムや複雑なAutoMLライブラリに大きく依存しています。カスタムトレーニングパイプラインをセットアップするには、急峻な学習曲線、複雑な依存関係の管理、そしてアンカーや損失関数の手動設定が必要となります。

対照的に、Ultralyticsは比類のない使いやすさを提供します。十分にメンテナンスされたPyTorchエコシステムに支えられ、YOLOモデルのトレーニングはわずか数行のコードで完了します。フレームワークは、ハイパーパラメータチューニング、高度なデータ拡張、および最適な学習率スケジューリングを自動的に処理します。

コード例:Ultralyticsを使い始める

この堅牢で本番環境対応のコードスニペットは、Python API内でのトレーニングと推論がいかに直感的であるかを示しています。

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

理想的な使用ケース

EfficientDetを使用すべき場合: EfficientDetは、TensorFlowパイプラインが深く組み込まれた研究環境や、d0のような初期のアーキテクチャで十分な性能が得られる特定のCPU制約下では、依然として有効な選択肢です。

YOLO11を使用すべき場合: YOLO11は、現代のエンタープライズデプロイメントにおいて決定的な選択肢です。その卓越した速度は、自動運転車、リアルタイムのスポーツ分析、および高スループットの製造欠陥検出に最適です。さらに、メモリ消費量が少ないため、NVIDIA Jetsonのようなリソースが制限されたハードウェア上での柔軟なデプロイが可能です。

今後の展望:YOLO26へのアップグレード

YOLO11は非常に高性能ですが、新しいプロジェクトを開始する開発者は、実績のあるYOLOv8や、新しくリリースされたYOLO26といった他のUltralyticsアーキテクチャも評価すべきです。2026年初頭にリリースされたYOLO26は、YOLO11の基盤の上に、いくつかの画期的なイノベーションを導入しています。

  • エンドツーエンドのNMSフリー設計: YOLOv10のレガシーに基づき、YOLO26はポストプロセッシングにおける非最大値抑制(NMS)を完全に排除し、レイテンシを削減してデプロイメントパイプラインを簡素化しています。
  • MuSGDオプティマイザ: 標準的なSGDとMuon(大規模言語モデルのトレーニングに触発された)を融合させたハイブリッドオプティマイザで、トレーニングの安定性を劇的に向上させます。
  • 最大43%高速なCPU推論: 特定の最適化により、YOLO26はディスクリートGPUを搭載していないエッジデバイス上でも驚異的な性能を発揮します。
  • ProgLoss + STAL: 航空画像やロボット工学において重要な、小さな物体の検出能力を大幅に向上させる高度な損失関数です。

RT-DETRのようなTransformerベースの検出器を含む、ビジョンアーキテクチャのより広い展望については、包括的なUltralytics Docsをご覧ください。

コメント