EfficientDet vs YOLO11: 包括的な技術比較

最適なニューラルネットワークアーキテクチャの選択は、あらゆる成功するコンピュータビジョンアプリケーションの基盤です。この包括的なガイドでは、GoogleEfficientDetと Ultralytics YOLO11の包括的な技術比較を行い、アーキテクチャの違い、性能指標、および理想的な導入シナリオを分析します。

エッジAIデバイスでミリ秒単位のレイテンシを追求する場合でも、クラウドベースの推論でスケーラブルな精度を必要とする場合でも、これらのモデルの微妙な違いを理解することが極めて重要です。

モデルプロファイルと技術詳細

各アーキテクチャの系譜と根底にある設計思想を理解することは、実世界の物体検出タスクにおけるそれらの性能を文脈化するのに役立つ。

EfficientDet

Google Brainの研究者によって開発されたEfficientDetは、新しいBiFPN（Bidirectional Feature Pyramid Network）とともに、物体検出ネットワークをスケーリングするための原理的なアプローチを導入しました。

著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
組織:Google
日付: 2019-11-20
Arxiv:https://arxiv.org/abs/1911.09070
GitHub:https://github.com/google/automl/tree/master/efficientdet
ドキュメント:https://github.com/google/automl/tree/master/efficientdet#readme

EfficientDetの詳細について。

YOLO11

YOLO11 Ultralytics における重要な進化をYOLO11 、リアルタイム性能、パラメータ効率、マルチタスク学習の限界を押し広げます。

著者: Glenn Jocher、Jing Qiu
組織:Ultralytics
日付: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
ドキュメント:https://docs.ultralytics.com/models/yolo11/

YOLO11の詳細について。

アーキテクチャの比較

これら二つのモデルの建築的差異は、長年にわたる設計戦略の分岐を浮き彫りにしている。

EfficientDetはEfficientNetバックボーンを活用し、トップダウンおよびボトムアップのマルチスケール特徴融合を可能にするBiFPNを導入しています。すべてのバックボーン、特徴ネットワーク、およびボックス/クラス予測ネットワークの解像度、深さ、幅を同時に均一にスケーリングする複合スケーリング手法を使用しています。平均平均精度（mAP）を最大化するのに非常に効果的ですが、BiFPNの複雑なルーティングは推論中にメモリ帯域幅のボトルネックとなることがあります。

一方、YOLO11最適化されたC2fモジュールと先進的なアンカーフリー検出ヘッドを採用している。この合理化されたアプローチにより、特徴抽出時のオーバーヘッドが最小化される。Ultralytics GPU の利用率をYOLO11 Ultralytics 、従来のアーキテクチャや重いトランスフォーマーモデルと比較して、学習時と推論時の両方でメモリ要件が大幅に低減された。

マルチタスクの汎用性

EfficientDetが純粋な物体検出器であるのに対し、YOLO11 極めて高い汎用性をYOLO11 。単一YOLO11 、インスタンスセグメンテーション、画像分類、姿勢推定、およびオリエンテッドバウンディングボックス（OBB）をネイティブにサポートする。

パフォーマンスベンチマーク

以下の表は、COCO において、両モデルファミリーの様々なスケールでの性能を比較したものです。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

バランスの取れた分析: 長所と短所

GPUアクセラレーション: YOLO11はGPU環境で圧倒的な性能を発揮します。例えば、YOLO11mはTensorRTを利用したT4 GPU上で、驚異的な4.7msで51.5%のmAPを達成します。同等の精度を達成するには、EfficientDet-d5は67.86msかかり、これは14倍以上遅いです。これは、リアルタイムアプリケーションにおけるUltralyticsモデルの優れた性能バランスを浮き彫りにします。

CPU環境: EfficientDetは、ONNXを使用する小型バリアント（d0やd1など）において、高度に最適化されたCPU推論速度を示します。しかし、d7のような大型バリアントでは、大規模なGPUレイテンシペナルティを伴わずに精度が向上することはありません。

トレーニング手法とエコシステム

開発者体験は、モデルの理論上の能力と同様に重要な場合が多い。Ultralytics 真価を発揮するのはこの点である。

EfficientDetは、レガシーなTensorFlowエコシステムと複雑なAutoMLライブラリに大きく依存しています。カスタムトレーニングパイプラインのセットアップには、急な学習曲線、複雑な依存関係管理、およびアンカーと損失関数の手動設定が必要です。

対照的に、Ultralyticsは比類ない使いやすさを提供します。よく維持されたPyTorchエコシステムに支えられ、YOLOモデルのトレーニングにはわずか数行のコードしか必要ありません。このフレームワークは、ハイパーパラメータチューニング、高度なデータ拡張、最適な学習率スケジューリングをすぐに自動で管理します。

コード例:Ultralytics入門

この堅牢で実運用可能なスニペットは、Python 内でのトレーニングと推論がいかに簡単かを示しています。

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

理想的なユースケース

EfficientDetを使用するタイミング: EfficientDetは、TensorFlowパイプラインに深く根ざした研究環境や、d0のような初期アーキテクチャが適切に機能する特定のCPU制約において、依然として実行可能な選択肢です。

YOLO11を使用するタイミング: YOLO11は、現代のエンタープライズ展開における決定的な選択肢です。その卓越した速度は、自律走行車、リアルタイムスポーツ分析、および高スループットの製造欠陥detectに最適です。さらに、その低いメモリ使用量は、NVIDIA Jetsonのようなリソース制約のあるハードウェアへの柔軟な展開を可能にします。

展望：YOLO26のアップグレード

YOLO11 高性能Ultralytics 、新規プロジェクトを開始する開発者は、実績のある YOLOv8 や新たにリリースされたYOLO26などのUltralyticsアーキテクチャを評価すべきです。2026年初頭にリリースされたYOLO26は、YOLO11 基盤を継承YOLO11 いくつかの画期的な革新を導入しています：

エンドツーエンドのNMSフリー設計: YOLOv10の遺産に基づいて、YOLO26は後処理中の非最大抑制（NMS）を完全に排除し、レイテンシを大幅に削減し、デプロイパイプラインを簡素化します。
MuSGDオプティマイザ: 標準的なSGDとMuon（大規模言語モデルのトレーニングに触発された）を組み合わせたハイブリッドオプティマイザで、トレーニングの安定性を劇的に向上させます。
最大43%高速なCPU推論: 特定の最適化により、YOLO26はディスクリートGPUを持たないエッジデバイスで驚異的な性能を発揮します。
ProgLoss + STAL: 小さな物体detectを著しく改善する高度な損失関数は、航空画像やロボティクスにとって不可欠です。

当社の包括的なUltralytics Docsで、RT-DETRのようなトランスフォーマーベースのdetectを含む、ビジョンアーキテクチャのより広範な領域を探ってみましょう。