Link to this sectionEfficientDetとYOLO11の比較#

最適なニューラルネットワークアーキテクチャの選択は、あらゆる成功するコンピュータビジョンアプリケーションの基盤です。本ガイドでは、GoogleのEfficientDetとUltralytics YOLO11の包括的な技術比較を行い、アーキテクチャの違い、パフォーマンスメトリクス、および理想的なデプロイシナリオを分析します。

エッジAIデバイスでのミリ秒単位のレイテンシを目指す場合でも、クラウドベースの推論でスケーラブルな精度が必要な場合でも、これらのモデルの微妙な違いを理解することが重要です。

Link to this sectionモデルの概要と技術的詳細#

各アーキテクチャの系譜と根底にある設計思想を理解することは、実際の物体検出タスクにおけるパフォーマンスを理解する助けとなります。

Link to this sectionEfficientDet#

Google Brainの研究者によって開発されたEfficientDetは、物体検出ネットワークのスケーリングに対する原則に基づいたアプローチと、新しいBiFPN (Bidirectional Feature Pyramid Network) を導入しました。

著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
組織: Google
日付: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Docs: https://github.com/google/automl/tree/master/efficientdet#readme

EfficientDetについて詳しく知る

Link to this sectionYOLO11#

YOLO11はUltralyticsエコシステムの重要な進化であり、リアルタイムパフォーマンス、パラメータ効率、マルチタスク学習の限界を押し広げています。

著者： Glenn Jocher and Jing Qiu
組織: Ultralytics
日付: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolo11/

YOLO11の詳細はこちら

Link to this sectionアーキテクチャの比較#

これら2つのモデル間のアーキテクチャの違いは、長年にわたる設計戦略の相違を浮き彫りにしています。

EfficientDetはEfficientNetバックボーンを活用し、トップダウンおよびボトムアップのマルチスケール特徴融合を可能にするBiFPNを導入しています。これは、バックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深さ、幅を同時に均一にスケーリングする複合スケーリング手法を使用しています。mAP (mean Average Precision)を最大化する上で非常に効果的ですが、BiFPNの複雑なルーティングは、推論中にメモリ帯域幅のボトルネックになることがあります。

一方でYOLO11は、最適化されたC3k2モジュールと高度なアンカーフリー検出ヘッドを採用しています。この合理化されたアプローチにより、特徴抽出中のオーバーヘッドを最小限に抑えています。Ultralyticsは、GPUハードウェアの使用率を最大化するようにYOLO11を設計しており、古いアーキテクチャや重いTransformerモデルと比較して、トレーニングおよび推論中のメモリ要件が大幅に低減されています。

マルチタスクの汎用性

EfficientDetが厳密な物体検出器であるのに対し、YOLO11は極めて高い汎用性を誇ります。単一のYOLO11アーキテクチャで、インスタンスセグメンテーション、画像分類、姿勢推定、および指向性バウンディングボックス (OBB)をネイティブにサポートしています。

Link to this sectionパフォーマンスベンチマーク#

以下の表は、COCOデータセットにおける両モデルファミリのパフォーマンスを、さまざまなスケールで比較したものです。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

Link to this sectionバランス分析: 強みと弱み#

GPUアクセラレーション: YOLO11はGPU環境において圧倒的です。例えば、YOLO11mは、TensorRTを利用したT4 GPU上で、4.7msという驚異的な速さで51.5%のmAPを実現します。同等の精度を達成するために、EfficientDet-d5は67.86msを要し、14倍以上遅くなります。これは、リアルタイムアプリケーションにおけるUltralyticsモデルの優れたパフォーマンスバランスを強調しています。

CPU環境: EfficientDetは、ONNXを使用した小型バリアント（d0やd1など）において、非常に最適化されたCPU推論速度を発揮します。しかし、d7のような大型バリアントでは、巨大なGPUレイテンシのペナルティを招くことなく精度をスケールさせるのが困難です。

Link to this sectionトレーニング手法とエコシステム#

開発者のエクスペリエンスは、モデルの理論的な能力と同じくらい重要な場合があります。ここでUltralyticsエコシステムが真価を発揮します。

EfficientDetは、レガシーなTensorFlowエコシステムと複雑なAutoMLライブラリに大きく依存しています。カスタムトレーニングパイプラインをセットアップするには、急な学習曲線、複雑な依存関係管理、およびアンカーと損失関数の手動設定が必要です。

対照的に、Ultralyticsは比類のない使いやすさを提供します。十分にメンテナンスされたPyTorchエコシステムに支えられており、YOLOモデルのトレーニングは数行のコードで実行可能です。このフレームワークは、ハイパーパラメータチューニング、高度なデータ拡張、および最適な学習率スケジューリングを自動的に処理します。

Link to this sectionコード例: Ultralyticsを始める#

この堅牢で本番環境対応のコードスニペットは、Python API内でのトレーニングと推論がいかに簡単であるかを示しています。

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Link to this section理想的なユースケース#

EfficientDetを使用すべき場合: EfficientDetは、TensorFlowパイプラインに深く組み込まれている研究環境や、d0のような初期のアーキテクチャで十分な性能を発揮できる特定のCPU負荷の高い制約下において、依然として有効な選択肢です。

YOLO11を使用すべき場合: YOLO11は、現代のエンタープライズ展開における決定的な選択肢です。その卓越した速度は、自動運転車、リアルタイムのスポーツ分析、および高スループットの製造欠陥検出に最適です。さらに、その低いメモリ使用量は、NVIDIA Jetsonのようなリソースが制限されたハードウェア上での柔軟な展開を可能にします。

Link to this section今後の展望: YOLO26へのアップグレード#

YOLO11は非常に高性能ですが、新しいプロジェクトを開始する開発者は、実績のあるYOLOv8や、新たにリリースされたYOLO26などの他のUltralyticsアーキテクチャを評価すべきです。2026年初頭にリリースされたYOLO26は、YOLO11の基盤を受け継ぎ、いくつかの画期的なイノベーションを導入しています。

エンドツーエンドのNMSフリー設計: YOLOv10のレガシーを基盤として、YOLO26は後処理中の非最大値抑制 (NMS) を完全に排除し、レイテンシを大幅に削減してデプロイパイプラインを簡素化しました。
MuSGDオプティマイザ: 標準のSGDとMuon（大規模言語モデルのトレーニングに触発されたもの）を組み合わせたハイブリッドオプティマイザで、トレーニングの安定性が劇的に向上しました。
CPU推論が最大43%高速化: 特殊な最適化により、ディスクリートGPUを持たないエッジデバイス上でYOLO26は非常に強力に動作します。
ProgLoss + STAL: 小物体検出を著しく改善する高度な損失関数で、航空画像やロボット工学において重要です。

Explore the broader landscape of vision architectures, including transformer-based detectors like RT-DETR, in our comprehensive Ultralytics Docs.

貢献者

GLglenn-jocher¹³ PDpderrenger¹

作成日 2025年1月27日更新日 3 週間前