EfficientDet vs. YOLO26: 物体検出アーキテクチャの徹底比較
物体検出モデルを選択する際、開発者はアーキテクチャの複雑さ、速度、精度間のトレードオフを考慮することがよくあります。この詳細な比較では、GoogleのEfficientDetとUltralytics YOLO26の技術的な違いを探り、それらの設計思想、性能指標、および実世界でのデプロイメントへの適合性を分析します。
アーキテクチャの概要
両モデルとも物体検出問題の解決を目指していますが、効率性とスケーリングに対するアプローチは根本的に異なります。EfficientDetは複合スケーリング手法に依存する一方、YOLO26はエッジ性能に最適化された、合理化されたエンドツーエンドアーキテクチャを重視しています。
EfficientDet: スケーラブルな特徴融合
著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
組織:Google
日付: 2019年11月20日
リンク:Arxiv | GitHub
EfficientDetは、簡単かつ高速なマルチスケール特徴融合を可能にするBiFPN (Bidirectional Feature Pyramid Network)の概念を導入しました。これは、バックボーン、特徴ネットワーク、およびボックス/クラス予測ネットワークのすべての解像度、深さ、幅を均一にスケーリングする複合スケーリング手法と組み合わされています。当時としては非常に効果的でしたが、複雑な特徴融合層へのこの大きな依存は、非専門的なハードウェアではより高いレイテンシにつながることがよくあります。
YOLO26: エンドツーエンドの速度とシンプルさ
著者: Glenn Jocher and Jing Qiu
組織:Ultralytics
日付: 2026年1月14日
リンク:Docs | GitHub
YOLO26は、ネイティブなエンドツーエンド (E2E) 推論へのパラダイムシフトを象徴しており、NMS (Non-Maximum Suppression) の必要性を完全に排除しています。この設計選択により、デプロイメントパイプラインが大幅に簡素化されます。Distribution Focal Loss (DFL) モジュールを排除することで、YOLO26はCPUでの推論を最大43%高速化し、エッジコンピューティングにとって優れた選択肢となります。また、SGDとMuonのハイブリッドであるMuSGDオプティマイザを導入し、LLMの革新に触発された学習安定性の向上をもたらします。
主な違い: エンドツーエンド vs. 後処理
EfficientDetは、重複するバウンディングボックスをフィルタリングするためにNMS後処理に依存しており、これは高密度なシーンではボトルネックとなる可能性があります。YOLO26はNMSフリー設計を採用しており、モデルから直接最終予測を出力するため、物体の密度に関わらず一貫したレイテンシを保証します。
パフォーマンス分析
ベンチマークは、特にリソースが限られた環境にデプロイする際に、効率性に大きな違いがあることを示しています。以下のグラフと表は、EfficientDetファミリー (d0-d7) とYOLO26シリーズ (n-x) の間の性能差を示しています。
メトリクス比較表
以下の表は、COCOデータセットでの性能を示しています。特にCPUベンチマークにおいて、YOLO26の劇的な速度優位性にご注目ください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
速度とレイテンシ
EfficientDetはまずまずの精度を達成しますが、その複雑なBiFPN層と大規模なスケーリング操作により、レイテンシの問題を抱えることがよくあります。対照的に、YOLO26は優れた速度と精度のトレードオフを提供します。例えば、YOLO26sはEfficientDet-d3に対し、精度(mAP 48.6% vs 47.5%)で優れており、かつFLOPs(20.7B vs 24.9B)を大幅に低く抑え、GPU上での推論速度(2.5ms vs 19.59ms)も格段に高速です。
メモリとリソース要件
YOLO26は、厳格なメモリ制約のある環境でその真価を発揮します。DFLの削除と合理化されたアーキテクチャにより、トレーニング中のVRAM使用量が削減され、エクスポートファイルのサイズも小さくなります。EfficientDetモデルは大規模なサイズにスケールアップできますが(d7はかなりの計算能力を必要とします)、Ultralyticsエコシステムは、重いTransformerベースのモデルや古い重いアーキテクチャとは異なり、最大のYOLO26バリアントでさえ標準的なコンシューマーハードウェアでトレーニング可能であることを保証します。
主要な特徴と革新
学習の安定性と収束
YOLO26のユニークな利点は、MuSGDオプティマイザの統合です。Moonshot AIのKimi K2に触発されたこのオプティマイザは、トレーニングダイナミクスを安定させ、EfficientDetの複雑な複合スケーリングにしばしば必要とされる標準的な最適化手法と比較して、より高い学習率と速い収束を可能にします。
小規模オブジェクト検出
EfficientDetはマルチスケールオブジェクトをうまく処理することで知られていますが、YOLO26はProgLoss(Progressive Loss)+ STAL(Small-Target-Aware Label Assignment)を導入しています。これらの特殊な損失関数は、小さなオブジェクトをdetectするという一般的な弱点を特にターゲットにしており、YOLO26を航空画像解析や遠隔監視のようなタスクに非常に適したものにしています。
タスクを横断する汎用性
EfficientDetが主にオブジェクト検出器であるのに対し、YOLO26は統合フレームワークです。YOLO26はネイティブに以下をサポートします:
- インスタンスセグメンテーション(マルチスケールプロトモジュールを使用)
- 姿勢推定(残差対数尤度推定を使用)
- Oriented Bounding Boxes (OBB)(特殊な角度損失を使用)
- 画像分類
実際のユースケース
エッジデプロイメントとIoT
理想的なモデル:YOLO26n Raspberry PiやNVIDIA Jetson Nanoで動作するアプリケーションにとって、YOLO26nは明確な勝者です。そのCPU最適化により、専用GPUなしでリアルタイム処理が可能です。
- アプリケーション:人やペットをdetectするスマートホームセキュリティカメラ。
- 理由:EfficientDet-d0はCPU上で著しく遅く、リアルタイムフィードでフレームを見逃す可能性があります。
高精度産業検査
理想的なモデル:YOLO26x / EfficientDet-d7 精度が最重要であり、ハードウェアが制約とならないシナリオ(例:サーバーサイド処理)では、どちらのモデルも実行可能です。しかし、YOLO26xはEfficientDet-d7(53.7%)よりも高いmAP(57.5%)を、推論時間のごく一部で提供します。
- アプリケーション:製造品質管理において、組み立てライン上の微細な欠陥をdetectします。
- 理由:YOLO26xのSTAL機能は、古いアーキテクチャでは見逃される可能性のある微細な欠陥の検出を改善します。
ユーザビリティとエコシステム
最も重要な違いの一つは、開発者エクスペリエンスにあります。EfficientDetは強力であるものの、TensorFlow Object Detection APIやAutoMLスイート内で複雑な設定を必要とすることがよくあります。
Ultralyticsは使いやすさを優先しています。シンプルなpython APIを使用することで、ユーザーは数行のコードでモデルをロード、トレーニング、デプロイできます:
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Ultralyticsを取り巻くよく整備されたエコシステムには、データアノテーション、実験追跡、そしてONNX、TensorRT、CoreMLなどの形式へのエクスポートのためのシームレスな統合が含まれています。この広範なサポートネットワークにより、開発者はインフラのデバッグに費やす時間を削減し、アプリケーションの改良により多くの時間を費やすことができます。
類似モデル
Ultralyticsフレームワーク内の他の最新アーキテクチャの探索にご興味があれば、以下をご覧ください:
結論
EfficientDetは特徴量スケーリングにおいて重要な概念を導入しましたが、YOLO26は2026年における最先端を代表します。そのアーキテクチャの革新、特にNMSフリーのエンドツーエンド設計、MuSGDオプティマイザ、およびDFLの削除は、速度と精度の両方において明確な利点を提供します。
トレーニングが容易で、エッジデバイスに効率的にデプロイできる多用途で高性能なモデルを求める開発者にとって、YOLO26は推奨される選択肢です。Ultralyticsエコシステムへの統合により、データセット準備から本番環境へのデプロイまで、機械学習プロジェクトのライフサイクルがさらに簡素化されます。