YOLO26 対 EfficientDet: アーキテクチャ、パフォーマンス、およびユースケース
過去10年間で、オブジェクトdetectの状況は大きく進化しました。この分野を形成してきた2つの注目すべきアーキテクチャは、Ultralytics YOLO26とGoogleのEfficientDetです。EfficientDetが2019年にマルチスケール特徴を扱うスケーラブルで効率的な方法を導入した一方で、YOLO26は2026年におけるリアルタイムコンピュータビジョンの最先端を表しており、エンドツーエンドの処理とエッジデバイス上での優れた速度を提供します。
このガイドでは、開発者、研究者、エンジニアが自身のアプリケーションに適したモデルを選択できるよう支援するため、詳細な技術比較を提供します。
モデル概要
Ultralytics YOLO26
2026年1月にリリースされたYOLO26は、著名なYOLO(You Only Look Once)ファミリーの最新イテレーションです。これは、非最大抑制(NMS)の後処理の必要性を排除することでデプロイメントパイプラインを簡素化する、ネイティブなNMSフリーのエンドツーエンドアーキテクチャを導入しています。極限の効率性を目指して設計されており、エッジコンピューティングのシナリオで優れており、精度を犠牲にすることなくCPU上で大幅な高速化を実現します。
主要著者: Glenn Jocher and Jing Qiu
組織:Ultralytics
リリース日: 2026-01-14
ライセンス:AGPL-3.0 (エンタープライズ版あり)
Google EfficientDet
EfficientDetは、2019年後半にGoogle Brainチーム(現Google DeepMind)によって提案されました。これは、バックボーン、特徴ネットワーク、予測ネットワークの解像度、深さ、幅を均一にスケーリングする複合スケーリング手法を利用し、効率性とスケーラビリティに焦点を当てています。その核となるイノベーションは、容易かつ高速なマルチスケール特徴融合を可能にする双方向特徴ピラミッドネットワーク(BiFPN)でした。
主要著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
組織: Google
リリース日: 2019-11-20
ライセンス: Apache 2.0
パフォーマンス比較
これら2つのアーキテクチャを比較すると、最も顕著な違いは推論速度とデプロイメントの複雑さにあります。EfficientDetが2019年に効率性のベンチマークを設定した一方で、YOLO26は最新の最適化を活用してそれを大幅に上回っており、特にエッジデプロイメントに不可欠なCPUベースの推論において顕著です。
以下の表は、COCOデータセットにおけるパフォーマンス指標を示しています。YOLO26シリーズの顕著な速度優位性に注目してください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
ベンチマークの背景
Speed CPU ONNXメトリックは、標準ハードウェア上の実世界アプリケーションにとって特に重要です。YOLO26nは驚異的な38.9msのレイテンシを達成し、非アクセラレーションデバイスでのリアルタイムビデオ処理に実行可能です。対照的に、EfficientDetのより高いイテレーションは高レイテンシに悩まされ、ライブストリーム処理にはあまり適していません。
アーキテクチャの深掘り
YOLO26 イノベーション
YOLO26は、以前のモデルに見られた従来のアンカーベースのdetectロジックからの脱却を表しています。
- NMSフリーのエンドツーエンドロジック: EfficientDetのような従来の検出器は、重複するバウンディングボックスをフィルタリングするために非最大抑制(NMS)を必要とします。このステップは計算コストが高く、ハードウェアアクセラレータでの最適化が困難です。YOLO26はこれを完全に排除し、オブジェクトの正確なセットを直接予測します。
- MuSGDオプティマイザ: 大規模言語モデル (LLM) のトレーニングに触発され、YOLO26はSGDとMuonを組み合わせたハイブリッドオプティマイザを利用します。これにより、カスタムモデルトレーニング中により安定したトレーニングダイナミクスと高速な収束がもたらされます。
- DFLの削除: Distribution Focal Loss (DFL)を削除することで、モデルアーキテクチャが簡素化されます。この複雑さの軽減は、推論速度の向上と、ONNXやTensorRTのような形式へのエクスポートの容易さへと直接つながります。
- ProgLoss + STAL: Progressive Loss BalancingとSmall-Target-Aware Label Assignmentの導入により、単段検出器にとって長年の課題であった小規模オブジェクト検出の性能が大幅に向上します。
EfficientDetアーキテクチャ
EfficientDetはEfficientNetバックボーンに基づいて構築されており、BiFPN (Bi-directional Feature Pyramid Network)を導入しています。
- 複合スケーリング: EfficientDetは、複合係数(phi)を使用して、解像度、幅、深さを同時にスケーリングします。これにより、ユーザーはD0からD7まで、精度とリソースのトレードオフを体系的に行うことができます。
- BiFPN: 標準的なFPNとは異なり、BiFPNは情報をトップダウンとボトムアップの両方向に流すことができ、学習可能な重みを使用して、異なる入力特徴の重要性を決定します。
- アンカーベース: EfficientDetは、事前定義されたアンカーボックスのセットに依存しており、カスタムデータセットで最適なパフォーマンスを得るためには、アスペクト比とスケールの慎重な調整が必要です。
ユーザビリティとエコシステム
YOLO26とEfficientDetを使用する上での決定的な違いの1つは、それらを取り巻くソフトウェアエコシステムです。
Ultralyticsのエクスペリエンス
Ultralyticsは使いやすさと統一されたAPIを優先しています。物体検出、インスタンスセグメンテーション、姿勢推定、または指向性物体検出 (OBB)のいずれを実行する場合でも、構文は一貫しています。
- シンプルなpython API: モデルのトレーニングはわずか数行のコードで実行できます。
- 汎用性: YOLO26は、すぐに複数のタスクをサポートします。EfficientDetは主に物体検出器ですが、カスタム実装によりセグメンテーションヘッドを追加することも可能です。
- デプロイメント対応: Ultralyticsエコシステムには、CoreML、TFLite、OpenVINOなどへのエクスポートの組み込みサポートが含まれており、研究から生産への道を効率化します。
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
EfficientDet エコシステム
EfficientDetは通常、TensorFlow Object Detection APIまたはさまざまなPyTorch実装を介してアクセスされます。これらは強力ですが、これらのフレームワークは、より多くのボイラープレートコード、複雑な構成ファイル、および初心者にとってはより急な学習曲線が必要となることがよくあります。カスタムデータで効率的にトレーニングするには、YOLOモデルの「すぐに使える」状態と比較して、多くの場合、かなりのハイパーパラメータチューニングが必要です。
ユースケースの推奨事項
YOLO26を選択すべき時
YOLO26は、ほとんどの最新のコンピュータービジョンアプリケーションにとって理想的な選択肢です。具体的には次のとおりです。
- エッジコンピューティング: Raspberry Pi、モバイルデバイス (iOS/Android)、またはNVIDIA Jetsonにデプロイする場合、最大43%高速なCPU推論により、YOLO26が優れています。
- リアルタイムビデオ: 自動運転やセキュリティ監視など、高FPSを必要とするアプリケーションでは、YOLO26の低遅延が非常に重要です。
- 複雑なタスク: プロジェクトが検出だけでなく、姿勢推定やセグメンテーションも含む場合、単一の統合フレームワークを利用することで、開発オーバーヘッドが削減されます。
- 迅速なプロトタイピング: 活発なコミュニティと豊富なドキュメントにより、開発者は迅速に反復作業を行うことができます。
EfficientDetを検討すべき時
一般的に低速ですが、EfficientDetは特定の研究コンテキストにおいて依然として関連性があります。
- 学術研究: 特に特徴ピラミッドネットワークを研究している場合、BiFPNアーキテクチャは貴重な参考資料であり続けます。
- レガシーシステム: 古いTensorFlowバージョンと密接に統合された既存のパイプラインでは、移行するよりも既存のEfficientDetモデルを維持する方が簡単だと感じるかもしれません。
結論
EfficientDetは特徴融合とモデルスケーリングにおいて画期的な概念を導入しましたが、YOLO26は次世代のビジョンAIを代表します。そのエンドツーエンドのNMSフリー設計、優れた推論速度、および低いメモリ要件により、YOLO26は今日のAI課題に対してより実用的で強力なソリューションを提供します。
堅牢なリアルタイムアプリケーションを構築しようとしている開発者にとって、Ultralytics YOLO26の合理化されたワークフローとパフォーマンスバランスは、明確な推奨事項となります。
参考資料
Ultralyticsドキュメントで他のモデルを探す: