YOLO26対EfficientDet:最新の物体検出アーキテクチャの技術的比較
適切なニューラルネットワークアーキテクチャを選択することは、あらゆるコンピュータビジョンアプリケーションの成功に不可欠です。この技術ガイドでは、最先端のUltralytics YOLO26とGoogleの確立されたEfficientDetという2つの著名なモデルのトレードオフ、パフォーマンスメトリクス、およびアーキテクチャの革新について解説します。
デプロイ対象が高スループットのクラウドサーバーであれ、レイテンシが制限されるエッジAIデバイスであれ、これらのアーキテクチャの違いを理解することで、速度、精度、効率の最適なバランスを確保できます。
アーキテクチャの概要:YOLO26
著者: Glenn Jocher、Jing Qiu 組織: Ultralytics 日付: 2026年1月14日 GitHub: Ultralytics GitHub ドキュメント: YOLO26公式ドキュメント
2026年初頭にリリースされたYOLO26は、YOLOファミリーの最新の進化形であり、比類のないユーザー体験と最高レベルの平均精度(mAP)を提供するように特別に設計されています。最新のハードウェア向けにゼロから設計されており、物体検出、インスタンスセグメンテーション、画像分類、姿勢推定全体で卓越した汎用性を発揮します。
YOLO26は、学習の安定性と推論速度の両方を大幅に向上させるいくつかの画期的な機能を導入しています。
- エンドツーエンドのNMSフリー設計: YOLOv10で先駆的に導入されたコンセプトに基づき、YOLO26はネイティブなエンドツーエンド設計となっており、非最大値抑制(NMS)の後処理が完全に不要になりました。これにより、デプロイのロジックが簡素化され、レイテンシの変動が大幅に抑えられます。
- 最大43%高速なCPU推論: 深いアーキテクチャの最適化により、標準的なCPU上で前例のない推論速度を達成しており、IoTや組み込み環境に最適です。
- DFLの削除: Distribution Focal Loss(DFL)が削除されたことで、エクスポートプロセスがクリーンになり、ONNXのようなツールを使用する低電力エッジデバイスとの互換性が向上しました。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のLLM学習ルーチンに着想を得たこのSGDとMuonのハイブリッドは、大規模言語モデルの学習における革新を直接コンピュータビジョンにもたらし、より高速な収束と安定した学習体制を保証します。
- ProgLoss + STAL: これらの高度な損失関数は、航空ドローンの画像やロボティクスに関わるアプリケーションで重要な、小型物体の認識精度を顕著に向上させます。
DFLの削除とNMSフリーのアーキテクチャにより、YOLO26モデルをNVIDIA TensorRTやIntel OpenVINOといったエッジフレンドリーなフォーマットへエクスポートする際、カスタムプラグインの開発は実質的に不要です。
アーキテクチャの概要:EfficientDet
著者: Mingxing Tan、Ruoming Pang、Quoc V. Le 組織: Google Research 日付: 2019年11月20日 Arxiv: EfficientDet論文 GitHub: Google AutoMLリポジトリ
Googleによって導入されたEfficientDetは、TensorFlowエコシステムを最大限に活用しており、コンパウンドスケーリング(複合スケーリング)の概念に基づいて設計されています。そのアーキテクチャは、リソースの制約に応じて、バックボーンネットワーク、特徴ネットワーク、およびボックス/クラス予測ネットワークを同時にスケーリングします。
EfficientDetの主な革新は以下の通りです。
- BiFPN(双方向特徴ピラミッドネットワーク): 簡単かつ高速なマルチスケール特徴融合を可能にするメカニズムであり、ネットワークが様々なサイズの物体をより正確に把握できるようにします。
- コンパウンドスケーリング: 解像度、深さ、幅を均一にスケーリングするためのヒューリスティック手法であり、d0(最小)からd7(最大)までのモデルファミリーを作成します。
EfficientDetは厳密なバウンディングボックス検出においては依然として強力な選択肢ですが、現代の開発者が期待する最新のマルチタスクの汎用性(ネイティブなOBBタスクなど)や、合理化された統一的なPythonエコシステムが不足しています。
パフォーマンスとメトリクスの比較
速度と精度のパレートフロンティアを特定するために、私たちはCOCOデータセットを使用して標準的な環境で両方のアーキテクチャをベンチマークしました。以下の表は、AWS EC2 P4dインスタンスで測定されたモデルサイズ、精度、レイテンシの違いを強調しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
上記のように、YOLO26は優れたパフォーマンスバランスを確立しています。YOLO26xモデルは最高精度(57.5 mAP)を達成し、最もヘビーなEfficientDet-d7を大幅に上回っています。さらに、YOLO26モデルはメモリ要件が大幅に低く、GPU推論速度も非常に高速(TensorRT上で1.7 msと非常に低速)であり、NMSフリー設計の利点が際立っています。
学習効率とエコシステムの利点
両アーキテクチャの大きな違いは、開発環境にあります。EfficientDetはGoogle AutoMLおよびTensorFlowエコシステムに深く組み込まれており、強力である一方、DOTAv1のようなカスタムデータセットに対しては、急峻な学習曲線や厳格な構成が必要になる場合があります。
対照的に、UltralyticsはPyTorch上に構築された非常にメンテナンス性の高いエコシステムを提供しています。学習中のメモリ使用量は厳密に最適化されており、Transformerベースのネットワークにありがちな過剰なVRAM割り当てを必要とせずに、エンジニアは堅牢なモデルを学習できます。
Ultralytics Platformを通じて、開発者はエンドツーエンドのMLOpsワークフローを利用できます。これには、シームレスなデータアノテーション、自動ハイパーパラメータチューニング、ワンクリックでのクラウド学習が含まれており、プロトタイピングからプロダクションへの移行を大幅に加速させます。
実装例
Ultralytics APIが提供する使いやすさにより、わずか数行のコードで最先端のYOLO26モデルを学習および検証できます。
from ultralytics import YOLO
# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")
# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Train on GPU
)
# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")理想的な使用ケース
YOLO26の使用推奨ケース:
- エッジコンピューティングとモバイル: 最大43%高速なCPU推論とNMSオーバーヘッドなしという特徴により、YOLO26はRaspberry Piや携帯電話のように計算予算が厳しく制限されたデバイスで優れた性能を発揮します。
- マルチタスク: 1つのパイプラインでバウンディングボックス、セグメンテーションマスク、トラッキングが必要な場合、YOLO26の汎用性は他に類を見ません。
- ドローンと航空画像: ProgLossとSTALの組み合わせにより、高高度からの非常に小さな物体の検出精度が大幅に向上します。
EfficientDetの使用推奨ケース:
- レガシーなTensorFlowパイプライン: インフラがTensorFlow SavedModelのみをサポートするようにハードコードされている場合や、特定のTensorFlow Servingパイプラインを必要とする場合、EfficientDetはネイティブな互換性を提供します。
- リソース制約のあるTPU: EfficientDetは、GoogleのカスタムTensorプロセッシングユニット(TPU)向けに高度に最適化されています。
他の代替案の検討
このガイドではYOLO26対EfficientDetのパラダイムに焦点を当てていますが、より広範なUltralyticsエコシステムには他の素晴らしいアーキテクチャが多数存在します。アプリケーションがTransformerに大きく依存している場合は、RT-DETRがリアルタイムのTransformerベースの検出を提供します。あるいは、レガシーシステムをサポートしている場合は、YOLO11が完全サポートされており、非常に効果的です。より広範な概要については、Ultralyticsモデル比較ハブをご覧ください。
最終的に、今日構築されるあらゆる現代的なコンピュータビジョンパイプラインにおいて、YOLO26の圧倒的な速度、使いやすさ、および最先端の精度は、研究者と開発者の双方にとって議論の余地のない推奨モデルです。