YOLO26 vs EfficientDet: 現代的物体検出アーキテクチャの技術的比較
適切なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンアプリケーションの成功にとって極めて重要です。本技術ガイドでは、Ultralytics GoogleされたEfficientDetという2つの主要モデルについて、トレードオフ、性能指標、アーキテクチャの革新性を探ります。
デプロイ先が高スループットのクラウドサーバーであれ、レイテンシー制約のあるエッジAIデバイスであれ、これらのアーキテクチャの違いを理解することで、速度、精度、効率の最適なバランスを確保できます。
アーキテクチャ概要: YOLO26
著者:Glenn Jocher と Jing Qiu
組織:Ultralytics
日付:2026-01-14
GitHub:Ultralytics
ドキュメント:YOLO26 公式ドキュメント
2026年初頭にリリースされたYOLO26は、YOLO 最新進化形であり、比類のないユーザー体験と最高水準の平均精度(mAP)を提供するために特別に設計されています。現代のハードウェア向けに一から設計された本モデルは、物体検出、インスタンスセグメンテーション、画像分類、姿勢推定において卓越した汎用性を発揮します。
YOLO26は、トレーニングの安定性と推論速度の両方を劇的に向上させる画期的な機能をいくつか導入しています:
- エンドツーエンドNMS設計: YOLOv10先駆的に導入された概念を基盤とし、YOLOv26はネイティブにエンドツーエンドであり、ノンマキシマムサプレッション(NMS)後処理を完全に不要とします。これにより、デプロイロジックが簡素化され、レイテンシのばらつきが大幅に低減されます。
- 最大43%高速CPU :深いアーキテクチャ最適化により、標準CPU上で前例のない推論速度を実現。IoTや組み込み環境に最適です。
- DFL除去:分布焦点損失が除去され、エクスポートプロセスが簡素化され、ONNXなどのツールを使用する低電力エッジデバイスとの互換性が向上しました。 ONNXなどのツールを使用する低電力エッジデバイスとの互換性が向上しました。
- MuSGDオプティマイザー: Moonshot AIのKimi K2が採用するLLMトレーニング手法に着想を得た、SGD ミューオンのハイブリッド手法。大規模言語モデル(LLM)のトレーニング革新をコンピュータビジョンに直接適用し、収束速度の向上とトレーニングプロセスの安定化を実現します。
- ProgLoss + STAL:これらの高度な損失関数は、小型物体認識において顕著な改善をもたらす。これは、航空ドローン画像やロボティクスを扱うアプリケーションにとって重要な要素である。
効率化された輸出
DFL除去とNMSアーキテクチャにより、YOLO26モデルをエッジ対応フォーマット(例: NVIDIA TensorRT や Intel OpenVINO は、カスタムプラグインの開発をほとんど必要としません。
アーキテクチャ概要: EfficientDet
著者:Mingxing Tan, Ruoming Pang, Quoc V. Le
組織:Google
日付:2019-11-20
Arxiv:EfficientDet Paper
GitHub:Google リポジトリ
Googleによって導入されたEfficientDetは、 TensorFlow エコシステムを多用し、複合スケーリングの概念に基づいて設計されています。そのアーキテクチャは、リソース制約に基づいてバックボーンネットワーク、特徴ネットワーク、ボックス/クラス予測ネットワークを同時にスケールアップします。
EfficientDetの主な革新点には以下が含まれます:
- BiFPN(双方向特徴ピラミッドネットワーク):容易かつ高速なマルチスケール特徴融合を可能にするメカニズムであり、これによりネットワークは様々なサイズの物体をより良く理解できるようになる。
- 複合スケーリング:解像度、深さ、幅を均一に拡大するヒューリスティック手法。d0(最小)からd7(最大)までのモデル群を生成する。
EfficientDetは厳密なバウンディングボックス検出において堅牢な選択肢であり続ける一方、一般的に現代的なマルチタスクの汎用性(ネイティブのOBBタスクなど)や、合理化された統一された Python エコシステムが不足している。
パフォーマンスとメトリクスの比較
速度と精度のパレートフロンティアを特定するため、COCO 標準環境で両アーキテクチャのベンチマークを実施した。以下の表は、AWS EC2 P4dインスタンス上で測定したモデルサイズ、精度、レイテンシの差異を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
上記のように、YOLO26は優れた性能バランスを実現している。YOLO26xモデルは最高精度(57.5mAP)を達成し、最も重いEfficientDet-d7を大幅に上回った。さらに、YOLO26モデルはメモリ要件が大幅に低く、GPU はるかに高速(TensorRT 1.7msまで短縮)であり、NMSの利点を裏付けている。
トレーニング効率とエコシステム優位性
両アーキテクチャの主な違いは開発環境に存在する。EfficientDetGoogle TensorFlow に深く組み込まれており、その機能性は高いものの、DOTAv1のようなカスタムデータセットに対しては急峻な学習曲線や硬直的な設定を伴う可能性がある。
一方、Ultralytics PyTorch。トレーニング時のメモリ使用量は厳密に最適化されており、エンジニアはトランスフォーマーベースのネットワークで一般的な過剰なVRAM割り当てを必要とせずに、堅牢なモデルをトレーニングできます。
統合プラットフォーム統合
Ultralytics を通じて、開発者はエンドツーエンドのMLOpsワークフローを利用できます。これにはシームレスなデータアノテーション、自動化されたハイパーパラメータ調整、ワンクリックでのクラウドトレーニングが含まれ、プロトタイピングから本番環境への移行プロセスを大幅に加速します。
実装例
Ultralytics の使いやすさにより、わずか数行のコードで最先端のYOLO26モデルのトレーニングと検証が可能です。
from ultralytics import YOLO
# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")
# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Train on GPU
)
# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")
理想的なユースケース
YOLO26の使用タイミング:
- エッジコンピューティングとモバイル: CPU 最大43%高速化され、NMS 発生しないため、YOLO26はラズベリーパイやスマートフォンなど、計算リソースが厳しく制限されたデバイスで優れた性能を発揮します。
- マルチタスク処理:単一のパイプラインでバウンディングボックス、セグメンテーションマスク、追跡を必要とする場合、YOLO26の汎用性は他に類を見ない。
- ドローン・航空撮影画像:ProgLossとSTALの組み合わせにより、高高度からの極小物体の検出能力が大幅に向上します。
EfficientDetの使用タイミング:
- レガシーTensorFlow :インフラストラクチャがTensorFlow のみをサポートするようハードコードされている場合や、特定のTensorFlow パイプラインを必要とする場合、EfficientDet はネイティブな互換性を提供します。
- リソース制約のあるTPU:EfficientDetGoogle Tensor Unit(TPU)向けに大幅に最適化されています。
他の選択肢の検討
このガイドは主にYOLO26とEfficientDetの比較に焦点を当てていますが、より広範なUltralytics には他の優れたアーキテクチャも存在します。アプリケーションがトランスフォーマーに大きく依存している場合、 RT-DETR はリアルタイムのトランスフォーマーベース検出を提供します。あるいは、レガシーシステムをサポートしている場合、 YOLO11 は完全サポートされ、高い効果を発揮します。より広範な概要については、Ultralytics ハブをご覧ください。
結局のところ、今日構築されるあらゆる現代的なコンピュータビジョンパイプラインにおいて、YOLO26の圧倒的な処理速度、使いやすさ、そして最先端の精度は、研究者にも開発者にも疑いようのない推奨選択肢となる。