YOLO26 vs EfficientDet: 現代的物体検出アーキテクチャの技術的比較
適切なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンアプリケーションの成功にとって不可欠です。この技術ガイドでは、最先端のUltralytics YOLO26とGoogleの確立されたEfficientDetという2つの著名なモデルのトレードオフ、パフォーマンス指標、およびアーキテクチャ革新を探ります。
デプロイ先が高スループットのクラウドサーバーであれ、レイテンシー制約のあるエッジAIデバイスであれ、これらのアーキテクチャの違いを理解することで、速度、精度、効率の最適なバランスを確保できます。
アーキテクチャの概要: YOLO26
著者: Glenn Jocher および Jing Qiu
所属:Ultralytics
日付: 2026-01-14
GitHub:Ultralytics GitHub
ドキュメント:YOLO26 公式ドキュメント
2026年初頭にリリースされたYOLO26は、YOLO 最新進化形であり、比類のないユーザー体験と最高水準の平均精度(mAP)を提供するために特別に設計されています。現代のハードウェア向けに一から設計された本モデルは、物体検出、インスタンスセグメンテーション、画像分類、姿勢推定において卓越した汎用性を発揮します。
YOLO26は、トレーニングの安定性と推論速度の両方を劇的に向上させる画期的な機能をいくつか導入しています:
- エンドツーエンドNMSフリー設計: YOLOv10で開拓された概念に基づいて構築されたYOLO26は、ネイティブにエンドツーエンドであり、Non-Maximum Suppression (NMS)の後処理の必要性を完全に排除します。これにより、デプロイメントロジックが簡素化され、レイテンシのばらつきが大幅に低減されます。
- 最大43%高速なCPU推論: 徹底的なアーキテクチャ最適化により、このモデルは標準的なCPUで前例のない推論速度を達成し、IoTおよび組み込み環境に非常に適しています。
- DFLの削除: Distribution Focal Lossが削除されたことで、よりクリーンなエクスポートプロセスが実現し、ONNXなどのツールを使用する低消費電力エッジデバイスとの互換性が向上します。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のLLMトレーニングルーチンに着想を得たSGDとMuonのこのハイブリッドは、大規模言語モデルのトレーニング革新をコンピュータビジョンに直接もたらし、より速い収束とより安定したトレーニング体制を保証します。
- ProgLoss + STAL: これらの高度な損失関数は、航空ドローン画像やロボティクスを含むアプリケーションにとって重要な要素である小物体認識において、顕著な改善をもたらします。
効率化された輸出
DFL除去とNMSアーキテクチャにより、YOLO26モデルをエッジ対応フォーマット(例: NVIDIA TensorRT や Intel OpenVINO は、カスタムプラグインの開発をほとんど必要としません。
アーキテクチャの概要: EfficientDet
著者: Mingxing Tan、Ruoming Pang、および Quoc V. Le
所属:Google Research
日付: 2019-11-20
Arxiv:EfficientDet 論文
GitHub:Google AutoML リポジトリ
Googleによって導入されたEfficientDetは、 TensorFlow エコシステムを多用し、複合スケーリングの概念に基づいて設計されています。そのアーキテクチャは、リソース制約に基づいてバックボーンネットワーク、特徴ネットワーク、ボックス/クラス予測ネットワークを同時にスケールアップします。
EfficientDetの主な革新点には以下が含まれます:
- BiFPN(双方向特徴ピラミッドネットワーク): 簡単かつ高速なマルチスケール特徴融合を可能にし、ネットワークがさまざまなサイズのオブジェクトをよりよく理解できるようにするメカニズムです。
- 複合スケーリング:解像度、深さ、幅を均一にスケールアップし、d0(最小)からd7(最大)までのモデルファミリーを作成するヒューリスティックな手法。
EfficientDetは厳密なバウンディングボックス検出において堅牢な選択肢であり続ける一方、一般的に現代的なマルチタスクの汎用性(ネイティブのOBBタスクなど)や、合理化された統一された Python エコシステムが不足している。
パフォーマンスとメトリクスの比較
速度と精度のパレートフロンティアを特定するため、COCO 標準環境で両アーキテクチャのベンチマークを実施した。以下の表は、AWS EC2 P4dインスタンス上で測定したモデルサイズ、精度、レイテンシの差異を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
上記の通り、YOLO26は優れたパフォーマンスバランスを確立しています。YOLO26xモデルは最高の精度(57.5 mAP)を達成しており、最も重いEfficientDet-d7を大幅に上回っています。さらに、YOLO26モデルは、大幅に低いメモリ要件と、はるかに高速なGPU推論速度(TensorRTで1.7 msという低さ)を示しており、NMSフリー設計の利点を強調しています。
トレーニング効率とエコシステム優位性
両アーキテクチャの主な違いは、その開発環境にあります。EfficientDetはGoogle AutoMLおよびTensorFlowエコシステムに深く組み込まれており、これは強力である一方で、DOTAv1のようなカスタムデータセットに対しては、急な学習曲線と厳格な設定を伴う可能性があります。
対照的に、Ultralyticsは、PyTorch上に構築された非常に手入れの行き届いたエコシステムを提供しています。トレーニング中のメモリ使用量は厳密に最適化されており、エンジニアはTransformerベースのネットワークでよく見られる過剰なVRAM割り当てを必要とせずに、堅牢なモデルをトレーニングできます。
統合プラットフォーム統合
Ultralytics を通じて、開発者はエンドツーエンドのMLOpsワークフローを利用できます。これにはシームレスなデータアノテーション、自動化されたハイパーパラメータ調整、ワンクリックでのクラウドトレーニングが含まれ、プロトタイピングから本番環境への移行プロセスを大幅に加速します。
実装例
Ultralytics の使いやすさにより、わずか数行のコードで最先端のYOLO26モデルのトレーニングと検証が可能です。
from ultralytics import YOLO
# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")
# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Train on GPU
)
# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")
理想的なユースケース
YOLO26の使用タイミング:
- エッジコンピューティングおよびモバイル: 最大43%高速なCPU推論とNMSオーバーヘッドがないため、YOLO26はRaspberry Piや携帯電話のような計算予算が厳しく制約されたデバイスで優れた性能を発揮します。
- マルチタスク: 単一のパイプラインがバウンディングボックス、segmentマスク、およびtrackを必要とする場合、YOLO26の汎用性は比類がありません。
- ドローンおよび航空画像: ProgLossとSTALの組み合わせにより、高高度からの極めて小さなオブジェクトのdetect性能が大幅に向上します。
EfficientDetの使用タイミング:
- レガシーTensorFlowパイプライン: インフラストラクチャがTensorFlow SavedModelsのみをサポートするように強くハードコードされているか、特定のTensorFlow Servingパイプラインを必要とする場合、EfficientDetはネイティブな互換性を提供します。
- Resource-constrained TPUs: EfficientDetは、GoogleのカスタムTensor Processing Units(TPU)向けに高度に最適化されています。
その他の代替案の探索
このガイドは主にYOLO26とEfficientDetの比較に焦点を当てていますが、より広範なUltralytics には他の優れたアーキテクチャも存在します。アプリケーションがトランスフォーマーに大きく依存している場合、 RT-DETR はリアルタイムのトランスフォーマーベース検出を提供します。あるいは、レガシーシステムをサポートしている場合、 YOLO11 は完全サポートされ、高い効果を発揮します。より広範な概要については、Ultralytics ハブをご覧ください。
結局のところ、今日構築されるあらゆる現代的なコンピュータビジョンパイプラインにおいて、YOLO26の圧倒的な処理速度、使いやすさ、そして最先端の精度は、研究者にも開発者にも疑いようのない推奨選択肢となる。