EfficientDet vs. YOLO26: 包括的な技術比較
スケーラブルで効率的なAIシステムを構築する上で、適切なコンピュータビジョンアーキテクチャの選択は極めて重要なステップです。この包括的なガイドでは、Googleの従来のEfficientDetと最先端のUltralytics YOLO26について、詳細な技術比較を行います。両者の基盤となるアーキテクチャ、パフォーマンス指標、およびトレーニング手法を評価し、特定のデプロイ制約に最適なモデルを選択できるよう支援します。
モデル系統と作者
これらのアーキテクチャの起源を理解することは、その設計思想と想定される使用事例に関する貴重な背景情報を提供する。
EfficientDet
著者: Mingxing Tan, Ruoming Pang, Quoc V. Le
所属: Google Research
日付: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl/efficientdet
YOLO26
著者: Glenn Jocher および Jing Qiu
組織: Ultralytics
日付: 2026-01-14
GitHub: ultralytics/ultralytics
アーキテクチャの革新
これら2つのモデルのアーキテクチャの違いは顕著であり、過去数年間の深層学習の急速な進歩を反映している。
EfficientDetは、BiFPN(双方向特徴ピラミッドネットワーク)を中心に構築され、解像度、深さ、幅にわたる複合スケーリング手法を利用しています。2019年には優れた理論的効率を達成しましたが、レガシーなTensorFlowフレームワークと、カスタムデータセットへの適応がしばしば煩雑な複雑なAutoML探索アルゴリズムに大きく依存しています。
対照的に、Ultralytics リアルタイムコンピュータービジョンの絶対的な最先端技術である。現代のデプロイメントパイプライン向けに特別に設計された、画期的なアーキテクチャ改良を複数導入している:
- エンドツーエンドのNMSフリー設計: YOLO26はネイティブにエンドツーエンドであり、Non-Maximum Suppression (NMS) の後処理の必要性を完全に排除します。この画期的なアプローチは、YOLOv10で初めて開拓され、より高速でシンプルなデプロイメントロジックを保証し、エッジチップ上でのレイテンシのばらつきを劇的に低減します。
- DFLの削除: Distribution Focal Loss (DFL)を削除することで、YOLO26は出力ヘッドを簡素化し、エッジコンピューティングおよび低電力デバイスとの優れた互換性をもたらします。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のような大規模言語モデルの革新に触発され、YOLO26はSGDとMuonのハイブリッドであるMuSGDオプティマイザを利用しています。これにより、標準的なオプティマイザよりも劇的に安定した学習と高速な収束が実現されます。
- ProgLoss + STAL: Progressive Loss と Scale-aware Task-aligned Learning (STAL) の組み合わせの導入は、小オブジェクト認識において顕著な改善をもたらし、航空画像およびロボット工学にとって非常に重要です。
プロの秘訣:NMS
YOLO26はNMSを排除しているため、モデル全体を単一の連続した計算グラフとして実行できます。これにより、ONNXやTensorRTのような形式へのエクスポートが非常に簡単になり、NPU/GPUの利用率が最大化されます。
性能指標とベンチマーク
物体検出モデルの真価は、実世界での性能にこそ現れる。下表は、平均精度(mAP)で測定した精度と、推論速度および計算要件を比較したものである。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
上記で示されているように、YOLO26ははるかに優れたパフォーマンスバランスを提供します。古いアーキテクチャが理論上のFLOPsが低い場合がある一方で、YOLO26は最適化されたメモリアクセスパターンを利用して、GPU推論を大幅に高速化します。例えば、YOLO26xは、同等のEfficientDet-d7よりもTensorRTハードウェアで約10倍高速に動作しながら、驚異的な57.5 mAPを達成します。さらに、YOLO26は、従来のYOLOバリアントと比較して最大43%高速なCPU推論を実現する最適化を特徴としており、エッジAIにとって最高の選択肢となっています。
Ultralyticsエコシステムの利点
アーキテクチャの選択は、理論的なFLOPsだけにとどまることは稀で、エンジニアリングワークフローに大きく依存します。開発者は、比類のない使いやすさから、Ultralyticsを日常的に好んで使用します。
EfficientDetのトレーニングには、複雑な依存関係の管理、手動によるハイパーパラメータ調整、レガシーなTensorFlowセットアップがしばしば必要です。対照的に、Ultralyticsモデルは洗練されたシンプルなAPIを特徴としています。このシームレスな体験は、クラウドトレーニング、データアノテーション、リアルタイムの実験追跡をすぐに処理できるUltralytics Platformに直接拡張されます。
さらに、トランスフォーマーベースの検出器や複雑なAutoMLモデルは、膨大なメモリ消費量に悩まされています。Ultralytics 極めて効率的なメモリ要件で知られており、コンシューマー向けハードウェア上で堅牢なモデルをトレーニングでき、メモリ不足(OOM)エラーに遭遇することはありません。
汎用性とタスクサポート
EfficientDetは厳密には物体検出ネットワークです。YOLO26は統合されたマルチタスク学習器であり、アーキテクチャにネイティブに組み込まれたタスク固有のイノベーションが含まれています。
- 意味的セグメンテーション損失とマルチスケールプロトによる完璧なインスタンスセグメンテーション。
- 残差対数尤度推定(RLE)による姿勢推定精度の劇的な向上
- オリエンテッド・バウンディング・ボックス(OBB)における境界問題を解決するための、角度損失処理に特化したルーチン。
レガシーサポート
古いシステムを維持している場合でも、Ultralytics 完全にサポートします YOLO11 およびそれ以前のバージョンを、全く同じAPIで完全にサポートしています。ただし、新規開発においては、YOLO26がリソース対精度において最高のパフォーマンスを提供します。
ユースケースと推奨事項
EfficientDetとYOLO26の選択は、特定のプロジェクト要件、デプロイ制約、およびエコシステム設定に依存します。
EfficientDetを選択するタイミング
EfficientDetは、以下の用途に強力な選択肢です。
- Google CloudおよびTPUパイプライン: EfficientDetがネイティブ最適化されているGoogle Cloud Vision APIまたはTPUインフラストラクチャと深く統合されたシステム。
- 複合スケーリング研究:バランスの取れたネットワークの深さ、幅、解像度のスケーリング効果を研究することに焦点を当てた学術的なベンチマーク。
- TFLiteを介したモバイルデプロイメント: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。
YOLO26を選択すべき時
YOLO26は以下に推奨されます:
- NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
- CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
- 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。
実装例:YOLO26のトレーニング
Ultralytics Python のおかげで、高度に最適化されたトレーニングの実行を開始するのに必要なコードはわずか数行です。このフレームワークは、混合精度スケーリングやPyTorchを介したGPU ネイティブに処理します。 PyTorchによるマルチGPUオーケストレーション、データ拡張パイプラインをネイティブに処理します。
from ultralytics import YOLO
# Load the lightweight, end-to-end YOLO26n model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset leveraging the robust MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Automatically engages GPU acceleration
)
# Export natively to ONNX without NMS plugins
exported_path = model.export(format="onnx")
print(f"Model seamlessly exported to: {exported_path}")
結論: どのモデルを選ぶべきか?
EfficientDetとYOLO26を比較すると、業界の動向は明らかである。EfficientDetは複合スケーリング研究における重要な歴史的足場であり続ける。しかし、クラウドクラスターに展開されるか、制約のあるRaspberry Piデバイスに展開されるかを問わず、現代のアプリケーションにおいては、選択はUltralyticsに大きく偏っている。
NMSを排除し、VRAMの大幅な削減に最適化し、世界クラスの開発者エコシステムに技術を組み込むことで、YOLO26は、堅牢で本番環境に対応したコンピュータビジョンにとって、間違いなく推奨されるアーキテクチャです。製造上の欠陥をdetectする場合でも、農業収量をマッピングする場合でも、Ultralytics Platformは、比類のない速度と精度でデータセットからデプロイメントまでを実現します。