Link to this sectionYOLO26 vs EfficientDet#
適切なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンアプリケーションの成功にとって極めて重要です。本テクニカルガイドでは、最先端のUltralytics YOLO26と、実績のあるGoogleのEfficientDetという2つの著名なモデルについて、そのトレードオフ、性能指標、およびアーキテクチャ上の革新性を比較検討します。
デプロイ対象がハイスループットなクラウドサーバーであれ、レイテンシに制約のあるエッジAIデバイスであれ、これらのアーキテクチャ間の違いを理解することで、速度、精度、効率の最適なバランスを確保できます。
Link to this sectionアーキテクチャの概要:YOLO26#
著者: Glenn Jocher および Jing Qiu 組織: Ultralytics 日付: 2026-01-14 GitHub: Ultralytics GitHub ドキュメント: YOLO26 公式ドキュメント
2026年初頭にリリースされたYOLO26は、YOLOファミリーの最新の進化形であり、比類のないユーザー体験と最高レベルの平均精度(mAP)を提供するように特別に設計されています。現代のハードウェア向けにゼロから設計されており、物体検出、インスタンスセグメンテーション、画像分類、姿勢推定全体で卓越した汎用性を発揮します。
YOLO26は、学習の安定性と推論速度を劇的に向上させる、いくつかの画期的な機能を導入しています。
- エンドツーエンドのNMSフリー設計: YOLOv10で先駆的に導入されたコンセプトを基盤とするYOLO26は、ネイティブなエンドツーエンド設計を採用しており、NMS(Non-Maximum Suppression)後処理を完全に排除しています。これにより、デプロイのロジックが簡素化され、レイテンシの変動が大幅に低減されます。
- CPU推論が最大43%高速化: 深いアーキテクチャの最適化により、標準的なCPU上で前例のない推論速度を実現しており、IoTや組み込み環境に最適です。
- DFLの削除: Distribution Focal Lossが削除されたことで、エクスポートプロセスが簡素化され、ONNXのようなツールを使用する低電力エッジデバイスとの互換性が向上しました。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のLLM学習ルーチンに触発されたこのSGDとMuonのハイブリッドは、大規模言語モデルの学習イノベーションを直接コンピュータビジョンにもたらし、より高速な収束と安定した学習体制を保証します。
- ProgLoss + STAL: これらの高度な損失関数は、航空ドローン画像やロボット工学に関わるアプリケーションにおいて重要な要素である、小さな物体の認識精度を著しく向上させます。
DFLの削除とNMSフリーのアーキテクチャのおかげで、YOLO26モデルをNVIDIA TensorRTやIntel OpenVINOといったエッジフレンドリーなフォーマットにエクスポートする際、カスタムプラグイン開発はほとんど不要です。
Link to this sectionアーキテクチャの概要: EfficientDet#
著者: Mingxing Tan, Ruoming Pang, および Quoc V. Le 組織: Google Research 日付: 2019-11-20 Arxiv: EfficientDet論文 GitHub: Google AutoMLリポジトリ
Googleによって導入されたEfficientDetは、TensorFlowエコシステムを全面的に活用しており、コンパウンドスケーリング(複合スケーリング)の概念を中心に設計されました。そのアーキテクチャは、リソース制約に基づいてバックボーンネットワーク、特徴ネットワーク、およびボックス/クラス予測ネットワークを同時にスケールアップします。
EfficientDetの主な革新は以下の通りです。
- BiFPN (双方向特徴ピラミッドネットワーク): 容易かつ高速なマルチスケール特徴融合を可能にするメカニズムであり、ネットワークが様々なサイズの物体をより正確に把握できるようにします。
- コンパウンドスケーリング: 解像度、深さ、幅を均一にスケールアップするためのヒューリスティック手法であり、d0(最小)からd7(最大)までのモデルファミリーを作成します。
EfficientDetは厳密な境界ボックス検出には強力な選択肢ですが、現代の開発者が期待するマルチタスクの汎用性(ネイティブなOBBタスクなど)や、効率化され統合されたPythonエコシステムが一般的に不足しています。
Link to this sectionパフォーマンスと指標の比較#
速度と精度のパレートフロンティアを特定するために、私たちはCOCOデータセットを使用して標準的な環境で両方のアーキテクチャをベンチマークしました。以下の表は、AWS EC2 P4dインスタンスで測定されたモデルサイズ、精度、およびレイテンシの違いを示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
上記のように、YOLO26は優れた性能バランスを確立しています。YOLO26xモデルは最高の精度(57.5 mAP)を達成し、最もヘビーなEfficientDet-d7を大幅に上回ります。さらに、YOLO26モデルはメモリ要件が大幅に低く、GPU推論速度がはるかに高速(TensorRTで1.7 msと低い)であり、NMSフリー設計の利点が際立っています。
Link to this section学習効率とエコシステムの優位性#
両アーキテクチャの大きな違いは、開発環境にあります。EfficientDetはGoogle AutoMLおよびTensorFlowエコシステムに深く組み込まれており、強力である一方、急峻な学習曲線や、DOTAv1のようなカスタムデータセットに対する硬直的な構成を強いる場合があります。
対照的に、UltralyticsはPyTorch上に構築された非常にメンテナンス性の高いエコシステムを提供しています。学習中のメモリ使用量は厳密に最適化されており、Transformerベースのネットワークで一般的に必要とされる過剰なVRAM割り当てなしに、堅牢なモデルを学習できます。
開発者はUltralytics Platformを通じて、エンドツーエンドのMLOpsワークフローにアクセスできます。これには、シームレスなデータアノテーション、自動ハイパーパラメータチューニング、ワンクリックでのクラウド学習が含まれており、プロトタイピングからプロダクションへの道を大幅に加速します。
Link to this section実装例#
Ultralytics APIによって提供される使いやすさにより、わずか数行のコードで最先端のYOLO26モデルを学習および検証できます。
from ultralytics import YOLO
# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")
# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Train on GPU
)
# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")Link to this section理想的なユースケース#
YOLO26を使用すべき場合:
- エッジコンピューティングおよびモバイル: 最大43%のCPU推論の高速化とNMSオーバーヘッドの解消により、YOLO26はRaspberry Piやスマートフォンといった計算リソースが厳しく制限されたデバイスで優れた性能を発揮します。
- マルチタスク: 単一のパイプラインでバウンディングボックス、セグメンテーションマスク、トラッキングが必要な場合、YOLO26の汎用性は比類がありません。
- ドローンおよび航空画像: ProgLossとSTALの組み合わせにより、高高度からの極小物体の検出能力が大幅に向上します。
EfficientDetを使用すべき場合:
- レガシーなTensorFlowパイプライン: インフラがTensorFlow SavedModelのみをサポートするようにハードコードされている、または特定のTensorFlow Servingパイプラインが必要な場合、EfficientDetはネイティブな互換性を提供します。
- リソース制約のあるTPU: EfficientDetは、GoogleのカスタムTensor Processing Unit(TPU)向けに高度に最適化されています。
Link to this section他の代替案を探る#
本ガイドではYOLO26 vs EfficientDetのパラダイムに重点を置いていますが、より広範なUltralyticsエコシステムには他の素晴らしいアーキテクチャが揃っています。もしアプリケーションがTransformerに強く依存している場合、RT-DETRはリアルタイムのTransformerベース検出を提供します。あるいは、レガシーシステムをサポートしている場合、YOLO11は引き続き完全にサポートされており、非常に効果的です。より広い概要については、Ultralytics モデル比較ハブをご覧ください。
最終的に、現在構築されているあらゆる現代的なコンピュータビジョンパイプラインにおいて、YOLO26の圧倒的な速度、使いやすさ、および最先端の精度は、研究者や開発者の双方にとって議論の余地のない推奨モデルとなります。