EfficientDet vs DAMO-YOLO: オブジェクト検出アーキテクチャの技術比較
スケーラブルなコンピュータビジョンパイプラインを構築する際、適切なモデルアーキテクチャの選択は、デプロイの実現可能性と検出精度双方に影響を与える重要な決定事項である。本ガイドでは、視覚認識分野で広く知られる2つのアーキテクチャ、YOLOについて、詳細な技術的比較を提供する。
両モデルとも物体検出分野に画期的な革新をもたらしましたが、ビジョンAIの急速な進歩により、より統合されたエコシステムへの道が開かれました。本分析では、これらの従来型ネットワークの中核的な仕組みを探ると同時に、Ultralytics Ultralytics といった現代的なソリューションが、なぜ実稼働環境における業界標準となったのかを明らかにします。
EfficientDet:スケーラブルで効率的な物体検出
Google研究者によって発表されたEfficientDetは、高い効率性を維持しながらモデルアーキテクチャを体系的に拡張するよう設計された。これはネットワークの深さ、幅、入力解像度における複合的なスケーリングを活用することで実現した。
EfficientDetの詳細:
著者: Mingxing Tan, Ruoming Pang, Quoc V. Le
所属: Google Brain
日付: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl
アーキテクチャの革新
EfficientDetの主な貢献は、双方向特徴ピラミッドネットワーク(BiFPN)です。従来のFPNとは異なり、BiFPNは学習可能な重みを利用して異なる入力特徴の重要性を理解することで、容易かつ高速なマルチスケール特徴融合を可能にします。これはEfficientNetのバックボーンと組み合わされ、予測可能なスケーリングを行うモデル群(D0からD7)を生み出しています。
長所と短所
EfficientDetの最大の強みはパラメータ効率にある。 制約の厳しいクラウド環境において平均精度(mAP)を最大化する必要があるタスクでは、その複合スケーリング手法が極めて予測可能である。しかしEfficientDetはゼロから訓練するのが非常に複雑で、多くの場合大幅なハイパーパラメータ調整を必要とする。さらに特定のTensorFlow 依存度が高いため、ONNX TensorRT 介したエッジデプロイへの移行は、現代的なYOLO に見られる合理化されたエクスポート機能と比較してTensorRT 。
DAMO-YOLO: 実行中の自動アーキテクチャ探索
DAMO-YOLOは、リアルタイム推論向けに最適なネットワーク構造を自動的に設計するためにニューラルアーキテクチャ探索(NAS)を活用する、独自のアプローチを採っています。
DAMO-YOLO詳細:
著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
組織: Alibaba Group
日付: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO
アーキテクチャの革新
DAMO-YOLOはいくつかの新しい技術を導入しています。NASによって生成されたMAE-NASというバックボーン、ネック部分には効率的なRepGFPN、そしてdetection headの計算コストを劇的に削減するZeroHead設計を採用しています。さらに、ラベル割り当てにはAlignedOTAを採用し、より小さなバリアントの性能を向上させるために知識蒸留による強化に大きく依存しています。
長所と短所
DAMO-YOLOはGPU推論速度において優れており、特にNVIDIAアーキテクチャ上でのTensorRTを用いたデプロイメント向けに設計されています。重いヘッド構造を排除することで、モデルは低遅延の予測を実現します。反対に、自動化されたアーキテクチャ探索は、モデル構造を不透明にし、カスタムエッジデバイス向けの手動デバッグや微調整を困難にする可能性があります。非常に汎用性の高いUltralytics YOLO11とは異なり、DAMO-YOLOは主に標準的なバウンディングボックス検出に焦点を当てており、そのままではpose estimationやoriented bounding box (OBB)検出のような高度なタスクに対するネイティブサポートを欠いています。
パフォーマンス比較
モデル選択には、実証的なトレードオフを理解することが不可欠である。下表は、重要な性能指標においてEfficientDetYOLO 比較したものである。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
データの分析
EfficientDet-d7は最高の理論的精度を達成しますが、膨大な計算能力を必要とするため、エッジAIには不向きです。DAMO-YOLOは優れたTensorRT速度を提供しますが、同等の精度を達成するためには、一般的に下位層のEfficientDetモデルよりも多くのパラメータを必要とします。
ユースケースと推奨事項
EfficientDetとDAMO-YOLOの選択は、特定のプロジェクト要件、デプロイ制約、およびエコシステム設定に依存します。
EfficientDetを選択するタイミング
EfficientDetは、以下の用途に強力な選択肢です。
- Google CloudおよびTPUパイプライン: EfficientDetがネイティブ最適化されているGoogle Cloud Vision APIまたはTPUインフラストラクチャと深く統合されたシステム。
- 複合スケーリング研究:バランスの取れたネットワークの深さ、幅、解像度のスケーリング効果を研究することに焦点を当てた学術的なベンチマーク。
- TFLiteを介したモバイルデプロイメント: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。
DAMO-YOLOを選択するタイミング
DAMO-YOLOは以下のような用途に推奨されます。
- 高スループットビデオ分析: バッチ1スループットが主要な指標となる、固定のNVIDIA GPUインフラストラクチャ上での高FPSビデオストリーム処理。
- 産業用製造ライン: 組立ラインでのリアルタイム品質検査など、専用ハードウェアにおける厳格なGPUレイテンシー制約があるシナリオです。
- ニューラルアーキテクチャ探索研究: 自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化されたバックボーンがdetect性能に与える影響を研究しています。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。
- NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
- CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
- 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。
Ultralytics :従来のモデルを超えた進化
YOLO DetYOLO 学術的に貴重な知見YOLO 、現代の開発者は最先端の性能と開発者向け使いやすさを両立するフレームワークを必要としています。Ultralytics 真価を発揮するのはまさにこの点です。
比類のない使いやすさとエコシステム
個別の、高度にカスタマイズされた研究リポジトリからモデルをデプロイすると、統合の悪夢につながることがよくあります。Ultralyticsは、広範なドキュメントとpythonicなAPIを備えた、統一された、深く適切に維持されたエコシステムを提供します。Google Colabでトレーニングを行う場合でも、モバイル推論のためにCoreMLにエクスポートする場合でも、パイプラインはわずか数行のコードで済みます。
from ultralytics import YOLO
# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for production
model.export(format="onnx")
YOLO26革命
EfficientDetやDAMO-YOLOを評価している開発者にとって、Ultralytics YOLO26は究極の進化段階を象徴します。2026年初頭にリリースされ、パラダイムシフトをもたらす機能が導入されました。
- エンドツーエンドのNMSフリー設計: YOLOv10で初めて開拓されたYOLO26は、非最大抑制(NMS)後処理の必要性をネイティブに排除します。これにより、大幅にシンプルなデプロイアーキテクチャと、多様なハードウェア全体で一貫したレイテンシが実現します。
- CPU推論が最大43%高速化: 重いGPUを持たないエッジデプロイメント、すなわちDAMO-YOLOが苦戦するようなシナリオにおいて、YOLO26は大幅に最適化されており、標準CPU上で大規模な高速化を実現します。
- MuSGDオプティマイザ: LLMの革新とコンピュータービジョンの間のギャップを埋めるため、YOLO26はMuSGDオプティマイザ(Moonshot AIに触発された)を組み込んでおり、EfficientDetの不安定なトレーニングループと比較して、驚くほど安定したトレーニングと迅速な収束を保証します。
- DFLの削除: Distribution Focal Lossの削除によりエクスポートプロセスが簡素化され、低消費電力マイクロコントローラーやRaspberry Piデバイスとの優れた互換性が保証されます。
- ProgLoss + STAL: これらの高度な損失関数は、従来の古いアーキテクチャでは失敗しがちだった小物体認識において、劇的な改善をもたらします。
メモリ効率とタスクの汎用性
トランスフォーマーモデルや高度に融合されたNASネットワークとは異なり、Ultralytics 厳格なメモリ効率を特徴とする。CUDA 消費量が著しく低く、コンシューマー向けハードウェア上での迅速な反復を可能にする。
さらに、EfficientDetYOLO バウンディングボックスに厳密にYOLO 一方で、Ultralytics 同じ直感的なフレームワーク内でインスタンスセグメンテーションと画像分類を Ultralytics サポートしています。古いプロジェクトを維持しているユーザーにとって、 Ultralytics YOLOv8 は堅牢で広く導入されている代替手段として、検討に値する選択肢であり続けています。
結論
適切なビジョンアーキテクチャの選択には、理論上の生性能とデプロイの現実を比較検討することが含まれます。EfficientDetは数学的に洗練されたスケーリングアプローチを提供し、DAMO-YOLOは魅力的な生のGPU速度を実現します。しかし、迅速な開発、信頼性の高いデプロイ、および最先端の機能を優先するチームにとって、Ultralyticsモデルは明らかに優位に立っています。NMS-free推論やMuSGD最適化などの革新を組み合わせることで、YOLO26は、今日の利用可能な最も高性能で、保守が容易で、効率的な基盤の上にコンピュータビジョンプロジェクトが構築されることを保証します。