YOLO . EfficientDet:物体検出アーキテクチャの深層分析
最適なコンピュータビジョンアーキテクチャの選択は、推論遅延からハードウェアコストに至るまであらゆる要素に影響を与える極めて重要な決定事項である。本技術比較では、アリババYOLO Google のEfficientDet Google二つの有力モデルを詳細に分析する。EfficientDetがスケーラブル効率の概念を導入した一方で、YOLO 革新的なディスティレーション技術によりリアルタイム性能の限界をYOLO 。
本ガイドでは、それらのアーキテクチャ、パフォーマンス指標、現代的な導入への適合性について厳密な分析を提供するとともに、Ultralytics のような次世代ソリューションが、使いやすさとエッジ効率の面で新たな基準をどのように設定しているかを探求します。
DAMO-YOLO の概要
YOLO アリババグループが開発した高性能物体検出フレームワークYOLO 。速度と精度のトレードオフを最適化し、ニューラルアーキテクチャ検索(NAS)や重度再パラメータ化といった技術を活用している。主に産業用途向けに設計され、検出品質を損なうことなく遅延の削減を目指す。
著者:許賢哲、江一琪、陳偉華、黄一倫、張元、孫秀宇
組織:Alibaba Group
日付:2022年11月23日
Arxiv:YOLO
GitHub:YOLO
ドキュメント:YOLO
主要なアーキテクチャ機能
- MAE-NASバックボーン:効率的なバックボーン構造を発見するために、マスキングオートエンコーダー(MAE)に基づくニューラルアーキテクチャ検索を使用する。
- 効率的なRepGFPN:再パラメータ化を利用するヘビーネック設計(類似の YOLOv6と同様)を用いて特徴を効果的に融合しつつ、高速推論を維持するヘビーネック設計。
- ZeroHead:最終予測段階における計算オーバーヘッドを最小化する軽量検出ヘッド。
- AlignedOTA:学習中の分類タスクと回帰タスク間の位置ずれ問題を解決する、改良されたラベル割り当て戦略。
EfficientDetの概要
Google チームが開発したEfficientDetは、モデルスケーリングへの体系的なアプローチを導入した。バックボーン、解像度、深さを同時にスケーリングすることで、EfficientDetは驚異的な効率性を実現する。EfficientNetバックボーンを基盤とし、複雑な特徴融合のために双方向特徴ピラミッドネットワーク(BiFPN)を導入している。
著者:Mingxing Tan, Ruoming Pang, Quoc V. Le
組織:Google
日付:2019年11月20日
Arxiv:EfficientDet Paper
GitHub:google
ドキュメント:EfficientDet README
主要なアーキテクチャ機能
- 複合スケーリング:単純な複合係数(φ)を用いて、ネットワークの幅、深さ、解像度を均一にスケーリングする方法。
- BiFPN:容易かつ高速なマルチスケール特徴融合を可能とする重み付き双方向特徴ピラミッドネットワーク。
- EfficientNetバックボーン:特徴抽出に強力なEfficientNetアーキテクチャを活用する。
パフォーマンス比較
以下の表は、YOLO バリエーションの性能を比較したものです。YOLO 、特に再パラメータ化されたブロックが効果GPU において、YOLO 優れた速度対精度比を提供します。一方、EfficientDetは精度が高いものの、複雑なバイポーラフィードフォワードネットワーク(BiFPN)接続と遅い活性化関数により、しばしば高いレイテンシに悩まされます。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
結果の分析
- レイテンシ:YOLO TensorRT EfficientDetTensorRT YOLO 上回る性能を発揮する。例えば、DAMO-YOLOは~mAP 50.8mAP を達成する一方、EfficientDet-d4は同等の精度を得るために~33msを要する。
- アーキテクチャ効率性:EfficientDetはパラメータ数が少ない(例:d0はわずか390万パラメータ)ためストレージに優しいが、その複雑なグラフ構造(BiFPN)は、YOLO合理化された構造と比較して、実際の推論速度が低下する傾向がある。
- リソース使用量:YOLO 学習中に「ディスティレーション強化」YOLO 、より小さな生徒モデルがより大きな教師モデルから学習できるようにすることで、推論コストを増加させることなく性能を向上させます。
再パラメータ化の説明
YOLO はRepVGGと同様の再パラメータ化YOLO 。学習時には複雑なマルチブランチブロックを用いて豊富な特徴量を学習する。推論前にはこれらのブランチを数学的に単一の畳み込み層に統合し、精度を損なうことなく速度を劇的に向上させる。
ユースケースと応用
各モデルが得意とする分野を理解することは、適切なツールを選択する上で役立ちます。
YOLOの使用タイミング
- 産業用検査:高速で移動するコンベア上の欠陥を検出するためにミリ秒単位の遅延が重要な製造ラインに最適です。
- スマートシティ監視:その高いスループットにより、単一GPU上で複数のビデオストリームを処理可能。
- ロボティクス:障害物を回避するために迅速な反応時間が必要な自律航行に適している。
EfficientDetの利用シーン
- 学術研究:その体系的なスケーリング則により、モデル効率理論を研究する上で優れた基盤となる。
- ストレージ制約環境:ディスク容量が主なボトルネックとなる場合、d0/d1バリアントの極めて少ないパラメータ数は有利である。ただし、RAM使用量とCPU 、同等のYOLO よりも依然として高い可能性がある。
- モバイルアプリケーション(レガシー):初期のモバイル展開ではTFLite利用されていたが、現代的なアーキテクチャである YOLO11 などの最新アーキテクチャにほぼ置き換えられています。
Ultralyticsの利点: YOLO26の登場
YOLO 重要なマイルストーンであったが、この分野は進化を続けている。Ultralytics 現在の最先端技術であり、エンドツーエンド設計と優れた最適化を通じて、従来のアーキテクチャの限界に対処している。
開発者がUltralyticsを好む理由
使いやすさとエコシステム: Ultralytics シームレスな「ゼロからヒーローへ」の体験Ultralytics 。研究リポジトリでよく必要とされる複雑な設定ファイルとは異なり、Ultralytics 数行のPythonでトレーニングを開始Ultralytics 。エコシステムには、データセット管理とクラウドトレーニングを容易Ultralytics が含まれます。
from ultralytics import YOLO # Load the latest YOLO26 model model = YOLO("yolo26n.pt") # Train on a custom dataset results = model.train(data="coco8.yaml", epochs=100)性能バランス:YOLO26はパレートフロンティアを支配するよう設計されています。前世代と比較して最大43%高速CPU を実現し、GPUが利用できないエッジAIアプリケーションにおける強力な選択肢となります。
NMS:オブジェクト検出器の展開における最大の課題の一つが、非最大抑制(NMS)です。YOLO NMS依存しており、これが後処理を複雑化し、遅延変動をもたらします。YOLO26はネイティブにエンドツーエンドであり、NMS 排除することで、決定論的で高速な推論を実現します。
トレーニング効率とMuSGD:YOLO26は、SGD ハイブリッドであるMuSGDオプティマイザーを統合しています。LLMトレーニングに着想を得たこの革新により、安定した収束が保証され、膨大なハイパーパラメータ調整の必要性が軽減されます。トレーニング時のメモリ要件が低いこととも相まって、メモリを大量に消費するトランスフォーマーハイブリッド(例: RT-DETRといったメモリを大量に消費するトランスフォーマーハイブリッドと比較して、より大規模なバッチサイズでのトレーニング
汎用性:EfficientDetYOLO 主にバウンディングボックスにYOLO 一方、Ultralytics 単一の統合API内でインスタンスセグメンテーション、姿勢推定、OBB、分類など幅広いタスクをネイティブにサポートします。
比較概要
| 機能 | EfficientDet | DAMO-YOLO | Ultralytics YOLO26 |
|---|---|---|---|
| アーキテクチャ | アンカーベースのBiFPN | アンカーフリー、RepGFPN | エンドツーエンド、NMS |
| 推論速度 | 遅い(複雑なグラフ) | 高速(GPU ) | 最先端技術(CPU GPU) |
| デプロイ | 複合体(NMS ) | 中程度(NMS ) | シンプル(NMS) |
| トレーニング記憶 | 高 | 中程度 | 低(最適化) |
| タスクサポート | 検出 | 検出 | 検出、セグメンテーション、姿勢推定、OBB |
結論
YOLO いずれもコンピュータビジョンの歴史に大きく貢献した。EfficientDetは複合スケーリングの威力を示し、YOLO 再パラメータ化とディスティレーションのYOLO 。しかし、2026年に新規プロジェクトを開始する開発者にとって、Ultralytics 圧倒的な優位性を提供する。
NMS 排除によりデプロイメントパイプラインNMS 、MuSGDオプティマイザがトレーニングを加速。最適化されたアーキテクチャはエッジCPUと高性能GPUの両方で優れた速度を実現します。スマートカメラシステム構築からクラウドベースの映像解析プラットフォームまで、Ultralytics の堅牢なエコシステムと性能が推奨選択肢Ultralytics 。
さらに詳しく知りたい場合は、YOLO26とYOLOv10の比較や、 YOLO11 の利点について理解することにも興味があるかもしれません。