EfficientDet vsYOLOv7: リアルタイム物体検出の進化
コンピュータビジョンの分野は、精度と計算効率のバランスを追求する継続的な努力によって形作られてきた。この進化における二つの異なる哲学は、スケーラブルな効率性に焦点を当てたモデル群であるEfficientDetとYOLOv7が代表する。後者はアーキテクチャ最適化を通じてリアルタイム推論速度を優先した。
この比較では、これら2つの影響力のあるモデルの技術仕様、アーキテクチャ上の差異、および性能指標を探るとともに、YOLO26のような現代的なソリューションが開発者にとって新たな標準となった理由を明らかにする。
EfficientDet: スケーラブルな効率性
2019年末にリリースされたEfficientDetは、従来の検出器における非効率性(スケーリングが手動または不均一に行われることが多かった)に対処するために設計された。解像度、深度、幅を同時にスケーリングする体系的な手法を導入した。
技術概要
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019-11-20
- リンク:ArXiv論文 | GitHubリポジトリ
アーキテクチャと主な機能
EfficientDetは、EfficientNetバックボーンと重み付け双方向特徴ピラミッドネットワーク(BiFPN)を組み合わせた手法である。BiFPNは、異なる入力特徴が出力に不均等に寄与する不均衡を補正しつつ、容易かつ高速なマルチスケール特徴融合を可能にする。
このモデルは複合スケーリングを採用しており、単純な係数を用いてバックボーンネットワーク、BiFPN、クラス/ボックスネットワーク、解像度をスケーリングする。この手法は与えられたパラメータ数(FLOPs)において高い精度を実現するが、BiFPN層の複雑な相互接続は、このような不規則なメモリアクセスパターンに特化して最適化されていないハードウェアでは、推論レイテンシの増加を招く可能性がある。
YOLOv7: 「Bag-of-Freebies」の高性能モデル
2022年7月に発表されたYOLOv7 、YOLO You Only Look Once)ファミリーの飛躍的な進化YOLOv7 。EfficientDetがパラメータ効率に重点を置いたのとは異なり、YOLOv7 推論速度にYOLOv7 、GPU 上でのリアルタイム物体検出の可能性の限界を押し広げた。
技術概要
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織: 台湾、中央研究院 情報科学研究所
- 日付: 2022-07-06
- リンク:ArXiv論文 | GitHubリポジトリ
アーキテクチャと主な機能
YOLOv7 拡張効率的層集約ネットワーク(E-ELAN)YOLOv7 。このアーキテクチャは最短および最長の勾配経路を制御し、元の勾配経路を破壊することなくネットワークがより多様な特徴を学習できるようにする。
YOLOv7 概念は「訓練可能なフリービーの袋」YOLOv7 推論コストを増加させることなく、訓練中の精度を向上させる最適化手法を指す。これにはモデル再パラメータ化のような技術が含まれ、複雑な訓練構造をデプロイ用に効率化された畳み込みのセットへと簡素化する。これにより、訓練プロセスは堅牢でありながら、最終的にデプロイされるモデルは極めて高速であることを保証する。
パフォーマンス比較
以下の表は、YOLOv7 性能を比較したものです。EfficientDetモデル(d0-d7)は優れたパラメータ効率を示しますが、標準ハードウェア上でのレイテンシは、GPU 向けに最適化YOLOv7 著しく高くなっています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
メトリクス分析
データは重要な差異を浮き彫りにしている:レイテンシ対FLOPSである。EfficientDet-d7は53.7%という高い mAPを達成するが、T4GPU128msを超えるレイテンシを伴う。対照的に、YOLOv7xは同等の53.1%mAPを達成しながら、わずか11.57msで動作する——10倍以上の高速さである。 自動運転車や映像解析といった実世界アプリケーションでは、この速度優位性が決定的な要因となることが多い。
レイテンシーが重要である
FLOPs(浮動小数点演算)は複雑性を測る優れた理論的指標ではあるが、推論速度と必ずしも直線的に相関するわけではない。BiFPNのようなアーキテクチャはメモリアクセスコストが高く、実際の実行速度を低下させる可能性がある。一方、YOLO単純なCNN構造はGPU に対して高度に最適化されている。
Ultralyticsの利点: エコシステムとユーザビリティ
モデルの選択は、多くの場合、生の指標と同様にソフトウェアのエコシステムに依存します。この点において、Ultralytics 移行は、従来のリポジトリに比べて大きな利点をもたらします。
合理化されたユーザーエクスペリエンス
EfficientDetは、最新のPyTorchに統合するのが難しい古いTensorFlow 依存しています PyTorch ワークフローへの統合が困難な場合があります。一方、Ultralytics 統一されたPython Ultralytics 、モデルのトレーニング、検証、デプロイをシンプルで標準化されたタスクとして扱います。
トレーニング効率とメモリ
Ultralytics YOLO 大きな利点の一つは、メモリ要件です。最適化されたデータローダーと効率的なアーキテクチャ設計により、YOLO 複雑なマルチブランチネットワークと比較して、トレーニング中にCUDA 通常少なくなります。これにより開発者はより大きなバッチサイズを使用でき、トレーニングの安定化と収束の高速化が実現します。
from ultralytics import YOLO
# Load a model (YOLOv7 or newer)
model = YOLO("yolov7.pt")
# Train the model with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
検知を超えた多様性
EfficientDetは主に物体検出器ですが、Ultralytics インスタンスセグメンテーション、姿勢推定、オリエンテッドバウンディングボックス(OBB)など、より幅広いタスクをサポートしています。この汎用性により、チームは多様なコンピュータビジョン課題に対して単一のフレームワークを利用できます。
新たな基準:YOLO26
YOLOv7 2022年の技術のYOLOv7 、この分野は急速に進化しています。新規プロジェクトには、2026年1月にリリースされたYOLO26を推奨します。これは前世代の強みを継承しつつ、根本的なアーキテクチャの転換を導入しています。
- エンドツーエンドNMS: YOLOv7 後処理として非最大抑制(NMS)を必要とするのに対し、YOLO26はネイティブにエンドツーエンドです。これにより遅延ボトルネックが解消され、展開ロジックが簡素化されます。これは YOLOv10によって先駆けられた画期的な技術である。
- MuSGDオプティマイザー:Moonshot AIのKimi K2に着想を得たこのオプティマイザーは、SGD ミューオンの高速SGD 融合しSGD LLMトレーニングの革新をビジョンタスクにもたらします。
- 強化されたエッジ性能:分布焦点損失(DFL)の除去と特定の最適化により、YOLO26はCPU上で最大43%高速化され、ラズベリーパイやスマートフォンなどのエッジデバイスにおいてEfficientDetを大幅に上回る性能を発揮します。
- ProgLoss + STAL:新規損失関数が小規模物体認識を大幅に改善し、従来のワンステージ検出器に共通する弱点を克服。
現実世界のアプリケーション
EfficientDetを選択するタイミング
EfficientDetは、TensorFlow と深く統合されたレガシーシステムや、複合スケーリングに関する特定の学術研究において依然として有用である。また、実行速度よりもディスクストレージ(モデル重みのサイズ(MB単位))が主な制約となる場面では、その小型版(d0-d2)も有用である。
YOLOv7を選択すべき時
YOLOv7 、以下の要件を満たす既存の生産パイプラインに最適な選択肢YOLOv7 :
- ビデオ分析:セキュリティや小売業界の知見を得るための高FPSストリーム処理。
- ロボティクス:低遅延がナビゲーションに不可欠な分野におけるコンピュータビジョンの統合。
- 汎用検出:成熟した、広くサポートされているアーキテクチャを必要とするシナリオ。
YOLO26へのアップグレード時期
YOLO26は、ほぼすべての新規導入において理想的な選択肢であり、以下の特長を提供します:
- エッジコンピューティング:IoTおよびモバイルアプリケーション向けの優れたCPU 。
- 複雑なタスク:セグメンテーション、姿勢推定、OBBのネイティブサポート。
- 簡素化された操作: NMS、後処理やエクスポートにおける主要な課題が解消され、トレーニング中に表示される内容がデプロイ時に完全に再現されます。
最先端を追求する研究者や開発者にとって、YOLO26を搭載したUltralytics への移行は、トレーニングの安定性、モデルの効率性、デプロイの汎用性における最新の進歩へのアクセスを保証します。