EfficientDet vsYOLOv7:リアルタイム物体検出アーキテクチャの比較
コンピュータビジョンプロジェクトの成功には、最適なニューラルネットワークアーキテクチャの選択が極めて重要である。高性能AIソリューションへの需要が高まる中、精度と計算効率の両方を最適化しようとする開発者にとって、EfficientDetやYOLOv7 といった確立されたモデルの比較は不可欠YOLOv7 。
この包括的な技術分析では、両モデルのアーキテクチャ上の微妙な差異、性能指標、および理想的な導入シナリオを探求します。さらに、Ultralyticsが提供する統合エコシステム(最先端Ultralytics に集約される)が、現代のコンピュータビジョンタスクにおいて優れた選択肢となる理由を明らかにします。
効率的な検出の理解
EfficientDetは、様々なリソース制約下で計算コストを体系的に管理しつつ精度を最大化するように設計された。これはスケーリングと特徴量融合に対する新規なアプローチによって達成された。
EfficientDet 詳細:
著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
組織: Google
日付: 2019-11-20
Arxiv:EfficientDet: Scalable and Efficient Object Detection
GitHub:Google リポジトリ
アーキテクチャとイノベーション
EfficientDetの中核には双方向特徴ピラミッドネットワーク(BiFPN)が採用されている。従来のFPNとは異なり、BiFPNは学習可能な重みを導入することで異なる入力特徴の重要性を学習し、容易かつ高速なマルチスケール特徴融合を実現する。これに加え、バックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深度、幅を同時に均一にスケーリングする複合スケーリング手法を組み合わせている。
長所と短所
EfficientDetは高いスケーラビリティを備えています。小型のバリエーション(d0-d2)はパラメータ効率が極めて高く、厳格なストレージ制限のある環境に適しています。大型のバリエーション(d7など)は、ハイエンドなオフライン処理における平均精度(mAP)の限界を押し広げます。
しかし、EfficientDetは古い TensorFlow 実装と複雑なAutoMLパイプラインに大きく依存している。このレガシーなインフラストラクチャは、現代PyTorchワークフローへの統合を著しく困難にしている。さらに、高精度なバリエーションにスケールアップすると、エッジデバイス上で重大な推論遅延が発生する問題を抱えている。
YOLOv7の理解
2022年に発表されたYOLOv7、リアルタイムアプリケーションにおいて速度と精度の大幅な飛躍をもたらし、当時広く普及していたYOLO 新たな基準を確立した。
YOLOv7 :
著者: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
所属機関:台湾中央研究院 情報科学研究所
日付: 2022-07-06
Arxiv:YOLOv7: 訓練可能なフリーアイテムの集合がリアルタイム物体検出器の新たな最先端性能を確立
GitHub: YOLOv7
アーキテクチャとイノベーション
YOLOv7 拡張効率的層集約ネットワーク(E-ELAN)YOLOv7 。このアーキテクチャ改良により、元の勾配経路を損なうことなくネットワークの学習能力が向上し、モデルがより多様な特徴を効率的に学習できるようになる。さらに「学習可能なフリービーの袋」を実装し、計画的再パラメータ化や動的ラベル割り当てといった技術を活用することで、推論コストを増加させることなく精度を向上させている。
長所と短所
YOLOv7 、動画解析や高速ロボットナビゲーションなどのリアルタイムシナリオでYOLOv7 。サーバーグレードのGPU上で非常に高いスケーラビリティを実現し、ネイティブな PyTorch 実装を提供しているため、学術研究者にも利用しやすい。
その驚異的な速度にもかかわらず、YOLOv7 後処理に非最大抑制(NMS)をYOLOv7 依存しており、混雑したシーンでは変動する遅延を引き起こす可能性がある。さらに、トレーニング時のメモリ使用量は新世代モデルに比べて著しく大きく、大規模バッチサイズを処理するにはより堅牢なハードウェアが必要となる。
パフォーマンスとメトリクスの比較
これらのモデルを比較する際には、精度、推論速度、パラメータサイズ間のトレードオフを検討することが極めて重要である。以下に、様々なEfficientDetYOLOv7 の詳細な評価を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
パフォーマンスの要点
EfficientDet-d7は最高のmAPを達成する一方、T4GPU上で約128msを要する。これとは対照的に、YOLOv7xは同等の53.1mAP 驚異的な高速処理速度mAP 11.57msmAP 達成し、リアルタイム展開における計算効率において世代を超えた飛躍的な進歩を示している。
ユースケースと推奨事項
YOLOv7 、プロジェクトの具体的な要件、デプロイメントの制約、およびエコシステムの選好によってYOLOv7 。
EfficientDetを選択するタイミング
EfficientDetは以下に最適な選択肢です:
- Google およびTPU : Google Vision API またはTPU と深く統合されたシステムで、EfficientDet がネイティブ最適化を実現します。
- 複合スケーリング研究:バランスの取れたネットワークの深さ、幅、および解像度スケーリングの効果を研究する学術的ベンチマーク。
- TFLiteによるモバイル展開: Android 組み込みLinuxデバイス向けにTensorFlow エクスポートを特に必要とするプロジェクト。
YOLOv7を選択すべき時
YOLOv7 以下に推奨YOLOv7 :
- 学術ベンチマーク:2022年当時の最先端結果の再現、またはE-ELANおよび学習可能なフリービー袋技法の効果の研究。
- 再パラメータ化研究:計画的再パラメータ化畳み込みと複合モデルスケーリング戦略の検討
- 既存のカスタムパイプライン: YOLOv7特定アーキテクチャを中心に構築された高度にカスタマイズされたパイプラインを持つプロジェクトで、容易にリファクタリングできないもの。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
Ultralyticsの利点
適切なアーキテクチャの選択は、単なる数値指標を超えたもの。機械学習のライフサイクル全体を評価することが求められます。Ultralytics 比類のない開発者体験を提供し、堅牢なAIデプロイメントへの参入障壁を大幅に低減します。
- 使いやすさ: Ultralytics 高度に統一Python Ultralytics 。開発者はわずか数行のコードでモデルのトレーニング、検証、エクスポートが可能であり、EfficientDetに典型的な複雑で断片化されたコードベースの管理が不要になります。
- 健全なエコシステム:迅速な更新、充実したドキュメント、活発なコミュニティの恩恵を受け、Ultralytics TensorRTやOpenVOpenVINO TensorRT 最新のデプロイメントフレームワークとの互換性をUltralytics 。
- メモリ要件:高度に最適化PyTorch ローダーと合理化されたネットワーク構造を活用することで、Ultralytics YOLO 、マルチブランチネットワークやトランスフォーマーを多用するモデルと比較して、トレーニング中にCUDA 大幅に削減します。
- 汎用性:バウンディングボックス検出に厳密に縛られた従来のアーキテクチャとは異なり、Ultralytics インスタンスセグメンテーション、姿勢推定、オリエンテッドバウンディングボックス(OBB)をサポートするマルチタスク対応の強力なモデルです。
Ultralyticsによるトレーニング効率化
以下のコードは、Python を使用した最先端モデルのトレーニングの簡便性を示しており、TensorFlow の設定とは対照的です。
from ultralytics import YOLO
# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the model to TensorRT for deployment
model.export(format="engine")
新たな基準:YOLO26
YOLOv7 現代のコンピュータビジョンに基盤を築いた一方で、Ultralytics が登場したことで状況は劇的に変化した。究極の精度と比類なきエッジ性能を両立させるべく設計されたYOLO26は、あらゆる新規ビジョンプロジェクトにおける究極の推奨ソリューションである。
YOLO26の主要なイノベーション
- エンドツーエンドのNMS:YOLOv10の基盤を継承しつつ、YOLO26はネイティブにエンドツーエンドを実現。ノン・マキシマム・サプレッション(NMS)後処理を完全に排除することで、自律走行のような安全性が極めて重要なシステムに不可欠な、より低く安定したレイテンシを提供します。
- 最大43%CPU : ディストリビューション・フォーカル・ロス(DFL)の削除により、YOLO26はエクスポートプロセスを大幅に簡素化し、ラズベリーパイなどのエッジデバイス上で比類のない速度を実現。これにより、エッジコンピューティングの絶対的な王者となった。
- MuSGDオプティマイザー:YOLO26は、Moonshot AIのLLMトレーニング革新に着想を得た、SGD ューオンSGD 融合した画期的なMuSGDオプティマイザーを採用しています。これにより、驚くほど安定したトレーニングダイナミクスと、はるかに速い収束速度が実現されます。
- ProgLoss + STAL:プログレッシブ損失とスケール標的整合損失の統合により、detect 能力が大幅に向上し、ドローン画像やセキュリティ警報システムにおける重大な課題が解決される。
- タスク特化型改良点:YOLO26は単なる検出器ではない。完璧なセグメンテーションを実現するセマンティックセグメンテーション損失とマルチスケールプロト、超高精度姿勢追跡のための残差対数尤度推定(RLE)、OBB境界の曖昧性を解決する専用角度損失を備える。
代替モデルの研究
YOLO26が現在の技術の頂点を代表する一方で、Ultralytics は様々なユースケース向けに最適化された多様なモデルをサポートしています。
従来のアンカーフリースケーリングを依然として必要とするレガシーシステムを管理する開発者向けに、 YOLO11Ultralytics 内で堅牢かつ高度にサポートされた選択肢であり続けます。さらに、トランスフォーマーベースのアーキテクチャを明示的に要求するシナリオにおいては、 RT-DETR はビジョントランスフォーマーを活用したリアルタイム検出を提供し、高度なアテンション機構とリアルタイム実行速度の間のギャップを埋めます。
結論として、EfficientDetが複合スケーリングに関する学術的知見を提供し、YOLOv7 強力なベースラインのリアルタイム性能YOLOv7 一方で、現代の企業Ultralytics 採用が最適である。YOLO26を活用することで、チームは最高の性能を確保し、トレーニングの摩擦を最小限に抑え、AI導入の将来性を保証できる。