EfficientDet vs.YOLOv5:スケーラビリティとリアルタイム性能のバランス
適切な物体検出アーキテクチャの選択には、精度、推論速度、デプロイの複雑さというトレードオフのバランスが求められます。本ガイドでは、Google によるスケーラブルなアーキテクチャであるEfficientDetと YOLOv5(Ultralyticsが提供する広く採用されているリアルタイム検出器)の詳細な技術比較を提供します。
EfficientDetが複合スケーリングにおいて画期的な概念を導入した一方で、YOLOv5 合理化されたAPIと堅牢なエコシステムを通じて高性能なコンピュータビジョンを普及させることで、この分野にYOLOv5 。
モデル概要
Google EfficientDet
EfficientDetはEfficientNetのバックボーンを基盤とし、解像度・深度・幅を均一にスケーリングする複合スケーリング手法を適用する。多階層特徴量の容易かつ高速な融合を可能とする双方向特徴ピラミッドネットワーク(BiFPN)を導入した。
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google
- 日付: 2019-11-20
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:EfficientDet リポジトリ
Ultralytics YOLOv5
YOLOv5 実世界の実用性と速度に重点を置いています。CSPDarknetバックボーンを採用し、多様なハードウェアでの学習と展開の容易さを実現するよう設計されています。性能と効率性のバランスが取れているため、最も人気のあるモデルの一つであり続けています。
- Author: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- ドキュメント:YOLOv5 ドキュメント
- GitHub:YOLOv5 リポジトリ
技術アーキテクチャの比較
これら二つのモデルの設計思想は大きく異なり、それぞれの適応タスクに影響を与えている。
EfficientDet: 複合スケーリングとBiFPN
EfficientDetの中核となる革新はBiFPN(重み付き双方向特徴ピラミッドネットワーク)である。標準的なFPNが特徴量を区別なく加算するのとは異なり、BiFPNは学習可能な重みを導入し、異なる入力特徴の重要性を理解する。これによりネットワークは融合時に情報量の多い特徴を優先できる。
さらに、EfficientDetは複合スケーリングを採用しており、これによりバックボーン、特徴ネットワーク、予測ネットワークの解像度、深さ、幅を同時に増加させます。これにより、ユーザーはリソース制約に応じて一連のモデル(D0からD7)から選択できます。ただし、この複雑さは、これらの演算に対する専用サポートを欠くエッジデバイスにおいて、より高いレイテンシを引き起こす可能性があります。
YOLOv5: CSPDarknet と PANet
YOLOv5 はCSPDarknetバック YOLOv5 、クロスステージ部分ネットワークを統合している。この設計は基底層で特徴マップを分割することで、精度を維持しつつパラメータ数とFLOPSを削減する。
特徴量集約のため、YOLOv5 パス集約ネットワーク(PANet)YOLOv5 。この構造は下位層から上位層への情報の流れを強化し、正確なバウンディングボックスに不可欠な物体の位置特定を改善する。ヘッドはアンカーベースであり、事前定義されたアンカーボックスからのオフセットを予測する。このアーキテクチャはGPU に高度に最適化されており、EfficientDetの複雑なスケーリング演算と比較して高速な推論時間を実現する。
Ultralyticsエコシステムの利点
YOLOv5 すると、Ultralytics アクセス権YOLOv5 、Ultralytics 介したデータアノテーション、実験追跡、クラウドトレーニング用ツールとのシームレスな統合が保証されます。このサポート体制は、EfficientDetのような研究特化型リポジトリでは往々にして欠如しています。
パフォーマンス指標
パフォーマンスを評価する際には、精度(mAP)と速度(レイテンシ)の両方を検討することが重要です。EfficientDetはより大規模なバリエーション(D7)で精度を向上させますが、同等のYOLOv5 すると、速度面で大きなペナルティを伴うことがよくあります。
以下の表は性能差を強調しています。YOLOv5 CPU 著しく高速YOLOv5 注目してください。これにより、専用アクセラレータなしでの展開がはるかに現実的になります。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
分析
- 速度対精度:EfficientDet-d0はFLOPsの面で非常に効率的だが、実際にはYOLOv5nとYOLOv5sの方が標準GPU上で高速に動作することが多い。これはハードウェアに優しい演算(一部のCUDA 遅延が生じ得る深度方向分離型畳み込みを回避)を採用しているためである。
- メモリ効率: YOLOv5 、トレーニング中に必要なVRAMが少なく、コンシューマー向けハードウェアでより大きなバッチサイズを可能にします。EfficientDetの複雑な接続はメモリオーバーヘッドを増加させる可能性があります。
- 最適化:EfficientDetはアーキテクチャの設計においてAutoMLの探索に大きく依存しており、変更が困難な場合があります。YOLOv5 、YAML設定ファイル内で直接深度と幅の倍率を容易にカスタマイズYOLOv5 。
トレーニングとユーザビリティ
トレーニング効率
Ultralytics YOLOv5 「箱から出してすぐに学習可能」な機能でYOLOv5 リポジトリにはモザイクデータ拡張、自動アンカー計算、ハイパーパラメータ進化が含まれます。これによりユーザーは、大規模な調整なしにカスタムデータセットで優れた結果を達成できます。効率的な実装では、TensorFlow の手動設定や学習率スケジューリングの慎重な調整がしばしば必要となります。
展開の多様性
EfficientDetは主に物体検出モデルですが、Ultralytics YOLOv5 その後継モデルはより幅広いタスクをサポートしています。同じAPI構造を使用して、インスタンスセグメンテーションや 画像分類へシームレスに切り替えることが可能です。
さらに、エクスポートモードによりYOLOv5 デプロイが簡素YOLOv5 、ワンクリックONNX、TensorRT、CoreML、TFLiteへの変換をサポートします。
from ultralytics import YOLO
# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")
# Train the model on a custom dataset
model.train(data="coco128.yaml", epochs=100)
# Export to ONNX format for deployment
model.export(format="onnx")
将来を見据えた設計:YOLO26の必要性
YOLOv5 堅牢な選択肢ですが、この分野は進歩を遂げています。最先端技術を追求する開発者にとって、YOLO26 YOLOv5 遺産を基盤としつつYOLOv5 大幅なアーキテクチャ改良YOLOv5 。
YOLO26はエンドツーエンドNMS設計を導入し、非最大抑制(NMS)後処理を不要にしました。これにより遅延が削減され、デプロイメントパイプラインが簡素化され、EfficientDetおよびYOLOv5大きな優位性となっています。さらにYOLO26はLLMトレーニングに着想を得たMuSGDオプティマイザーを採用し、困難なデータセットにおいても高速な収束と安定したトレーニングを保証します。
プロジェクトでエッジAIを活用する場合、YOLO26はCPU 向けに最適化されており、従来世代比で最大43%高速な処理速度を実現します。
理想的なユースケース
EfficientDetを選択するタイミング
- 研究上の制約:主な目的が複合的なスケーリング則の研究や特定の学術ベンチマークの再現である場合。
- 低FLOP環境:FLOP数が唯一の関心指標となる理論的シナリオにおいて、メモリアクセスコストやハードウェア上の実際のレイテンシを無視する。
Ultralytics YOLOv5 またはYOLO26)を選択すべきタイミング
- リアルタイムアプリケーション:自律走行、映像解析、ロボティクスなど、低遅延が絶対条件となる分野。
- エッジデプロイメント:メモリ効率とTensorRT 重要なRaspberry Pi、NVIDIA 、またはモバイルデバイス上で動作。
- 迅速な開発:迅速な反復サイクル、容易なデータセット管理、信頼性の高い事前学習済み重みを必要とするプロジェクト。
- 多様なタスク:プロジェクトが姿勢推定や方向性物体検出(OBB)を含むように拡張される可能性がある場合、Ultralytics はこれらをネイティブにサポートします。
概要
YOLOv5 コンピュータビジョン分野に多大な貢献YOLOv5 。EfficientDetは体系的なスケーリングの威力を示し、YOLOv5 高性能検出技術YOLOv5 。今日の実用的なアプリケーションの大半において、YOLOv5 最先端のYOLO26に代表Ultralytics 、継続的に更新されるコードベースと活発なコミュニティに支えられ、速度・精度・使いやすさの優れたバランスを提供している。
モデル比較に関する詳細情報については、YOLO YOLOv8 といった他モデルとどのように比較されるか、あるいはトランスフォーマーベースの RT-DETRなどの比較もご覧ください。