EfficientDet vs YOLOv5: 包括的な技術比較
最適なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンプロジェクトにおいて決定的なステップである。推論遅延、パラメータ効率、検出精度のバランスが、モデルが実世界でどれほど良好に動作するかを左右する。この包括的な技術ガイドでは、Ultralytics GoogleYOLOv5、非常に影響力のある2つの物体検出フレームワークについて詳細な分析を提供する。
これらのアーキテクチャの革新、トレーニング手法、デプロイメント機能を比較することで、開発者はクラウドサーバーでのスケーリングであろうと、制約のあるエッジデバイスでの実行であろうと、特定のデプロイメント環境に対して情報に基づいた意思決定を行うことができます。
EfficientDet: BiFPNを備えたスケーラブルなアーキテクチャ
Google が発表したEfficientDetは、バックボーンと特徴ネットワークの両方を体系的に拡張し、従来の最先端モデルよりも少ないパラメータで高精度を達成するよう設計された。
モデルの詳細
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019年11月20日
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:google/automl/efficientdet
アーキテクチャの革新
EfficientDetはEfficientNet分類モデルをバックボーンとして活用し、ネットワークの幅、深さ、解像度を均一にスケーリングする複合スケーリング手法を使用しています。物体検出への最も注目すべき貢献は、双方向特徴ピラミッドネットワーク(BiFPN)の導入です。単純に特徴をトップダウンで集約する標準的な特徴ピラミッドネットワークとは異なり、BiFPNは複雑な双方向クロススケール接続を可能にし、異なる入力特徴の重要性を決定するための学習可能な重みを導入します。
非常に正確ではあるものの、EfficientDetは TensorFlow エコシステムと特定のAutoMLライブラリに依存しています。この依存関係により、動的な計算グラフを重視するカスタムの軽量デプロイメントパイプラインや環境への統合が煩雑になる場合があります。
Ultralytics YOLOv5:リアルタイムAIの民主化
EfficientDetの直後にリリースされた、 Ultralytics YOLOv5 は、YOLO 驚くほどアクセスしやすいネイティブPyTorch を提供することで業界に革命をもたらしました。開発者体験、トレーニング効率、リアルタイムデプロイの柔軟性において新たな基準を確立しました。
モデルの詳細
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020年6月26日
- GitHub:ultralytics/yolov5
- ドキュメント:YOLOv5 ドキュメント
アーキテクチャの革新
YOLOv5 、前世代モデルから大幅な改良YOLOv5 、CSPDarknet(Cross-Stage Partial)バックボーンを採用することで勾配の流れを大幅に強化しつつ、全体のパラメータ数を削減しました。さらに、YOLOv5 自動学習アンカーボックスYOLOv5 、特定のカスタム訓練データに基づいて最適な境界ボックス事前分布を自動計算するため、手動でのハイパーパラメータ調整が不要となります。
YOLOv5 モザイクデータ拡張を多用し、4枚の異なる画像を1枚のトレーニングタイルに統合します。これによりモデルのdetect 物体detect 能力が大幅に向上し、文脈理解の汎化が促進されるため、多様な環境下で高い頑健性を発揮します。
性能とベンチマーク
COCOデータセットのような標準ベンチマークでモデルを評価することは、精度と速度のトレードオフを理解するために不可欠です。以下の表は、EfficientDetとYOLOv5の異なるサイズが標準化された条件下でどのように機能するかを示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
トレードオフの分析
EfficientDet-d7はピークmAP 53.mAP 驚異的な性能を発揮する一方、GPU 上GPU YOLO 推論遅延が顕著である。一方、YOLOv5 ハードウェアアクセラレーションにYOLOv5 。YOLOv5nの変種GPU T4GPU NVIDIA TensorRTにより1.12ミリ秒という驚異的な推論時間を達成し、自動運転や高速製造ラインなどのリアルタイムアプリケーションにおいてはるかに優れています。
さらに、YOLOv5モデルは、複雑な複合スケールネットワークや大規模なトランスフォーマーモデルと比較して、学習中のCUDAメモリ要件がはるかに低いことを示しています。この少ないメモリプロファイルは、最先端AIへのアクセスを民主化し、研究者が標準的な消費者向けハードウェアで堅牢なモデルを学習することを可能にします。
ハードウェア効率の最大化
YOLOv5 (FPS)を引き出すには、NVIDIA PyTorch NVIDIA 、 OpenVINOIntel 。この手順により、多くの場合推論速度が倍増します。
トレーニングエコシステムと開発者体験
Ultralytics 真の強みは、その合理化されたユーザー体験にあります。EfficientDetがTensorFlow 検出APIに関する深い知識を必要とする一方で、YOLOv5 一貫性のあるPython YOLOv5 。
Ultralytics 整備されたUltralytics により、開発者は頻繁なアップデート、活発なコミュニティサポート、Weights & Biases ClearML Weights & Biases 実験追跡ツールとのシームレスな連携を利用できます。
コード例: YOLOv5を始める
事前学習済みYOLOv5 を用いた推論の実行には、PyTorch を介してわずか数行のコードで実現できます:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()
汎用性と実世界での応用
EfficientDetは厳密には物体検出フレームワークであり、複雑なビジョンパイプラインでの有用性を制限します。一方、YOLOv5は複数のコンピュータビジョンタスクをサポートするように進化しました。モデルの最新リリースは、高精度なインスタンスセグメンテーションと画像分類をサポートしており、開発者が機械学習スタックを統合できるようにします。
理想的なユースケース
- EfficientDet: レイテンシよりも最大精度が優先され、サーバーグレードのTPUまたは大容量GPUが利用可能なオフライン処理、学術研究、およびクラウドベースの分析に最適です。
- YOLOv5: エッジAIデプロイメントの決定版。低レイテンシ、小さなパラメータフットプリント、高精度の組み合わせにより、ドローン分析、リアルタイム小売自動化、およびCoreMLまたはTFLiteを介したモバイルアプリケーションに最適です。
次世代:YOLO26へのアップグレード
YOLOv5 堅牢で広く導入されているモデルYOLOv5 一方、AI分野は急速に進化しています。新規プロジェクトを開始するチームや現代の性能の頂点を求めるチーム向けに、Ultralytics 2026年1月にリリースされたYOLO26 Ultralytics 。
YOLO26は速度と精度のパレートフロンティアを再定義し、導入を容易にし推論を高速化する画期的なアーキテクチャの転換をもたらす。
YOLO26の主な進歩
- エンドツーエンドのNMSフリー設計: YOLO26は、Non-Maximum Suppression の後処理をネイティブに排除します。これにより、デプロイメントロジックが大幅に簡素化され、レイテンシのばらつきが低減されます。これはYOLOv10の初期実験から洗練された画期的なアプローチです。
- 最大43%高速なCPU推論: 専用GPUなしで動作するエッジコンピューティングおよび低電力IoTデバイス向けに特別に設計されています。
- MuSGDオプティマイザ: 大規模言語モデルの学習技術 (Moonshot AIのKimi K2など) に触発されたこのSGDとMuonのハイブリッドは、LLMの革新をコンピュータビジョンにもたらし、より速い収束と非常に安定した学習ダイナミクスを可能にします。
- ProgLoss + STAL: これらの高度な損失関数は、航空画像やロボティクスにとって不可欠な小物体認識において、顕著な改善をもたらします。
- DFLの削除: Distribution Focal Lossを排除することで、モデルヘッドが大幅に簡素化され、レガシーまたは制約の厳しいエッジハードウェアへのエクスポート時の互換性が向上します。
マルチタスクパイプラインをデプロイするチーム向けに、YOLO26はセグメンテーション用のマルチスケールプロトやoriented bounding boxes (OBB)用の特殊な角度損失など、タスク固有のアップグレードも導入しています。エコシステム内の他の現代的な代替案を検討するには、YOLO11またはYOLOv8アーキテクチャも確認できます。
結論
EfficientDetとYOLOv5の選択は、デプロイターゲットに大きく依存します。EfficientDetは、クラウド中心の推論に適した数学的に洗練されたスケーリングアプローチを提供します。しかし、YOLOv5の優れた開発者エクスペリエンス、非常に高速なPyTorchトレーニングループ、および高度に最適化されたエッジデプロイ機能により、ほとんどの現実世界のリアルタイムアプリケーションで優先される選択肢となっています。Ultralyticsが提供する包括的なツールを活用することで、チームは市場投入までの時間を短縮し、応答性の高いAIシステムを構築できます。