EfficientDet vsYOLOv5:包括的な技術比較
最適なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンプロジェクトにおいて決定的なステップである。推論遅延、パラメータ効率、検出精度のバランスが、モデルが実世界でどれほど良好に動作するかを左右する。この包括的な技術ガイドでは、Ultralytics GoogleYOLOv5、非常に影響力のある2つの物体検出フレームワークについて詳細な分析を提供する。
開発者は、アーキテクチャの革新性、トレーニング手法、展開能力を比較することで、クラウドサーバー間でのスケーリングから制約のあるエッジデバイス上での実行まで、特定の展開環境に適した判断を下すことができる。
EfficientDet: BiFPNを用いたスケーラブルなアーキテクチャ
Google が発表したEfficientDetは、バックボーンと特徴ネットワークの両方を体系的に拡張し、従来の最先端モデルよりも少ないパラメータで高精度を達成するよう設計された。
モデルの詳細
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019年11月20日
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:google/automl/efficientdet
アーキテクチャの革新
EfficientDetはEfficientNet分類モデルをバックボーンとして活用し、ネットワークの幅、深さ、解像度を均一にスケーリングする複合スケーリング手法を採用しています。物体検出への最も顕著な貢献は、双方向特徴ピラミッドネットワーク(BiFPN)の導入です。 標準的な特徴量ピラミッドネットワークが単純に特徴量をトップダウンで集約するのとは異なり、BiFPNは複雑な双方向のクロススケール接続を可能にし、異なる入力特徴の重要度を決定するための学習可能な重みを導入します。
非常に正確ではあるものの、EfficientDetは TensorFlow エコシステムと特定のAutoMLライブラリに依存しています。この依存関係により、動的な計算グラフを重視するカスタムの軽量デプロイメントパイプラインや環境への統合が煩雑になる場合があります。
Ultralytics YOLOv5:リアルタイムAIの民主化
EfficientDetの直後にリリースされた、 Ultralytics YOLOv5 は、YOLO 驚くほどアクセスしやすいネイティブPyTorch を提供することで業界に革命をもたらしました。開発者体験、トレーニング効率、リアルタイムデプロイの柔軟性において新たな基準を確立しました。
モデルの詳細
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020年6月26日
- GitHub:ultralytics/yolov5
- ドキュメント:YOLOv5 ドキュメント
アーキテクチャの革新
YOLOv5 、前世代モデルから大幅な改良YOLOv5 、CSPDarknet(Cross-Stage Partial)バックボーンを採用することで勾配の流れを大幅に強化しつつ、全体のパラメータ数を削減しました。さらに、YOLOv5 自動学習アンカーボックスYOLOv5 、特定のカスタム訓練データに基づいて最適な境界ボックス事前分布を自動計算するため、手動でのハイパーパラメータ調整が不要となります。
YOLOv5 モザイクデータ拡張を多用し、4枚の異なる画像を1枚のトレーニングタイルに統合します。これによりモデルのdetect 物体detect 能力が大幅に向上し、文脈理解の汎化が促進されるため、多様な環境下で高い頑健性を発揮します。
性能とベンチマーク
COCO 標準ベンチマークでモデルを評価することは、精度と速度のトレードオフを理解する上で極めて重要です。以下の表は、標準化されたYOLOv5 異なるサイズごとのYOLOv5 を示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
トレードオフの分析
EfficientDet-d7はピークmAP 53.mAP 驚異的な性能を発揮する一方、GPU 上GPU YOLO 推論遅延が顕著である。一方、YOLOv5 ハードウェアアクセラレーションにYOLOv5 。YOLOv5nの変種GPU T4GPU NVIDIA TensorRTにより1.12ミリ秒という驚異的な推論時間を達成し、自動運転や高速製造ラインなどのリアルタイムアプリケーションにおいてはるかに優れています。
さらに、YOLOv5 、複雑な複合スケーリングネットワークや大規模なトランスフォーマーモデルと比較して、トレーニングCUDA が大幅に低いことを示しています。この軽量なメモリプロファイルにより、最先端のAIへのアクセスが民主化され、研究者は標準的なコンシューマー向けハードウェア上で堅牢なモデルをトレーニングできるようになります。
ハードウェア効率の最大化
YOLOv5 (FPS)を引き出すには、NVIDIA PyTorch NVIDIA 、 OpenVINOIntel 。この手順により、多くの場合推論速度が倍増します。
トレーニングエコシステムと開発者体験
Ultralytics 真の強みは、その合理化されたユーザー体験にあります。EfficientDetがTensorFlow 検出APIに関する深い知識を必要とする一方で、YOLOv5 一貫性のあるPython YOLOv5 。
Ultralytics 整備されたUltralytics により、開発者は頻繁なアップデート、活発なコミュニティサポート、Weights & Biases ClearML Weights & Biases 実験追跡ツールとのシームレスな連携を利用できます。
コード例: YOLOv5を始める
事前学習済みYOLOv5 を用いた推論の実行には、PyTorch を介してわずか数行のコードで実現できます:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()
汎用性と実世界での応用
EfficientDetは純粋な物体検出フレームワークであるため、複雑なビジョンパイプラインにおける有用性が制限される。一方、YOLOv5 複数のコンピュータビジョンタスクをサポートするようYOLOv5 。最新のモデルリリースでは高精度なインスタンスセグメンテーションと画像分類がサポートされており、開発者は機械学習スタックを統合できる。
理想的なユースケース
- EfficientDet:遅延よりも精度を最優先し、サーバーグレードのTPUまたは大容量メモリGPUが利用可能な環境において、オフライン処理、学術研究、クラウドベースの分析に最適です。
- YOLOv5: エッジAI展開における決定的な選択肢。低遅延、最小限のパラメータ量、高精度を兼ね備え、ドローン解析、リアルタイム小売自動化、モバイルアプリケーションに最適です。 CoreML やTFLiteを介したモバイルアプリケーションに最適です。
次世代:YOLO26へのアップグレード
YOLOv5 堅牢で広く導入されているモデルYOLOv5 一方、AI分野は急速に進化しています。新規プロジェクトを開始するチームや現代の性能の頂点を求めるチーム向けに、Ultralytics 2026年1月にリリースされたYOLO26 Ultralytics 。
YOLO26は速度と精度のパレートフロンティアを再定義し、導入を容易にし推論を高速化する画期的なアーキテクチャの転換をもたらす。
YOLO26の主な進歩
- エンドツーエンドNMS:YOLO26は非最大抑制(NMS)後処理をネイティブに排除します。これにより展開ロジックが大幅に簡素化され、遅延変動が低減されます。YOLOv10初期実験から洗練された画期的な手法です。
- 最大43%高速CPU :専用GPUなしで動作するエッジコンピューティングおよび低消費電力IoTデバイス向けに特別に設計されています。
- MuSGDオプティマイザー:大規模言語モデル(LLM)のトレーニング技術(Moonshot AIのKimi K2など)に着想を得た、SGD ミューオンのハイブリッド手法。コンピュータビジョンにLLMの革新をもたらし、より速い収束と極めて安定したトレーニングダイナミクスを実現する。
- ProgLoss + STAL:これらの高度な損失関数は、航空画像やロボティクスにおいて極めて重要な小規模物体認識において顕著な改善をもたらす。
- DFL除去:ディストリビューション焦点損失を除去することで、モデルヘッドが大幅に簡素化され、レガシーまたは高度に制約されたエッジハードウェアへのエクスポート時の互換性が向上します。
マルチタスクパイプラインを展開するチーム向けに、YOLO26ではセグメンテーション用のマルチスケールプロトや方向性バウンディングボックス(OBB)用の専用角度損失など、タスク固有のアップグレードも導入しています。エコシステム内の他の最新代替案を探るには、以下も参照できます YOLO11 またはYOLOv8アーキYOLOv8 チャも参照できます。
結論
EfficientDetとYOLOv5 の選択は、主にデプロイ先によって大きくYOLOv5 。 EfficientDetは数学的に洗練されたスケーリング手法を提供し、クラウド中心の推論に適しています。しかし、YOLOv5優れた開発者体験、極めて高速PyTorch 、高度に最適化されたエッジデプロイメント機能により、現実世界のリアルタイムアプリケーションの大多数において優先的な選択肢となります。Ultralytics提供する包括的なツールを活用することで、チームは市場投入までの時間を短縮し、応答性の高いAIシステムを構築できます。