Link to this sectionEfficientDet vs YOLOv5#
最適なニューラルネットワークアーキテクチャを選択することは、コンピュータビジョンプロジェクトにおいて決定的なステップです。推論レイテンシ、パラメータ効率、検出精度のバランスが、現実世界でのモデルのパフォーマンスを左右します。この包括的な技術ガイドでは、GoogleのEfficientDetとUltralytics YOLOv5という、影響力の高い2つの物体検出フレームワークについて詳細な分析を行います。
アーキテクチャの革新性、トレーニング手法、デプロイ機能の比較を通じて、クラウドサーバーでのスケーリングや制約のあるエッジデバイスでの実行など、開発者がそれぞれのデプロイ環境に合わせた情報に基づいた意思決定を行えるよう支援します。
Link to this sectionEfficientDet: BiFPNによるスケーラブルなアーキテクチャ#
Google Researchによって導入されたEfficientDetは、バックボーンと特徴ネットワークを体系的にスケーリングし、従来の状態最先端モデルよりも少ないパラメータで高い精度を達成するように設計されました。
Link to this sectionモデルの詳細#
- 著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
- 組織: Google Research
- 日付: 2019年11月20日
- Arxiv: EfficientDet: Scalable and Efficient Object Detection
- GitHub: google/automl/efficientdet
Link to this sectionアーキテクチャの革新#
EfficientDetは、EfficientNet分類モデルをバックボーンとして活用し、ネットワークの幅、深さ、解像度を均一にスケーリングする複合スケーリング手法を採用しています。物体検出への最も顕著な貢献は、双方向特徴ピラミッドネットワーク(BiFPN)の導入です。単にトップダウンで特徴を統合する標準的な特徴ピラミッドネットワークとは異なり、BiFPNは複雑な双方向のクロススケール接続を可能にし、異なる入力特徴の重要度を判断するために学習可能な重みを導入しています。
非常に高精度である一方で、EfficientDetはTensorFlowエコシステムや特定のAutoMLライブラリに大きく依存しています。この依存関係により、カスタムの軽量デプロイパイプラインや、動的計算グラフを好む環境への統合が困難になる場合があります。
Link to this sectionUltralytics YOLOv5: リアルタイムAIの民主化#
EfficientDetの直後にリリースされたUltralytics YOLOv5は、YOLOアーキテクチャの非常にアクセスしやすいネイティブなPyTorch実装を提供することで業界に革命をもたらしました。これは、開発者体験、トレーニング効率、リアルタイムデプロイの柔軟性において新たな基準を打ち立てました。
Link to this sectionモデルの詳細#
- 著者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020年6月26日
- GitHub: ultralytics/yolov5
- ドキュメント: YOLOv5ドキュメント
Link to this sectionアーキテクチャの革新#
YOLOv5は、CSPDarknet(Cross-Stage Partial)バックボーンを採用することで、パラメータ総数を削減しつつ勾配フローを大幅に強化し、前モデルから大幅なアップグレードを果たしました。さらに、YOLOv5には自動学習アンカーボックスが組み込まれており、カスタムトレーニングデータに基づいて最適なバウンディングボックスの事前分布を自動的に計算するため、手動でのハイパーパラメータ調整が不要になります。
また、YOLOv5はMosaicデータ拡張を積極的に活用し、4つの異なる画像を1つのトレーニングタイルにブレンドします。これにより、小さな物体の検出能力が大幅に向上し、文脈的理解が一般化されるため、多様な環境下で非常に堅牢なモデルとなります。
Link to this section性能とベンチマーク#
COCOデータセットのような標準的なベンチマークでモデルを評価することは、精度と速度のトレードオフを理解する上で不可欠です。以下の表は、EfficientDetとYOLOv5の異なるサイズが標準化された条件下でどのように機能するかを示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionトレードオフの分析#
EfficientDet-d7は53.7という驚異的なピークmAPに到達しますが、YOLOアーキテクチャと比較してGPUハードウェア上での推論レイテンシが大幅に高くなります。逆に、YOLOv5はハードウェアアクセラレーションに優れています。YOLOv5nバリアントは、NVIDIA TensorRTを使用したT4 GPU上で1.12msという驚異的な高速推論時間を実現し、自動運転や高速製造ラインのようなリアルタイムアプリケーションにおいて圧倒的な優位性を誇ります。
さらに、YOLOv5モデルは、複雑な複合スケーリングネットワークや大規模なTransformerモデルと比較して、トレーニング中のCUDAメモリ要件がはるかに低くなっています。この軽量なメモリプロファイルは、最先端のAIへのアクセスを民主化し、研究者が標準的な消費者向けハードウェアで堅牢なモデルをトレーニングできるようにします。
エッジデバイス上でYOLOv5モデルから最大フレームレート(FPS)を引き出すには、PyTorchの重みをNVIDIA GPU向けにはTensorRT、Intel CPU向けにはOpenVINOへエクスポートしてください。このステップにより、推論速度がしばしば2倍になります。
Link to this sectionトレーニングエコシステムと開発者体験#
Ultralyticsエコシステムの真の強みは、その合理化されたユーザー体験にあります。EfficientDetがTensorFlowの物体検出APIに関する深い知識を必要とするのに対し、YOLOv5は一貫性のあるシンプルなPython APIを提供しています。
適切にメンテナンスされたUltralyticsエコシステムは、開発者が頻繁なアップデート、活発なコミュニティサポート、そしてWeights & BiasesやClearMLといった実験追跡ツールとのシームレスな統合を利用できることを保証します。
Link to this sectionコード例: YOLOv5を始める#
学習済みYOLOv5モデルで推論を実行するには、PyTorch Hub経由で数行のコードを書くだけです:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()Link to this section汎用性と実世界のアプリケーション#
EfficientDetは純粋に物体検出フレームワークであり、複雑なビジョンパイプラインにおける有用性は限定的です。一方、YOLOv5は複数のコンピュータビジョンタスクをサポートするように進化しました。モデルの最新リリースでは、高精度のインスタンスセグメンテーションおよび画像分類がサポートされており、開発者は機械学習スタックを統合できます。
Link to this section理想的なユースケース#
- EfficientDet: オフライン処理、学術研究、およびレイテンシよりも精度が優先されるクラウドベースの分析に適しており、サーバーグレードのTPUや高メモリのGPUが利用できる環境に最適です。
- YOLOv5: エッジAIデプロイのための決定的な選択肢です。低レイテンシ、わずかなパラメータフットプリント、高精度を兼ね備えており、ドローン分析、リアルタイム小売自動化、およびCoreMLやTFLiteを通じたモバイルアプリケーションに理想的です。
Link to this section次世代: YOLO26へのアップグレード#
YOLOv5は現在も堅牢で広くデプロイされているモデルですが、AI分野は急速に進化しています。新しいプロジェクトを開始するチームや、現代のパフォーマンスの頂点を求めるチームのために、Ultralyticsは2026年1月にリリースされたYOLO26を導入しました。
YOLO26は、スピードと精度のパレートフロンティアを再定義し、デプロイを容易にし、推論を高速化する画期的なアーキテクチャの転換をもたらします。
Link to this sectionYOLO26の主な進歩#
- エンドツーエンドのNMSフリー設計: YOLO26は、Non-Maximum Suppression(NMS)の後処理をネイティブで排除します。これにより、デプロイのロジックが大幅に簡素化され、推論のレイテンシのばらつきが軽減されます。これはYOLOv10の初期実験から洗練された画期的なアプローチです。
- 最大43%のCPU推論高速化: 専用のGPUを持たないエッジコンピューティングや低電力のIoTデバイス向けに特別に設計されています。
- MuSGDオプティマイザ: 大規模言語モデルのトレーニング手法(Moonshot AIのKimi K2など)に触発されたこのSGDとMuonのハイブリッドは、LLMの革新をコンピュータビジョンにもたらし、より速い収束と非常に安定したトレーニングダイナミクスを実現します。
- ProgLoss + STAL: これらの高度な損失関数は、航空画像やロボット工学で重要な小さな物体の認識において顕著な改善をもたらします。
- DFLの削除: Distribution Focal Lossを取り除くことで、モデルヘッドが大幅に簡素化され、レガシーハードウェアや制約の厳しいエッジハードウェアへのエクスポート時の互換性が向上しました。
マルチタスクパイプラインをデプロイするチーム向けに、YOLO26ではセグメンテーション用のマルチスケールプロトや、回転バウンディングボックス (OBB)用の特殊な角度損失など、タスク固有のアップグレードも導入されています。エコシステム内の他のモダンな選択肢を探すには、YOLO11やYOLOv8アーキテクチャも確認してください。
Link to this section結論#
EfficientDetとYOLOv5の選択は、デプロイ先に応じて大きく異なります。EfficientDetは、クラウドベースの推論に適した数学的にエレガントなスケーリングアプローチを提供します。しかし、YOLOv5の優れた開発者体験、非常に高速なPyTorchトレーニングループ、および高度に最適化されたエッジデプロイ機能により、現実世界のほとんどのリアルタイムアプリケーションにおいて優先される選択肢となっています。Ultralyticsが提供する包括的なツールを活用することで、チームは市場投入までの時間を短縮し、非常に応答性の高いAIシステムを構築できます。