YOLOv5 . EfficientDet:主要ビジョンモデルの技術的比較
コンピュータビジョン分野において、最適な物体検出アーキテクチャの選択は、モデルの精度から導入コストに至るまであらゆる要素に影響を与える極めて重要な決定事項です。本ガイドでは、 Ultralytics YOLOv5とEfficientDetという、現代AIの風景を形作ってきた二つの有力モデルについて、包括的な技術比較を行います。
EfficientDetが複合スケーリングによるスケーラブル効率の概念を導入した一方で、YOLOv5 最先端の性能と比類のないユーザー体験を融合させることでこの分野YOLOv5 。本分析では、両者のアーキテクチャ上の差異、性能指標、実世界での適用可能性を深く掘り下げ、開発者や研究者がデータに基づいた選択を行う手助けとする。
モデル概要
Ultralytics YOLOv5
YOLOv5 (You Only Look Once version 5)は、物体検出の歴史において画期的なモデルである。2020年半ばUltralyticsリリースされ、その速度、精度、使いやすさのバランスから、瞬く間に業界標準となった。先行モデルとは異なり、YOLOv5 PyTorchでネイティブ実装された初のYOLO YOLOv5 PyTorchでネイティブ実装された初のYOLOモデルであり、研究コミュニティと企業開発者の双方にとって非常に利用しやすくなりました。
- Author: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:Ultralytics YOLOv5
EfficientDet
EfficientDet Google 開発した物体検出モデルのファミリーである。EfficientNetのバックボーンを基盤とし、重み付き双方向特徴ピラミッドネットワーク(BiFPN)と、全てのバックボーン・特徴ネットワーク・ボックス/クラス予測ネットワークにおいて解像度・深度・幅を均一にスケーリングする複合スケーリング手法を導入している。
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019-11-20
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:Google リポジトリ
インタラクティブなパフォーマンスベンチマーク
これらのアーキテクチャ間のトレードオフを理解するには、標準ベンチマークにおける性能を可視化することが不可欠である。下図はCOCO 主要指標を比較し、速度と精度の境界線を明らかにしている。
詳細なパフォーマンス指標
以下の表は、各種モデルスケールのパフォーマンスを詳細に示しています。Ultralytics 一貫して優れた推論速度を発揮し、特にリアルタイムアプリケーション向けに最適化された場合にその性能が顕著です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
アーキテクチャと設計
これら2つのモデルの根本的な違いは設計思想にある:YOLOv5 リアルタイム推論とエンジニアリングの容易性をYOLOv5 一方、EfficientDetは複雑な特徴量融合によるパラメータ効率に焦点を当てている。
YOLOv5:高速性と使いやすさを追求した設計
YOLOv5 はCSPDarknetバックボーン(Cross Stage Partial Network)YOLOv5 、勾配の流れを強化し計算上のボトルネックを低減します。そのネック部ではPANet(Path Aggregation Network)を用いて異なるスケールの特徴量を集約し、大小の物体双方を高精度で検出することを保証します。
Ultralyticsの利点
YOLOv5最大の強みのひとつは、そのモジュール設計にある。「Bag of Freebies」と「Bag of Specials」——推論コストを増加させずに精度を向上させる最適化技術——に焦点を当てているため、多様な展開シナリオにおいて非常に堅牢である。
EfficientDet: 複合スケーリングとBiFPN
EfficientDetはEfficientNetバックボーンを基盤とし、BiFPN(双方向特徴ピラミッドネットワーク)を導入する。 標準的なFPNが異なる階層の特徴量を単純に合計するのに対し、BiFPNはこれらの特徴量に学習可能な重みを適用し、入力特徴量のうちどの要素がより重要かをネットワークが学習できるようにします。理論的にはFLOPsの面で効率的ですが、BiFPNの複雑で不規則なメモリアクセスパターンは、YOLOv5合理化されたCSPNetアーキテクチャと比較して、GPU上での実世界推論を遅くする傾向があります。
トレーニングと使いやすさ
開発者にとって、モデルの「ソフト」な指標——つまり、トレーニング、デプロイ、デバッグの容易さ——は、純粋な精度と同様に重要な場合が多い。
合理化されたユーザーエクスペリエンス
Ultralytics ゼロからヒーローへという体験で有名です。YOLOv5 シームレスなコマンドラインインターフェース(CLI)Python YOLOv5 、ユーザーが数分でカスタムデータでのトレーニングを開始できるようにします。一方、EfficientDetの実装では、効果的に動作させるために複雑な設定ファイルやTensorFlow 特定のPyTorch に関する深い知識が必要となることがよくあります。
トレーニング効率とリソース
YOLOv5 学習効率のために高度にYOLOv5 。自動アンカー計算、モザイクデータ拡張、ハイパーパラメータ進化などの機能を備えています。さらに、Ultralytics 通常、EfficientDetやトランスフォーマーベースのアーキテクチャと比較して、学習時のメモリ要件が大幅に低くなります。これにより、研究者はコンシューマー向けGPUでより大きなバッチサイズを学習でき、ハイエンドモデル学習へのアクセスを民主化します。
from ultralytics import YOLO
# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
汎用性と実世界での応用
EfficientDetは主に物体検出器ですが、Ultralytics YOLO 機能を単純な境界YOLO 超えて拡張しています。
- YOLOv5 : 物体検出、インスタンスセグメンテーション、画像分類をサポートします。
- EfficientDetの機能:主に物体検出に焦点を当てており、セグメンテーションへの適応も一部行われているが、統一されたワークフローへの統合度は低い。
理想的なユースケース
以下の条件に該当する場合は、Ultralytics YOLOv5 またはそれ以降)を選択してください:
- リアルタイム性能が極めて重要である:自動運転、映像解析、ロボティクスといったアプリケーションは、YOLO 提供する低遅延を必要とする。
- エッジデプロイメント:メモリと演算能力が制約されるモバイルデバイス、Raspberry Pi、NVIDIA にデプロイします。
- 迅速な開発:安定した、十分に文書化されたAPIと活発なコミュニティサポートのもとで、迅速に反復する必要があります。
以下の場合にEfficientDetを選択してください:
- FLOPS制約が最優先事項である:FLOPSのみが制約となる(レイテンシではなく)非常に特殊な理論的シナリオにおいて、EfficientDetのスケーリングが優位性を発揮する可能性がある。
- 研究のベースライン:学術的な環境において、特にEfficientNetベースの特徴抽出器との比較を行っています。
未来:YOLO26
YOLOv5 強力なツールですが、この分野はさらに進化を遂げています。Ultralytics 、前世代モデルが設定した基準を再定義する次世代モデル「YOLO26」を発表しました。
YOLO26はエンドツーNMSを導入し、非最大抑制(NMS)後処理を不要としました。これにより、デプロイメントパイプラインが簡素化され、推論速度が向上します。さらに、YOLO26はエッジ互換性の向上のため分布焦点損失(DFL)を排除し、LLMトレーニングの革新に着想を得た新たなMuSGDオプティマイザを採用することで、安定した収束を保証します。
最高のパフォーマンスを求める開発者には、YOLO26への移行を強く推奨します。前世代と比較して最大43%高速CPU を実現し、現代のエッジAIアプリケーションに最適な選択肢です。
結論
YOLOv5 コンピュータビジョンの殿堂入りを果たした。EfficientDetは複合スケーリングの威力を示し、YOLOv5 高性能が利用しやすくユーザーフレンドリーであることをYOLOv5 。
しかし、2026年の実用的な応用においては、Ultralytics 明確な優位性を提供する。アクティブメンテナンス、データアノテーションとトレーニングのための統合プラットフォーム、そして継続的なアーキテクチャ革新の組み合わせにより、YOLOv5最先端のYOLO26といったモデルがプロフェッショナルにとって最適な選択肢となっている。
他の現代建築を探求したい方は、以下の比較記事を参照してください YOLO11 や RT-DETR との比較を検討することをお勧めします。