EfficientDetとYOLOv6.0の比較:包括的な技術比較
コンピュータビジョンの進化において、適切な物体検出アーキテクチャを選択することは、導入の成功に不可欠です。この比較では、Google研究用モデルであるEfficientDetと、Meituanの産業用検出器であるYOLOv6.0の技術的な違いを探ります。EfficientDetが複合スケーリングのような画期的な効率コンセプトを導入したのに対し、YOLOv6.0は低遅延の産業用アプリケーションに特化して設計されており、学術的ベンチマークから実世界のスループットへの移行を強調している。
パフォーマンス指標の比較
COCO データセットの以下のベンチマークは、アーキテクチャの効率と推論レイテンシのトレードオフを示しています。YOLOv6.0は、再パラメータ化技術を活用することで、GPU ハードウェア上で優れた速度を示しています。一方、EfficientDetは、高い計算コストで競争力のある精度を維持しています。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
EfficientDet:スケーラブルな効率性
EfficientDetは、ネットワークの深さ、幅、解像度を体系的に最適化することで、モデル設計のパラダイムシフトを表現しました。EfficientNetのバックボーンをベースに、Bi-directional Feature Pyramid Network (BiFPN)を導入し、マルチスケール特徴フュージョンを容易に実現しました。
- 著者ミンシン・タン、ルオミン・パング、クオック・V・レ
- 組織Google
- 日付: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https:google
- ドキュメント google
建築イノベーション
EfficientDetの核となるのはBiFPNで、トップダウンとボトムアップの両方で情報を流し、異なるスケールの特徴を繰り返し融合させる。これは、旧来の検出器でよく使われる、より単純な特徴ピラミッドネットワーク(FPN)とは対照的です。さらに、EfficientDetは、単一の複合係数$phi$を用いて、バックボーン、BiFPN、クラス/ボックスネットワークを一様にスケールする手法であるCompound Scalingを採用しています。この構造化されたアプローチにより、モデルの次元間でリソースのバランスが保たれ、手動で設計されたアーキテクチャによく見られるボトルネックが回避されます。
長所と短所
EfficientDetはパラメータ効率に優れ、高いパラメータ効率を実現します。 mAPを達成します。モデルサイズ(ストレージ)が制約となるが、レイテンシは交渉可能であるような画像分類や検出タスクに特に効果的である。しかし、BiFPNレイヤーの複雑な不規則接続と、深さ方向に分離可能な畳み込みの広範な使用は、標準的なGPUでは非効率である可能性があり、FLOP数が少ないにもかかわらず推論レイテンシが高くなります。
レイテンシ対FLOPs
EfficientDetはFLOPs(浮動小数点演算)が少ないが、これはGPUでの高速化に必ずしもつながるわけではない。その深さ方向に分離可能な畳み込みのメモリ・アクセス・コストは、YOLO モデルで使用される標準的な畳み込みと比較して、性能をボトルネックにする可能性があります。
YOLOv6.0:工業用スピード
YOLOv6.0は、純粋に学術的な指標から離れ、実世界のスループットに焦点を当て、特に産業環境で見られるハードウェアの制約に最適化する。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https:YOLOv6
- ドキュメント ultralytics
アーキテクチャと設計
YOLOv6.0はEfficientRep Backboneを採用しており、これはRepVGGスタイルの再パラメータ化を利用して、学習時と推論時のアーキテクチャを分離しています。学習時には、モデルはより良い勾配フローを得るために複雑なマルチブランチブロックを使用し、推論時には、これらはシングル$3 ㎟3$コンボリューションに折り畳まれ、最大化されます。 GPU計算密度を最大化します。バージョン3.0では、量子化対応トレーニング(QAT)や自己蒸留のような高度な戦略も統合され、エッジ・デバイスへの展開のためにINT8精度に量子化されてもモデルの精度を維持できるようになりました。
理想的なユースケース
ハードウェアに優しい設計のため、YOLOv6.0は理想的である:
- 高速製造:推論速度が譲れない、高速で移動するコンベアベルト上の欠陥を検出。
- 小売オートメーション低遅延の物体認識を必要とするレジなしチェックアウトシステムを強力にサポートします。
- スマートシティ分析:交通分析やセキュリティシステムのために複数のビデオストリームを処理します。
比較分析
これら2つのモデルの設計思想の相違は、配備ハードウェアによって明確な利点を生み出す。
精度とスピードの比較
表に示すように、YOLOv6.0lは、EfficientDet-d6(52.6)と同等のmAP (52.8)を達成していますが、T4GPU 上では10倍近く高速に動作します(8.95ms対89.29ms)。この大きなギャップは、YOLOv66の密な畳み込みと比較して、高スループットハードウェア上での深さ方向の畳み込みの非効率性を浮き彫りにしています。EfficientDetは、最大のD7バリアントで絶対精度でわずかに優位を保っていますが、リアルタイム推論を禁止するレイテンシコストがかかっています。
トレーニングと多用途性
EfficientDetは、効率的なトレーニングのためにTensorFlow エコシステムとTPU アクセラレーションに大きく依存している。対照的に、YOLOv6 6はPyTorch エコシステム内に収まるため、一般の研究者にとってより利用しやすくなっている。しかし、どちらのモデルも主に物体検出用に設計されている。インスタンスのセグメンテーションや ポーズ推定を必要とするプロジェクトでは、ユーザーはしばしば外部フォークや代替アーキテクチャを探す必要がある。
Ultralytics 優位性
YOLOv6.0とEfficientDetは有能なモデルだが、 Ultralytics YOLO11は、コンピュータ・ビジョンの次の進化を象徴するものであり、統一されたユーザー中心のフレームワークを通じて、両先行モデルの限界に対処している。
Ultralytics YOLO11を選ぶ理由
- 使いやすさとエコシステム:研究モデルの断片的なリポジトリとは異なり、Ultralytics シームレスな体験を提供します。一貫したPython APIにより、わずか数行のコードでモデルのトレーニング、検証、デプロイが可能です。
- 比類なき汎用性:YOLO11 11はバウンディングボックスに限りません。以下の機能をネイティブにサポートしています。 画像分類, インスタンス分割, 姿勢推定そして オリエンテッド・バウンディング・ボックス(OBB)複雑なAIパイプラインのためのワンストップソリューションです。
- トレーニング効率:Ultralytics モデルはメモリ要件に合わせて最適化されており、多くの場合、トランスフォーマーを多用するアーキテクチャや古いアーキテクチャよりも高速に収束し、VRAMの使用量も少なくて済みます。このアクセシビリティは、大規模な計算クラスターを持たない人々にとって、ハイエンドAI開発を民主化します。
- 整備されたエコシステム:活発なコミュニティと頻繁なアップデートに支えられたUltralytics エコシステムは、データアノテーション、ロギング、デプロイメントのためのツールへの容易な統合により、お客様のプロジェクトが将来にわたって維持されることを保証します。
合理化された開発
Ultralytics、オブジェクト検出からインスタンス・セグメンテーションへの切り替えは、モデル名を変更するだけで簡単に行うことができる(例、 yolo11n.pt 宛先 yolo11n-seg.pt)。この柔軟性により、新しいタスクのためにEfficientDetのような異なるアーキテクチャを適合させるのに比べて、開発時間が大幅に短縮されます。
コード例
複雑な研究コードベースと比較して、Ultralytics APIのシンプルさを体験してください:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
結論
EfficientDetは、モデルスケーリングの理論における画期的な製品であり、学術研究や精度を唯一の指標とするオフライン処理に最適です。YOLOv6.0は、産業用エッジAIの限界を押し広げ、サポートされているハードウェア上で優れたスピードを提供します。
しかし、最先端のパフォーマンスと開発者の生産性を両立させる総合的なソリューションが必要です、 Ultralytics YOLO11をお勧めします。多様なビジョン・タスクの統合、低メモリ・フットプリント、堅牢なサポート・システムにより、開発者はプロトタイプから量産まで安心して移行することができます。
その他のモデルを見る
さらに詳しく調べたい方は、関連する比較をドキュメントでご覧ください: