YOLOv6.0 対 EfficientDet: 包括的な技術比較
コンピュータビジョンプロジェクトに最適なアーキテクチャを選択するには、速度、精度、導入実現可能性のトレードオフを深く理解する必要があります。この比較ページでは、2つの異なる物体検出モデルYOLOv6.YOLOv6とEfficientDetの詳細な分析を提供します。両モデルともこの分野に大きく貢献していますが、現代のエッジデプロイメントや迅速なプロトタイピングでは、Ultralytics のようなより統合されたフレームワークの方が有益な場合が多いです。
以下は、これらのモデルの性能差を可視化したインタラクティブチャートです。各モデルのレイテンシと精度のプロファイルを理解する助けとなります。
YOLOv6.0: 産業グレードのスループット
YOLOv6.YOLOv6、美団(Meituan)が産業用途向けに特化した高性能なシングルステージ物体検出フレームワークとして明示的に設計したものです。GPU 上でのスループット最大化に重点を置いており、高速製造ラインやオフライン動画解析に最適な選択肢となります。
- 著者:李秋怡、李露露、耿一飛、江洪亮、程萌、張博、柯載丹、徐暁明、および朱向翔
- 組織:美団(Meituan)
- 日付: 2023年1月13日
- Arxiv:2301.05586
- GitHub:YOLOv6
アーキテクチャのハイライト
YOLOv6.YOLOv6アーキテクチャは、異なるスケール間での特徴融合を改善するために双方向連結(BiC)モジュールを採用している。高い推論速度を確保するため、GPU 向けに高度に最適化されたEfficientRepバックボーンを活用している。 さらに、アンカー補助学習(AAT)戦略を採用し、学習フェーズではアンカーベース検出器とアンカーフリー検出器の両方の利点を融合させつつ、低遅延を実現するため推論パイプラインはアンカーフリーを維持している。
長所と短所
YOLOv6 GPU 利用可能な環境で真価を発揮し、TensorRTを用いた驚異的な高速リアルタイム推論を実現します。ただし、特定のハードウェア最適化への依存度が高いため、CPU のエッジAIデバイスでは性能が最適化されない場合があります。さらに、一部の量子化はサポートしているものの、エコシステムにはUltralytics に見られる包括的な簡潔さが欠けています。
EfficientDet: スケーラブルなAutoMLアーキテクチャ
Google によって開発されたEfficientDetは、根本的に異なるアプローチを採用している。ネットワークを手作業で設計する代わりに、著者らは自動機械学習(AutoML)を活用し、パラメータ、FLOPs、精度をバランスさせたスケーラブルなアーキテクチャを設計した。
- 著者:タン・ミンシン、パン・ルーミン、クオック・V・レ
- 組織:Google
- 日付: 2019年11月20日
- Arxiv:1911.09070
- GitHub:google
アーキテクチャのハイライト
EfficientDetは双方向特徴ピラミッドネットワーク(BiFPN)を導入し、容易かつ高速なマルチスケール特徴融合を実現した。全バックボーン・特徴ネットワーク・ボックス/クラス予測ネットワークに対し解像度・深度・幅を均一にスケーリングする複合スケーリング手法と組み合わせることで、EfficientDetモデルは極めてコンパクトなd0から大規模なd7までをカバーする。
長所と短所
EfficientDetはパラメータ効率に優れています。従来の物体検出器と比較して比較的少ないパラメータで高い平均精度(mAP)を達成します。しかし、そのアーキテクチャはTensorFlow に深く依存しています。このため、最適化されたPyTorch 、依存関係の管理が複雑になり、トレーニングサイクルが遅くなり、トレーニング中のメモリ要件が高くなります。さらに、最新のGPU上での推論速度は、YOLO よりも著しく遅くなっています。
詳細な性能比較
以下の表は、YOLOv6.YOLOv6とEfficientDetの技術仕様を様々な指標で比較したものです。YOLOv6.YOLOv6 GPU 優位である一方、EfficientDetは大幅な遅延をmAP 高いmAP までスケールアップする点に注目してください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
レイテンシ対スループット
モデルを比較する際、FLOPsやパラメータ数は必ずしも実世界のレイテンシと完全に対応しないことに留意してください。YOLOv6.YOLOv6 TensorRT最適化されており、下位モデルのEfficientDetよりも高いFLOPsを持つにもかかわらず、ミリ秒単位の速度を達成しています。
Ultralyticsエコシステムの利点
YOLOv6.YOLOv6やEfficientDetが特定のニッチ分野に対応する一方で、現代のコンピュータビジョンプロジェクトには汎用性、使いやすさ、そしてよく整備されたエコシステムが求められます。ここで活躍するのが Ultralytics YOLO モデルが真に優れている点です。
使いやすさとトレーニング効率
EfficientDetが複雑なTensorFlow 操作を必要とするのとは異なり、Ultralytics 直感的なPyTorch 構築されています。Ultralytics 、機械学習ライフサイクル全体を簡素化する合理化されたAPIを提供します。Ultralytics トレーニングCUDA 大幅に少なくて済むため、実験が加速され、計算コストが削減されます。
比類なき汎用性
YOLOv6.YOLOv6とEfficientDetYOLOv6主に物体検出に特化しています。これに対し、Ultralytics 本質的にマルチモーダルです。単一のインターフェースで、インスタンスセグメンテーション、姿勢推定、画像分類、およびオリエンテッドバウンディングボックス(OBB)タスク向けのモデルを学習できます。
Ultralytics YOLO26のご紹介
究極の性能バランスを求める開発者にとって、Ultralytics パラダイムシフトをもたらす。2026年1月にリリースされた本モデルは、YOLOv6 駕する数々の画期的な革新を導入している:
- エンドツーエンドNMS設計:YOLO26は非最大抑制(NMS)後処理をネイティブに不要とし、遅延変動を大幅に低減するとともに、エッジデバイス上での展開ロジックを簡素化します。
- MuSGDオプティマイザー:LLMトレーニングに着想を得たこのハイブリッドオプティマイザーは、安定したトレーニングと驚異的な収束速度を保証します。
- 最大43%高速CPU :分布焦点損失(DFL)の除去により、YOLO26は従来のモデルと比較してCPUおよび低消費電力IoTデバイス上で大幅な効率向上を実現しています。
- ProgLoss + STAL:これらの高度な損失関数は、小さな物体の認識において大幅な改善をもたらし、YOLO26をドローンや航空画像アプリケーションに最適にします。
ユースケースと推奨事項
YOLOv6 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの好みに依存します。
YOLOv6を選択すべき時
YOLOv6 以下に最適YOLOv6 :
- 産業用ハードウェア対応デプロイメント:モデルのハードウェア対応設計と効率的な再パラメータ化により、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
- 高速シングルステージ検出:制御された環境におけるリアルタイム動画処理GPU 上での生の推論速度を優先するアプリケーション。
- 美団エコシステム統合: 美団のテクノロジースタックおよびデプロイメントインフラストラクチャ内で既に稼働しているチーム。
EfficientDetを選択するタイミング
EfficientDetは以下に推奨されます:
- Google およびTPU : Google Vision API またはTPU と深く統合されたシステムで、EfficientDet がネイティブ最適化を実現します。
- 複合スケーリング研究:バランスの取れたネットワークの深さ、幅、および解像度スケーリングの効果を研究する学術的ベンチマーク。
- TFLiteによるモバイル展開: Android 組み込みLinuxデバイス向けにTensorFlow エクスポートを特に必要とするプロジェクト。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
実装例:YOLO26のトレーニング
以下のコードは、Ultralytics しています。最先端モデルのトレーニングは、重みをロードし、データを指定するだけの簡単な作業です。
from ultralytics import YOLO
# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")
検討すべきその他のモデル
コンピュータビジョンモデルのより広範な領域を探求しているなら、以下の代替案を検討してください:
- YOLO11:YOLO26の前身となる非常に成功したモデルで、堅牢なマルチタスク能力と広範なコミュニティサポートを提供します。
- YOLOv10: NMSトレーニングを導入した最初のYOLO 、現代的なエンドツーエンド検出の道を開いた。
- RT-DETR:従来のCNNよりもトランスフォーマーベースのアーキテクチャと注意機構が好まれるシナリオ向け。
結論
YOLOv6.YOLOv6産業用GPU 優れたGPU を提供し、EfficientDetはスケーラブルでパラメータ効率の高いネットワーク構築におけるAutoMLの可能性を示しているが、両モデルとも導入の容易さと現代的なマルチタスク対応能力において限界がある。
モバイルエッジ展開からクラウドベースの分析まで、現実世界のアプリケーションの大半において、Ultralytics 比類のないパフォーマンスバランスを実現します。YOLO26を採用することで、開発者は最先端NMS推論、小型物体向け高度な損失関数、そしてプロトタイプから本番環境への移行を劇的に加速する統一された文書化済みのトレーニングパイプラインを利用可能になります。