YOLOv6-3.0対EfficientDet:包括的な技術比較

コンピュータビジョンプロジェクトに最適なアーキテクチャを選択するには、速度、精度、およびデプロイの実現可能性の間のトレードオフを深く理解する必要があります。この比較ページでは、YOLOv6-3.0とEfficientDetという2つの異なる物体検出モデルを詳細に分析します。どちらのモデルもこの分野に大きく貢献してきましたが、現代のエッジ環境へのデプロイやラピッドプロトタイピングでは、Ultralytics Platformのような統合されたフレームワークが活用されることが多くなっています。

以下は、これらのモデル間のパフォーマンスの違いを可視化した対話型チャートであり、それぞれのレイテンシと精度プロファイルを理解するのに役立ちます。

YOLOv6-3.0: 産業グレードのスループット

YOLOv6-3.0は、産業用途向けに設計された高性能なシングルステージ物体検出フレームワークとして、Meituanによって明示的に開発されました。GPUハードウェア上でのスループットの最大化に重点を置いており、高速な製造ラインやオフラインのビデオ解析に適した有力な候補です。

  • 著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, および Xiangxiang Chu
  • 組織: Meituan
  • 日付: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

アーキテクチャのハイライト

YOLOv6-3.0のアーキテクチャは、異なるスケール間での特徴融合を改善するためにBi-directional Concatenation (BiC) モジュールを採用しています。高い推論速度を確保するため、GPU実行に高度に最適化されたEfficientRepバックボーンを活用しています。さらに、トレーニングフェーズでアンカーベースとアンカーフリー検出器の両方の利点を統合するAnchor-Aided Training (AAT) 戦略を採用しつつ、推論パイプラインはアンカーフリーを維持することでレイテンシを低減しています。

長所と短所

YOLOv6-3.0は、専用のGPUハードウェアが利用可能な環境で真価を発揮し、TensorRTを使用して非常に高速なリアルタイム推論を提供します。しかし、特定のハードウェア最適化に大きく依存しているため、CPUのみのエッジAIデバイスではパフォーマンスが最適にならない場合があります。また、いくつかの量子化には対応しているものの、そのエコシステムには現代のUltralyticsフレームワークに見られるような包括的な簡潔さが欠けています。

YOLOv6の詳細はこちら

EfficientDet:スケーラブルなAutoMLアーキテクチャ

Google Researchによって開発されたEfficientDetは、根本的に異なるアプローチをとっています。ネットワークを手動で設計する代わりに、自動機械学習 (AutoML)を活用して、パラメータ、FLOPs、精度のバランスをとったスケーラブルなアーキテクチャを設計しました。

アーキテクチャのハイライト

EfficientDetは、簡単かつ高速なマルチスケール特徴融合を可能にするBi-directional Feature Pyramid Network (BiFPN) を導入しました。これに加えて、すべてのバックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深さ、幅を均一にスケーリングする複合スケーリング手法を採用しており、EfficientDetモデルには非常にコンパクトなd0から大規模なd7まで存在します。

長所と短所

EfficientDetはパラメータ効率が非常に高いです。従来の物体検出器と比較して、比較的少ないパラメータ数で高い平均精度 (mAP)を達成します。しかし、このアーキテクチャはレガシーなTensorFlowエコシステムに深く根ざしています。その結果、複雑な依存関係の管理、トレーニングサイクルの低速化、および最適化されたPyTorch実装と比較してトレーニング中のメモリ要件が高くなるという課題があります。さらに、最新のGPUでの推論速度は、現代のYOLOアーキテクチャよりも大幅に遅くなっています。

EfficientDetについて詳しくはこちら

詳細な性能比較

以下の表は、さまざまな指標においてYOLOv6-3.0とEfficientDetの技術仕様を比較しています。YOLOv6-3.0はGPU速度で圧倒しており、EfficientDetはかなりのレイテンシを犠牲にすることでより高いmAPまでスケールアップできる点に注目してください。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
レイテンシとスループット

モデルを比較する際、FLOPsやパラメータ数は必ずしも実際のレイテンシと完全に相関するわけではないことに注意してください。YOLOv6-3.0はTensorRT向けに最適化されており、下位レベルのEfficientDetモデルよりもFLOPsが高いにもかかわらず、ミリ秒単位の速度を達成しています。

Ultralyticsエコシステムの利点

YOLOv6-3.0とEfficientDetは特定のニッチな用途向けですが、現代のコンピュータビジョンプロジェクトには汎用性、使いやすさ、そして十分にメンテナンスされたエコシステムが必要です。そこでUltralytics YOLOモデルが真価を発揮します。

使いやすさとトレーニング効率

複雑なTensorFlowの設定を操作する必要があるEfficientDetとは異なり、Ultralyticsモデルは直感的なPyTorch基盤の上に構築されています。Ultralytics Platformは、機械学習のライフサイクル全体を簡素化する効率的なAPIを提供します。Ultralyticsモデルのトレーニングは、CUDAメモリの使用量が大幅に少なく、実験を加速させ、計算コストを削減します。

比類なき汎用性

YOLOv6-3.0とEfficientDetは主に物体検出に特化しています。対照的に、現代のUltralyticsアーキテクチャは本質的にマルチモーダルです。単一のインターフェースで、インスタンスセグメンテーション姿勢推定画像分類、および指向性バウンディングボックス (OBB)タスクのためのモデルをトレーニングできます。

Ultralytics YOLO26の紹介

究極のパフォーマンスバランスを求める開発者にとって、Ultralytics YOLO26はパラダイムシフトを意味します。2026年1月にリリースされたこのモデルは、YOLOv6やEfficientDetを凌駕するいくつかの画期的な革新をもたらしました。

  • エンドツーエンドのNMSフリー設計: YOLO26はNon-Maximum Suppression (NMS) の後処理をネイティブで不要にしており、レイテンシのばらつきを大幅に低減し、エッジデバイス上でのデプロイロジックを簡素化します。
  • MuSGDオプティマイザ: LLMトレーニングから着想を得たこのハイブリッドオプティマイザは、安定したトレーニングと非常に高速な収束を保証します。
  • 最大43%高速なCPU推論: Distribution Focal Loss (DFL) を削除したことで、YOLO26はレガシーモデルと比較して、CPUや低消費電力のIoTデバイス上で非常に効率的になりました。
  • ProgLoss + STAL: これらの高度な損失関数は、小さな物体の認識において大幅な改善をもたらし、ドローンや航空画像アプリケーションに最適です。

YOLO26の詳細はこちら

ユースケースと推奨事項

YOLOv6とEfficientDetのどちらを選択するかは、特定のプロジェクト要件、デプロイの制約、およびエコシステムの好みによって決まります。

YOLOv6を選択すべき場合

YOLOv6は以下のような場合に強力な選択肢です:

  • 産業用ハードウェア対応のデプロイ: モデルのハードウェア対応設計と効率的な再パラメータ化が、特定のターゲットハードウェア上で最適化されたパフォーマンスを発揮するシナリオ。
  • 高速なシングルステージ検出: 制御された環境下でのリアルタイム動画処理において、GPU上での純粋な推論速度を優先するアプリケーション。
  • Meituanエコシステムとの統合: すでにMeituanの技術スタックおよびデプロイインフラストラクチャ内で作業しているチーム。

EfficientDetを選択すべき場合

EfficientDetは以下の場合に推奨されます:

  • Google CloudおよびTPUパイプライン: Google Cloud Vision APIやTPUインフラストラクチャと深く統合されたシステムで、EfficientDetがネイティブ最適化されている環境。
  • Compound Scalingの研究: ネットワークの深さ、幅、解像度のバランスの取れたスケーリングが与える影響を研究することに焦点を当てた学術的なベンチマーク。
  • TFLiteによるモバイルデプロイ: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteへのエクスポートを特に必要とするプロジェクト。

Ultralytics (YOLO26) を選択すべき場合

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最高の組み合わせを提供します:

  • NMSフリーのエッジデプロイ: Non-Maximum Suppressionの後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: 専用のGPUアクセラレーションがないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となります。
  • 小物体の検出: 航空ドローンの映像 やIoTセンサーの分析など、ProgLossとSTALが小物体の精度を大幅に高めることができる困難なシナリオ。

実装例:YOLO26のトレーニング

以下のコードは、Ultralyticsエコシステムのシンプルさを示しています。最先端モデルのトレーニングは、重みをロードしてデータへのパスを指定するだけで簡単に行えます。

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

検討すべきその他のモデル

より広範なコンピュータビジョンモデルの領域を探索している場合は、以下の代替案を検討してください。

  • YOLO11 YOLO26の非常に成功した前身であり、堅牢なマルチタスク機能と広範なコミュニティサポートを提供します。
  • YOLOv10 NMSフリーのトレーニングを導入した最初のYOLOアーキテクチャであり、現代のエンドツーエンド検出への道を切り開きました。
  • RT-DETR 従来のCNNよりもTransformerベースのアーキテクチャやアテンションメカニズムが好まれるシナリオ向けです。

結論

YOLOv6-3.0は優れた産業用GPUスループットを提供し、EfficientDetはスケーラブルでパラメータ効率の高いネットワークを構築するAutoMLの可能性を示していますが、どちらのモデルもデプロイのしやすさと現代的なマルチタスクの汎用性に制限があります。

モバイルエッジデプロイからクラウドベースの解析まで、大部分の現実世界におけるアプリケーションにとって、Ultralyticsエコシステムは比類のないパフォーマンスバランスを提供します。YOLO26を採用することで、開発者は最先端のNMSフリー推論、小さな物体向けの高度な損失関数、そしてプロトタイプから本番環境への移行を大幅に加速させる、統合された適切に文書化されたトレーニングパイプラインを利用できます。

コメント