Link to this sectionYOLOv6-3.0 対 EfficientDet#

コンピュータビジョンプロジェクトにおいて最適なアーキテクチャを選択するには、速度、精度、展開の実現可能性の間のトレードオフを深く理解する必要があります。この比較ページでは、YOLOv6-3.0とEfficientDetという2つの異なるオブジェクト検出モデルの詳細な分析を提供します。どちらのモデルもこの分野に大きく貢献してきましたが、現代のエッジ展開や迅速なプロトタイピングでは、Ultralytics Platformのようなより統合されたフレームワークがしばしば有利に働きます。

以下は、これらのモデル間のパフォーマンスの違いを可視化したインタラクティブなチャートです。それぞれのレイテンシと精度の特性を理解するのに役立ちます。

Link to this sectionYOLOv6-3.0: 産業グレードのスループット#

YOLOv6-3.0は、産業用アプリケーション向けに調整された高性能なシングルステージのオブジェクト検出フレームワークとして、Meituanによって明示的に設計されました。GPUハードウェア上でのスループットの最大化に重点を置いており、高速な製造ラインやオフラインのビデオ解析に適した有力な候補となっています。

著者：Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、およびXiangxiang Chu
組織：Meituan
日付：2023-01-13
Arxiv：2301.05586
GitHub：meituan/YOLOv6

Link to this sectionアーキテクチャのハイライト#

YOLOv6-3.0のアーキテクチャは、異なるスケール間での特徴融合を改善するために、双方向連結（Bi-directional Concatenation: BiC）モジュールを採用しています。高い推論速度を確保するため、GPU実行に高度に最適化されたEfficientRepバックボーンを活用しています。さらに、トレーニングフェーズではアンカーベースとアンカーフリー検出器の両方の利点を統合するアンカー支援トレーニング（Anchor-Aided Training: AAT）戦略を採用しつつ、レイテンシを削減するために推論パイプラインはアンカーフリーを維持しています。

Link to this section強みと弱み#

YOLOv6-3.0は、専用のGPUハードウェアが利用可能な環境で真価を発揮し、TensorRTを使用して非常に高速なリアルタイム推論を提供します。しかし、特定のハードウェア最適化に大きく依存しているため、CPUのみのエッジAIデバイスではパフォーマンスが最適ではない可能性があります。また、一部の量子化はサポートしていますが、そのエコシステムには最新のUltralyticsフレームワークに見られるような全体的なシンプルさが不足しています。

YOLOv6の詳細はこちら

Link to this sectionEfficientDet：スケーラブルなAutoMLアーキテクチャ#

Google Researchによって開発されたEfficientDetは、根本的に異なるアプローチを採用しています。ネットワークを手作業で構築する代わりに、著者らは自動機械学習（AutoML）を利用して、パラメータ、FLOPs、精度のバランスを取るスケーラブルなアーキテクチャを設計しました。

著者：Mingxing Tan、Ruoming Pang、およびQuoc V. Le
組織：Google Brain
日付：2019-11-20
Arxiv：1911.09070
GitHub：google/automl

Link to this sectionアーキテクチャのハイライト#

EfficientDetは、簡単かつ高速なマルチスケール特徴融合を可能にする双方向特徴ピラミッドネットワーク（BiFPN）を導入しました。バックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深度、幅を均一にスケーリングする複合スケーリング手法と組み合わせることで、EfficientDetモデルは非常にコンパクトなd0から巨大なd7まで揃っています。

Link to this section強みと弱み#

EfficientDetはパラメータ効率が非常に高いモデルです。古いオブジェクト検出器と比較して、比較的少ないパラメータ数で高い平均精度（mAP）を達成します。しかし、このアーキテクチャは従来のTensorFlowエコシステムに深く根付いています。その結果、複雑な依存関係の管理、トレーニングサイクルの遅延、最適化されたPyTorch実装と比較したトレーニング中の高いメモリ要件が生じます。さらに、最新のGPU上での推論速度は、現代のYOLOアーキテクチャよりも大幅に遅くなります。

EfficientDetについて詳しく知る

Link to this section詳細なパフォーマンス比較#

以下の表は、YOLOv6-3.0とEfficientDetの技術仕様をさまざまな指標で対比したものです。YOLOv6-3.0はGPU速度で圧倒的であり、EfficientDetは大幅なレイテンシの代償としてより高いmAPまでスケーリングできる点に注目してください。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

レイテンシ対スループット

モデルを比較する際は、FLOPsやパラメータ数が現実世界のレイテンシと必ずしも完全に相関するわけではないことに留意してください。YOLOv6-3.0はTensorRT向けに最適化されており、下位のEfficientDetモデルよりも高いFLOP数であってもミリ秒単位の速度を達成します。

Link to this sectionUltralyticsエコシステムの利点#

YOLOv6-3.0とEfficientDetは特定のニッチな分野で役立ちますが、現代のコンピュータビジョンプロジェクトには汎用性、使いやすさ、そして十分にメンテナンスされたエコシステムが必要です。そこでUltralytics YOLOモデルが真価を発揮します。

Link to this section使いやすさと学習の効率性#

複雑なTensorFlowの設定を操作する必要があるEfficientDetとは異なり、Ultralyticsモデルは直感的なPyTorchの基盤の上に構築されています。Ultralytics Platformは、機械学習のライフサイクル全体を簡素化する合理的なAPIを提供します。UltralyticsモデルのトレーニングにはCUDAメモリが大幅に少なくて済み、実験を加速し、計算コストを削減します。

Link to this section比類なき汎用性#

YOLOv6-3.0とEfficientDetは主にオブジェクト検出に限定されています。対照的に、現代のUltralyticsアーキテクチャは本質的にマルチモーダルです。単一のインターフェースにより、インスタンスセグメンテーション、姿勢推定、画像分類、および指向性バウンディングボックス（OBB）タスクのモデルをトレーニングできます。

Link to this sectionUltralytics YOLO26の紹介#

究極のパフォーマンスバランスを求める開発者にとって、Ultralytics YOLO26はパラダイムシフトをもたらします。2026年1月にリリースされたこのモデルは、YOLOv6とEfficientDetの両方を凌駕するいくつかの画期的なイノベーションを導入しています。

エンドツーエンドのNMSフリー設計： YOLO26は非最大値抑制（NMS）の後処理をネイティブに排除しており、レイテンシのばらつきを大幅に低減し、エッジデバイス上での展開ロジックを簡素化します。
MuSGDオプティマイザ： LLMトレーニングに着想を得たこのハイブリッドオプティマイザは、安定したトレーニングと非常に高速な収束を保証します。
最大43%高速なCPU推論： Distribution Focal Loss（DFL）の削除により、YOLO26は従来のモデルと比較してCPUおよび低電力IoTデバイス上で大幅に効率的です。
ProgLoss + STAL： これらの高度な損失関数は小さなオブジェクトの認識を大幅に改善し、ドローンや航空画像アプリケーションにおいてYOLO26を理想的なものにします。

YOLO26の詳細はこちら

Link to this sectionユースケースと推奨事項#

YOLOv6とEfficientDetのどちらを選択するかは、特定のプロジェクト要件、展開の制約、およびエコシステムの優先順位によって決まります。

Link to this sectionYOLOv6を選択すべき時#

YOLOv6は以下の場合に強力な選択肢となります：

産業用ハードウェア対応の展開： モデルのハードウェア認識設計と効率的な再パラメータ化が、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
高速なシングルステージ検出： 管理された環境でのリアルタイムビデオ処理において、GPU上の生の推論速度を優先するアプリケーション。
Meituanエコシステムの統合： すでにMeituanの技術スタックと展開インフラ内で作業しているチーム。

Link to this sectionEfficientDetを選択すべき場合#

EfficientDetは以下の場合に推奨されます：

Google CloudおよびTPUパイプライン： Google Cloud Vision APIやTPUインフラストラクチャと深く統合されたシステムであり、EfficientDetのネイティブ最適化が活かせる環境。
複合スケーリング研究： ネットワークの深さ、幅、解像度のスケーリングバランスが与える影響を調査することに焦点を当てた学術的なベンチマーク。
TFLite経由のモバイルデプロイ: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

NMSフリーのエッジ展開： Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
CPUのみの環境： GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
小さな物体の検出： aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section実装例: YOLO26のトレーニング#

以下のコードは、Ultralyticsエコシステムのシンプルさを示しています。最先端のモデルをトレーニングするのは、重みをロードしてデータにポインタを向けるのと同じくらい簡単です。

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Link to this section検討すべきその他のモデル#

コンピュータビジョンモデルのより広範な状況を探索している場合は、これらの代替案を検討してください：

YOLO11： YOLO26の非常に成功した前身であり、堅牢なマルチタスク機能と広範なコミュニティサポートを提供します。
YOLOv10： NMSフリーのトレーニングを導入した最初のYOLOアーキテクチャであり、現代のエンドツーエンド検出への道を切り開きました。
RT-DETR： 従来のCNNよりもTransformerベースのアーキテクチャやアテンションメカニズムが好まれるシナリオ向け。

Link to this section結論#

YOLOv6-3.0は優れた産業用GPUスループットを提供し、EfficientDetはスケーラブルでパラメータ効率の高いネットワークを作成するAutoMLの可能性を示していますが、どちらのモデルも展開の容易さと現代のマルチタスクの汎用性に制限があります。

モバイルエッジ展開からクラウドベースの分析まで、現実世界のアプリケーションの大多数において、Ultralyticsエコシステムは比類のないパフォーマンスバランスを提供します。YOLO26を採用することで、開発者は最先端のNMSフリー推論、小さなオブジェクト向けの高度な損失関数、そしてプロトタイプから本番環境への移行を劇的に加速する統一された十分に文書化されたトレーニングパイプラインにアクセスできます。

コントリビューター

GLglenn-jocher¹⁷

作成日 2025年1月27日更新日先月

Link to this sectionYOLOv6-3.0 対 EfficientDet#

Link to this sectionYOLOv6-3.0: 産業グレードのスループット#

Link to this sectionアーキテクチャのハイライト#

Link to this section強みと弱み#

Link to this sectionEfficientDet：スケーラブルなAutoMLアーキテクチャ#

Link to this sectionアーキテクチャのハイライト#

Link to this section強みと弱み#

Link to this section詳細なパフォーマンス比較#

Link to this sectionUltralyticsエコシステムの利点#

Link to this section使いやすさと学習の効率性#

Link to this section比類なき汎用性#

Link to this sectionUltralytics YOLO26の紹介#

Link to this sectionユースケースと推奨事項#

Link to this sectionYOLOv6を選択すべき時#

Link to this sectionEfficientDetを選択すべき場合#

Link to this sectionUltralytics (YOLO26) を選択すべき時#

Link to this section実装例: YOLO26のトレーニング#

Link to this section検討すべきその他のモデル#

Link to this section結論#

コメント