コンテンツにスキップ

EfficientDet vs. YOLO26: 物体検出アーキテクチャの徹底比較

コンピュータビジョンの分野は2019年から2026年にかけて劇的に進化した。EfficientDetがスケーラブルなアーキテクチャ最適化の概念を世界に紹介した一方で、YOLO26はそのエンドツーエンド設計により、現代的なリアルタイム効率の頂点を体現している。本比較では、これら二つの影響力あるモデルのアーキテクチャ上の変遷、性能指標、実用的な応用を探り、開発者が特定の物体検出ニーズに適したツールを選択する手助けとなる。

性能指標の比較

以下の表は、EfficientDetの各種バリエーションとYOLO26ファミリーの性能を比較したものです。新しいアーキテクチャによって達成された推論速度とパラメータ効率の大幅な飛躍に注目してください。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

効率的な検出:スケーラブルな先駆者

Google によって開発されたEfficientDetは2019年末に公開され、瞬く間に効率性の新たな基準を打ち立てた。中核となる革新は「複合スケーリング」であり、これはネットワークのバックボーン(EfficientNet)と特徴ネットワーク/予測ネットワークの解像度、深さ、幅を均一にスケーリングする手法である。

主要なアーキテクチャ機能

EfficientDetは双方向特徴ピラミッドネットワーク(BiFPN)を採用する。従来のFPNが特徴量をトップダウン方式で加算するのみであるのに対し、BiFPNは異なる入力特徴量に学習可能な重みを導入し、トップダウンとボトムアップのマルチスケール特徴融合を反復的に適用する。これにより高精度が得られる一方、複雑な相互接続は計算負荷が高く、特に専用ハードウェアアクセラレータを持たないデバイスでは処理が重くなる可能性がある。

レガシーの複雑性

当時としては画期的であったBiFPN構造は、不規則なメモリアクセスパターンを伴うため、最新のエッジAIハードウェアでは、新世代モデルで採用されている効率化されたCNN構造と比較してレイテンシボトルネックを引き起こす可能性がある。

YOLO26:エンドツーエンドのスピードモンスター

2026年初頭にリリースされたYOLO26は、エッジデバイスで実現可能なことを再定義します。従来のアンカーベースのロジックから脱却し、非最大抑制(NMS)のような複雑な後処理ステップを不要とする、簡素化されたエンドツーエンドのアーキテクチャへと移行しています。

YOLO26についてさらに詳しく

YOLO26における技術的ブレークスルー

YOLO26は、EfficientDetなどの先行技術や競合技術と差別化を図る、いくつかの最先端の進歩を統合しています:

  1. エンドツーエンドNMS設計: NMS排除することで、YOLO26は推論パイプラインを簡素化します。これによりレイテンシ変動が低減され、 TensorRT やCoreML へのデプロイをCoreML 円滑化します。
  2. MuSGDオプティマイザー:大規模言語モデル(LLM)のトレーニングに着想を得た、SGD ミューオン(Moonshot AIのKimi K2由来)のハイブリッド手法。安定したトレーニングダイナミクスと高速な収束を実現し、 GPU 時間削減を実現します。
  3. ProgLoss + STAL:プログラマブル損失とソフトターゲット割り当て損失の導入により、単段検出器の伝統的な弱点である小型物体の検出性能が大幅に向上した。
  4. エッジファースト最適化:ディストリビューション焦点損失(DFL)の除去によりモデルグラフが簡素化され、前世代と比較して最大43%高速CPU 速度を実現。

詳細な比較

アーキテクチャと効率性

EfficientDetは、そのEfficientNetバックボーンの重労働とBiFPNの複雑な融合に依存している。これによりパラメータ当たりの高精度が得られる一方で、メモリアクセスコストのため、生のFLOPsが必ずしも推論速度に直線的に反映されるとは限らない。

対照的に、YOLO26はスループットを重視して設計されている。そのアーキテクチャはメモリ帯域幅の使用を最小限に抑え、モバイルやIoTデバイスにとって重要な要素となっている。 「Nano」モデル(YOLO26n)はT4GPU驚異的な1.7ミリ秒で動作し、EfficientDet-d0の3.92ミリ秒を大幅に下回る一方、精度も著しく高い(40.9mAP 34.6mAP)。

トレーニングとユーザビリティ

最も重要な違いの一つはエコシステムにある。EfficientDetのトレーニングでは、複雑な研究リポジトリやTensorFlow .x/2.xコードベースを扱う必要がある場合が多い。

Ultralytics シームレスな「ゼロからヒーローへ」の体験を提供します。Ultralytics では、ユーザーはデータセットの管理、クラウド上でのトレーニング、ワンクリックでのデプロイが可能です。Python シンプルさを追求して設計されています:

from ultralytics import YOLO

# Load a pre-trained YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

汎用性とタスク

EfficientDetは主に物体検出モデルです。拡張機能は存在しますが、標準化されていません。一方、YOLO26はマルチタスクの強力なモデルです。ネイティブで以下をサポートしています:

メモリ効率

YOLO26モデルは、従来のアーキテクチャやトランスフォーマーベースのハイブリッドモデルと比較して、CUDA 一般的に少なく、コンシューマー向けハードウェアでもより大きなバッチサイズでの学習が可能となる。

Ultralytics YOLO26を選ぶ理由

2026年の開発者と研究者にとって、選択は明らかだ。EfficientDetがコンピュータビジョン史における重要なマイルストーンであることに変わりはないが、YOLO26はより優れた現代的な解決策を提供する。

  • 使いやすさ:充実したドキュメントとシンプルなAPIにより、導入障壁が低くなります。
  • 性能バランス:自動運転やセキュリティ監視といったアプリケーションに不可欠な、高精度とリアルタイム処理速度の「黄金比」を実現します。
  • 健全に維持されたエコシステム:頻繁なアップデート、Discordを通じたコミュニティサポート、Ultralytics & Biasesなどのツールとのシームレスな連携 Weights & Biases により、プロジェクトの将来性を保証します。
  • デプロイ準備完了:ONNXOpenVINO、CoreMLへのネイティブエクスポートサポートにより、プロトタイプから本番環境への移行が容易です。

Ultralytics 高性能オプションに関心のあるユーザー向けに、前世代の YOLO11 は依然として堅牢な選択肢であり、 RT-DETR は、グローバルコンテキストが極めて重要となるシナリオにおいて優れたトランスフォーマーベースの機能を提供します。


コメント