コンテンツへスキップ

技術比較:物体検出におけるYOLOXとEfficientDetの比較

Ultralytics YOLO モデルは、物体検出タスクにおけるスピードと精度で定評があります。このページでは、2つの著名な物体検出モデルの詳細な技術比較を行います:YOLOXと EfficientDetのアーキテクチャ設計、性能ベンチマーク、トレーニング方法論、最適なアプリケーションを探求し、コンピュータビジョンのニーズに最適なモデルを選択するお手伝いをします。

YOLOX: 高性能アンカーフリー検出器

YOLOX(「You Only Look Once X」)は、Megviiが開発した最先端のアンカーレス物体検出器。シンプルかつ高性能に設計されており、研究と実用的な産業アプリケーションのギャップを埋める。

アーキテクチャと主な特徴

YOLOXは、アンカーフリーの検出パラダイムで差別化を図り、アーキテクチャを簡素化し、効率を高めている。主なアーキテクチャのハイライトは以下の通り:

  • アンカーフリー設計:アンカーボックスの複雑さがなくなり、実装がシンプルになり、特にアスペクト比の異なるオブジェクトに対して、より優れた汎化が可能になります。
  • 分離ヘッド:分類ヘッドとローカリゼーションヘッドを分離し、各タスクの最適化を高め、全体的な精度を向上。
  • 高度なトレーニング戦略:SimOTAラベル割り当てや強力なデータ増強(MixUpやMosaic)などのテクニックを採用し、確実なトレーニングとパフォーマンスの向上を実現します。

著者Zheng Ge、Songtao Liu、Feng Wang、Zeming Li、Jian Sun 所属団体メグヴィ 日付:2021-07-18 Arxivリンク :https://arxiv.org/abs/2107.08430 GitHubリンク : https://github.com/Megvii-BaseDetection/YOLOX ドキュメントリンク :https://yolox.readthedocs.io/en/latest/

パフォーマンス指標

YOLOXモデルは、スピードと精度の魅力的なバランスを提供します。比較表に示されているように、YOLOXは、高速推論スピードを維持しながら、競争力のあるmAPスコアを達成しており、リアルタイムアプリケーションに適しています。様々なモデルサイズにおける詳細なパフォーマンスについては、以下の表を参照してください。

使用例

  • リアルタイム物体検出セキュリティシステムやライブビデオ分析など、迅速な検出を必要とするアプリケーションに最適。
  • エッジデバイスNVIDIA Jetsonやモバイルプラットフォームのようなリソースが限られたデバイスで効率的なパフォーマンスを発揮します。
  • 自律システム:迅速で正確な知覚が重要なロボット工学や自律走行車に適している。

強みと弱み

強みだ:

  • 高速推論:アンカーフリーアーキテクチャと最適化された設計が高速処理に貢献。
  • シンプルさ:合理的な設計により、アンカーベースのモデルと比較して、訓練と展開が容易。
  • 精度とスピードのバランスの良さ:推論スピードを犠牲にすることなく、競争力のある精度を提供。

弱点がある:

  • mAP:非常に効率的ではあるが、特定のシナリオにおいては、より大規模で複雑なモデルよりも若干精度が劣るかもしれない。

YOLOXについてもっと知る

EfficientDet:スケーラブルで効率的な物体検出

Google Researchが開発したEfficientDetは、オブジェクト検出におけるスケーラビリティと効率性で有名です。EfficientDetは、従来の検出器と比較して大幅に少ないパラメータとFLOP数で最先端の精度を達成するモデルファミリーを採用しています。

アーキテクチャと主な特徴

EfficientDetは、効率と精度の両方を高めるためにいくつかの革新的な技術を導入しています:

  • BiFPN (Bi-directional Feature Pyramid Network):効率的なマルチスケール特徴フュージョンを可能にし、ネットワークが異なる解像度の特徴を効果的に利用できるようにする。
  • 複合スケール:単一の複合係数を使用して、ネットワークのすべての次元(バックボーン、BiFPN、ボックス/クラス予測ネットワーク)を一様にスケールアップし、スケーリングプロセスを簡素化し、パフォーマンスを最適化します。
  • 効率的なバックボーン:効率性と強力な特徴抽出能力で知られるEfficientNetをバックボーンネットワークとして利用。

著者Mingxing Tan、Ruoming Pang、Quoc V. Le 組織 Google 日付:2019-11-20 Arxivリンク :https://arxiv.org/abs/1911.09070 GitHubリンク google ドキュメントリンク google

パフォーマンス指標

EfficientDetモデルは、d0からd7までの様々なモデルを提供し、様々なスケールにおいて非常に効率的であるように設計されています。比較的少ないパラメータとFLOP数で優れたmAPスコアを達成するため、リソースに制約のある環境での展開に適しています。詳細な測定基準については、比較表を参照してください。

使用例

  • モバイルとエッジの展開EfficientDetの小さなモデルサイズと高い効率性は、モバイルデバイスやエッジコンピューティングシナリオに理想的です。
  • 限られたリソースで高精度を必要とするアプリケーション:エッジデバイスの品質検査など、精度が最重要だが計算リソースが限られているアプリケーションに適している。
  • バッテリー駆動デバイス:エネルギー効率の高い設計により、バッテリー駆動のデバイスやIoTアプリケーションへの展開が可能です。

強みと弱み

強みだ:

  • 高効率:より少ないパラメータとFLOP数で最先端の精度を達成し、推論の高速化と計算コストの低減を実現。
  • スケーラビリティ:複合スケーリング法により、さまざまな精度やリソース要件に合わせてモデルを簡単にスケーリングできる。
  • 精度:特に小型・中型モデルにおいて、mAPの面で強力なパフォーマンス。

弱点がある:

  • 推論速度:効率的ではあるが、EfficientDetはYOLOv10やYOLOv8のような速度に特化して最適化されたモデルよりも遅いかもしれない。 YOLOv8のようなスピードに最適化されたモデルよりも遅いかもしれません。

EfficientDetについてもっと知る

性能比較表

モデル サイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
スピード
T4TensorRT10
(ms)
params
(M)
FLOPs
(B)
ヨロックスナノ 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
ヨロックス 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
ヨロックス 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Ultralytics Docsで、オブジェクト検出モデル間の他の洞察に満ちた比較をご覧ください:

📅作成:1年前 ✏️更新:1ヶ月前

コメント