コンテンツにスキップ

EfficientDet vs. YOLOv9: アーキテクチャ、パフォーマンス、およびエッジデプロイメント

コンピュータビジョンの分野は、ニューラルネットワーク設計における継続的なブレークスルーによって形作られてきた。モデル選択においては、計算効率と検出精度の適切なバランスを見極めることが極めて重要である。Google のEfficientDetは2019年、スケーラブルなアーキテクチャを導入することで強力なベースラインを確立した。一方 YOLOv9はプログラマブル勾配情報(PGI)を用いて物体検出の限界を押し広げた。

このガイドでは、これら2つのモデルを包括的に技術的に比較するとともに、生産環境に最適化されたUltralytics フレームワークを紹介します。

モデルアーキテクチャとイノベーション

EfficientDetとYOLOv9 の基盤となるメカニズムを理解することは、それらの最適な使用ケースを決定するために不可欠YOLOv9 。

EfficientDet: 複合スケーリングとBiFPN

Google Researchによって開発されたEfficientDetは、体系的なスケーリングと効率的な特徴融合に焦点を当てています。EfficientNetをバックボーンとして利用し、新しい特徴ネットワークアーキテクチャを導入しています。

  • 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
  • 組織:Google
  • 日付: 2019年11月20日
  • リンク:Arxiv,GitHub

主要なアーキテクチャ機能: EfficientDetは双方向特徴ピラミッドネットワーク(BiFPN)に大きく依存しており、これにより容易かつ高速なマルチスケール特徴融合が可能になります。これに加えて、ネットワークの解像度、深さ、幅を均一にスケーリングする複合スケーリング手法を使用しています。当時としては非常に高精度でしたが、EfficientDetは古いTensorFlow環境に強く依存しており、最新のデプロイメントパイプラインを複雑にしています。

EfficientDetの詳細について。

YOLOv9: 情報のボトルネックを解決する

Academia Sinicaの研究者によって開発されたYOLOv9は、データが深層ニューラルネットワークを通過する際の情報の劣化に対処します。

  • 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
  • 組織: 中央研究院 情報科学研究所
  • 日付: 2024年2月21日
  • リンク:Arxiv, GitHub, Docs

主要なアーキテクチャ機能: YOLOv9は、補助的な監視を提供するためにプログラマブル勾配情報(PGI)を導入し、ネットワークの重みを確実に更新するために重要なデータが保持されるようにします。また、パラメータ効率を最大化するために汎用効率的層集約ネットワーク(GELAN)を特徴としています。これらの進歩にもかかわらず、YOLOv9は後処理中にNon-Maximum Suppression(NMS)を依然として必要とし、これがレイテンシーを追加します。

YOLOv9について詳しくはこちら

パフォーマンス比較

これらのモデルを評価する際には、実証データの分析が、特定のハードウェア要件に対して最適なトレードオフを提供するアーキテクチャを決定するのに役立ちます。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

詳細な分析

YOLOv9 速度において飛躍的な進歩YOLOv9 。例えばYOLOv9eは、TensorRT 16.77msで55.6mAPを達成する。これに対しEfficientDet-d7は53.mAP 低いmAP ながら、128.07msという膨大なレイテンシを抱えており、リアルタイム動画ストリームへの導入が極めて困難である。

本番環境向けモデルのエクスポート

アーキテクチャをTensorRTOpenVINOのような最適化された形式にエクスポートすると、生のPyTorch実行と比較して、推論時間が大幅に短縮されます。

ユースケースと推奨事項

EfficientDetとYOLOv9の選択は、特定のプロジェクト要件、デプロイ制約、およびエコシステム設定に依存します。

EfficientDetを選択するタイミング

EfficientDetは、以下の用途に強力な選択肢です。

  • Google CloudおよびTPUパイプライン: EfficientDetがネイティブ最適化されているGoogle Cloud Vision APIまたはTPUインフラストラクチャと深く統合されたシステム。
  • 複合スケーリング研究:バランスの取れたネットワークの深さ、幅、解像度のスケーリング効果を研究することに焦点を当てた学術的なベンチマーク。
  • TFLiteを介したモバイルデプロイメント: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。

YOLOv9を選択すべき時

YOLOv9 以下に推奨YOLOv9 :

  • 情報ボトルネック研究: プログラマブル勾配情報(PGI)および汎用効率的層集約ネットワーク(GELAN)アーキテクチャを研究する学術プロジェクトです。
  • 勾配フロー最適化研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に焦点を当てた研究。
  • 高精度detectベンチマーク: YOLOv9の強力なCOCOベンチマーク性能が、アーキテクチャ比較の参照点として必要とされるシナリオ。

Ultralytics YOLO26)を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。

  • NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
  • CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
  • 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。

Ultralytics :YOLO26の選択

YOLOv9 道を開いたとはいえ、真に現代的で実運用可能なフレームワークを求める開発者は、Ultralytics YOLO 、特に新たにリリースされたYOLO26を検討すべきである。

Ultralytics は、強力なローカルトレーニングスクリプトとクラウド対応インターフェースを組み合わせ、比類のない使いやすさを提供します。YOLO26はモデル設計における大規模な刷新を意味し、多くの商用アプリケーションにおいて従来のアーキテクチャを時代遅れにしています。

YOLO26 技術的ハイライト

  • エンドツーエンドのNMSフリー設計: YOLO26は後処理のボトルネックを完全に排除します。Non-Maximum Suppressionを排除することで、デプロイメントグラフは統合され、エッジAIチップ上で本質的に高速になります。
  • 最大43%高速なCPU推論: 組み込みデバイス向けに高度に最適化されており、GPUが利用できない場合でもYOLOv9およびEfficientDetの両方よりも大幅に高速です。
  • MuSGDオプティマイザ: LLMの革新をビジョンAIに統合することで、このハイブリッドオプティマイザはトレーニング実行を安定させ、モデルがより少ないリソースでより速く収束することを可能にします。
  • 低メモリ要件: Transformerベースの重いアーキテクチャや最適化されていないCNNとは異なり、YOLO26はトレーニング中のCUDAメモリ消費を最小限に抑え、コンシューマーグレードのハードウェアでより大きなバッチサイズを使用できるようにします。
  • ProgLoss + STAL: 優れた損失関数設計は、小さなオブジェクトを detect する精度を劇的に向上させ、YOLO26を航空画像およびIoTネットワークに理想的なものにします。
  • DFLの削除: 構造設計の簡素化により、モバイル展開形式へのスムーズな変換が可能になります。

YOLO26についてさらに詳しく

Ultralytics におけるその他の堅牢なオプションには以下が含まれます YOLO11 および YOLOv8も含まれており、これらはインスタンスセグメンテーション姿勢推定といったマルチタスク処理の汎用性も提供します。

Python による簡素化されたトレーニング

Ultralytics 開発者体験を最優先します。最先端モデルのトレーニングはわずか数行のPythonコードに凝縮されています。 Pythonに凝縮されています。

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

現実世界のアプリケーション

これらのアーキテクチャの選択は、デプロイターゲットに大きく依存します。

  • レガシークラウドデプロイメント: EfficientDetは、高い精度が必要とされ、厳密なリアルタイム制約が存在しないオフラインのクラウドベースのバッチ処理で人気がありました。
  • 学術研究: YOLOv9は、理論的なCNNの限界を押し広げ、ネットワーク層を通る勾配フローを分析する研究者にとって興味深い選択肢であり続けています。
  • エッジコンピューティングおよびIoT:YOLO26は実世界のアプリケーションを席巻しています。NMSフリーのパイプラインとOriented Bounding Box (obb)機能により、スマートシティの交通分析、小売在庫監視、およびドローンベースの検査にとって優れた選択肢となっており、高い精度と高速な推論速度の比類ないバランスを提供します。

コメント