Link to this sectionEfficientDetとYOLOv9の比較#

コンピュータビジョンの分野は、ニューラルネットワーク設計の継続的な飛躍によって形作られてきました。モデルを選択する際には、計算効率と検出精度の適切なバランスを見極めることが極めて重要です。Googleの EfficientDet は、スケーラブルなアーキテクチャを導入することで2019年に強力なベースラインを確立しました。一方、2024年にリリースされた YOLOv9 は、Programmable Gradient Information (PGI) を活用して物体検出の限界を押し広げました。

本ガイドでは、これら2つのモデルの包括的な技術比較を行うとともに、実環境向けに最適化された堅牢なエンドツーエンドのソリューションを提供する、最新の Ultralytics YOLO26 フレームワークを紹介します。

Link to this sectionモデルのアーキテクチャと革新#

EfficientDetとYOLOv9の根本的な仕組みを理解することは、最適なユースケースを判断するために不可欠です。

Link to this sectionEfficientDet：コンパウンドスケーリングとBiFPN#

Google Researchによって開発されたEfficientDetは、体系的なスケーリングと効率的な特徴融合に焦点を当てています。バックボーンとしてEfficientNetを採用し、新しい特徴ネットワークアーキテクチャを導入しています。

著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
組織: Google
日付: 2019年11月20日
リンク: Arxiv, GitHub

主要なアーキテクチャの特徴: EfficientDetは、簡単かつ高速なマルチスケール特徴融合を可能にするBi-directional Feature Pyramid Network (BiFPN) に大きく依存しています。これに加えて、ネットワークの解像度、深さ、幅を均一にスケーリングするコンパウンドスケーリング手法を使用しています。登場当時は非常に高精度でしたが、EfficientDetは旧式の TensorFlow 環境に強く依存しているため、最新の展開パイプラインを構築するのは複雑です。

EfficientDetについて詳しくはこちら

Link to this sectionYOLOv9: 情報ボトルネックの解決#

中央研究院の研究者によって開発されたYOLOv9は、データがディープニューラルネットワークを通過する際に発生する情報の劣化問題に取り組んでいます。

著者: Chien-Yao Wang および Hong-Yuan Mark Liao
組織: 中央研究院情報科学研究所
日付: 2024年2月21日
リンク: Arxiv, GitHub, ドキュメント

主要なアーキテクチャの特徴: YOLOv9は、補助的な監視機能を提供するProgrammable Gradient Information (PGI) を導入し、ネットワークの重みを確実に更新するために重要なデータを保持できるようにしています。また、パラメータ効率を最大化するためにGeneralized Efficient Layer Aggregation Network (GELAN) を採用しています。これらの進歩にもかかわらず、YOLOv9は後処理でNon-Maximum Suppression (NMS) を必要とし、これがレイテンシの原因となります。

YOLOv9の詳細はこちら

Link to this sectionパフォーマンスの比較#

これらのモデルを評価する際には、実証データを分析することで、特定のハードウェア要件に対してどのアーキテクチャが最良のトレードオフを提供するかを判断するのに役立ちます。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Link to this section批判的分析#

YOLOv9は速度面で飛躍的な進歩を遂げています。例えば、YOLOv9eは 55.6% mAP を達成し、TensorRTでのレイテンシは16.77msです。対照的に、EfficientDet-d7は53.7%という低いmAPでありながら、128.07msという大きなレイテンシが発生するため、リアルタイムのビデオストリームに展開することは極めて困難です。

本番環境向けのモデルエクスポート

アーキテクチャを TensorRT や OpenVINO のような最適化された形式にエクスポートすることで、生の PyTorch 実行と比較して推論時間を劇的に短縮できます。

Link to this sectionユースケースと推奨事項#

EfficientDetとYOLOv9のどちらを選ぶかは、特定のプロジェクト要件、展開の制約、およびエコシステムの好みに依存します。

Link to this sectionEfficientDetを選択すべき場合#

EfficientDetは以下の場合に有力な選択肢となります。

Google CloudおよびTPUパイプライン： Google Cloud Vision APIやTPUインフラストラクチャと深く統合されたシステムであり、EfficientDetのネイティブ最適化が活かせる環境。
複合スケーリング研究： ネットワークの深さ、幅、解像度のスケーリングバランスが与える影響を調査することに焦点を当てた学術的なベンチマーク。
TFLite経由のモバイルデプロイ: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。

Link to this sectionYOLOv9を選択すべき場合#

YOLOv9は以下の場合に推奨されます:

情報ボトルネック研究: Programmable Gradient Information (PGI)およびGeneralized Efficient Layer Aggregation Network (GELAN)アーキテクチャを研究する学術プロジェクト。
勾配フロー最適化の研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に重点を置いた研究。
高精度検出ベンチマーク: アーキテクチャ比較の基準点として、YOLOv9の強力なCOCOベンチマークパフォーマンスが必要とされるシナリオ。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

NMSフリーのエッジ展開： Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
CPUのみの環境： GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
小さな物体の検出： aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionUltralyticsの利点: YOLO26を選択する理由#

YOLOv9とEfficientDetは道を切り開きましたが、真にモダンで本番環境に対応したフレームワークを求める開発者は、新たにリリースされた YOLO26 を含む Ultralytics YOLOモデルを検討すべきです。

Ultralytics Platform は、強力なローカル学習スクリプトとクラウド対応のインターフェースを組み合わせ、比類のない使いやすさを提供します。YOLO26はモデル設計の大幅な刷新を表しており、多くの商用アプリケーションにおいて旧来のアーキテクチャを時代遅れなものにしています。

Link to this sectionYOLO26の技術的ハイライト#

エンドツーエンドのNMSフリー設計: YOLO26は後処理のボトルネックを完全に排除します。Non-Maximum Suppression を削除することで、展開グラフが統一され、エッジAIチップ上で本質的に高速化されます。
最大43%高速なCPU推論: 組み込みデバイス向けに高度に最適化されており、GPUが使用できない環境ではYOLOv9やEfficientDetよりも大幅に高速です。
MuSGDオプティマイザ: LLMの革新をビジョンAIに統合し、このハイブリッドオプティマイザは学習を安定させ、より少ないリソースでモデルをより早く収束させます。
低いメモリ要件: トランスフォーマー主体のアーキテクチャや最適化されていないCNNとは異なり、YOLO26は学習中の CUDA メモリ消費を最小限に抑えるため、一般消費者向けハードウェアでも大きなバッチサイズを使用できます。
ProgLoss + STAL: 優れた損失関数設計により、小さな物体の検出精度が大幅に向上し、航空画像やIoTネットワークに最適です。
DFLの削除: 簡素化された構造設計により、モバイル展開形式への摩擦のない変換が可能になります。

YOLO26の詳細はこちら

Ultralyticsエコシステムにおけるその他の強力な選択肢として、YOLO11やYOLOv8があります。これらもインスタンスセグメンテーションや姿勢推定といったマルチタスクの汎用性を提供します。

Link to this sectionPython SDKによる簡素化された学習#

Ultralyticsモデルは開発者のエクスペリエンスを優先します。最先端モデルの学習は、わずか数行の Python コードに凝縮されています。

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Link to this section実際のアプリケーション#

これらのアーキテクチャの選択は、展開ターゲットに大きく依存します。

レガシーなクラウド展開: EfficientDetは、高い精度が求められ、厳格なリアルタイム制約が存在しないオフラインのクラウドベース・バッチ処理において普及していました。
学術研究: YOLOv9は、CNNの理論的限界を押し広げ、ネットワーク層を通る勾配フローを分析する研究者にとって興味深い選択肢であり続けています。
エッジコンピューティングとIoT: YOLO26 は実世界のアプリケーションを支配します。NMS不要のパイプラインと Oriented Bounding Box (OBB) 機能は、スマートシティの交通分析、小売在庫モニタリング、ドローンによる検査において優れた選択肢となり、高い精度と迅速な推論速度の比類なきバランスを提供します。

貢献者

GLglenn-jocher¹⁵

作成日 2025年1月27日更新日 3 週間前