Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDetとYOLOv9の比較#

コンピュータビジョンの分野は、ニューラルネットワーク設計の継続的な飛躍によって形作られてきました。モデルを選択する際には、計算効率と検出精度の適切なバランスを見極めることが極めて重要です。Googleの EfficientDet は、スケーラブルなアーキテクチャを導入することで2019年に強力なベースラインを確立しました。一方、2024年にリリースされた YOLOv9 は、Programmable Gradient Information (PGI) を活用して 物体検出 の限界を押し広げました。

本ガイドでは、これら2つのモデルの包括的な技術比較を行うとともに、実環境向けに最適化された堅牢なエンドツーエンドのソリューションを提供する、最新の Ultralytics YOLO26 フレームワークを紹介します。

Link to this sectionモデルのアーキテクチャと革新#

EfficientDetとYOLOv9の根本的な仕組みを理解することは、最適なユースケースを判断するために不可欠です。

Link to this sectionEfficientDet:コンパウンドスケーリングとBiFPN#

Google Researchによって開発されたEfficientDetは、体系的なスケーリングと効率的な特徴融合に焦点を当てています。バックボーンとしてEfficientNetを採用し、新しい特徴ネットワークアーキテクチャを導入しています。

  • 著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
  • 組織: Google
  • 日付: 2019年11月20日
  • リンク: Arxiv, GitHub

主要なアーキテクチャの特徴: EfficientDetは、簡単かつ高速なマルチスケール特徴融合を可能にするBi-directional Feature Pyramid Network (BiFPN) に大きく依存しています。これに加えて、ネットワークの解像度、深さ、幅を均一にスケーリングするコンパウンドスケーリング手法を使用しています。登場当時は非常に高精度でしたが、EfficientDetは旧式の TensorFlow 環境に強く依存しているため、最新の展開パイプラインを構築するのは複雑です。

EfficientDetについて詳しくはこちら

Link to this sectionYOLOv9: 情報ボトルネックの解決#

中央研究院の研究者によって開発されたYOLOv9は、データがディープニューラルネットワークを通過する際に発生する情報の劣化問題に取り組んでいます。

  • 著者: Chien-Yao Wang および Hong-Yuan Mark Liao
  • 組織: 中央研究院 情報科学研究所
  • 日付: 2024年2月21日
  • リンク: Arxiv, GitHub, ドキュメント

主要なアーキテクチャの特徴: YOLOv9は、補助的な監視機能を提供するProgrammable Gradient Information (PGI) を導入し、ネットワークの重みを確実に更新するために重要なデータを保持できるようにしています。また、パラメータ効率を最大化するためにGeneralized Efficient Layer Aggregation Network (GELAN) を採用しています。これらの進歩にもかかわらず、YOLOv9は後処理でNon-Maximum Suppression (NMS) を必要とし、これがレイテンシの原因となります。

YOLOv9の詳細はこちら

Link to this sectionパフォーマンスの比較#

これらのモデルを評価する際には、実証データを分析することで、特定の ハードウェア要件 に対してどのアーキテクチャが最良のトレードオフを提供するかを判断するのに役立ちます。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this section批判的分析#

YOLOv9は速度面で飛躍的な進歩を遂げています。例えば、YOLOv9eは 55.6% mAP を達成し、TensorRTでのレイテンシは16.77msです。対照的に、EfficientDet-d7は53.7%という低いmAPでありながら、128.07msという大きなレイテンシが発生するため、リアルタイムのビデオストリームに展開することは極めて困難です。

本番環境向けのモデルエクスポート

アーキテクチャを TensorRTOpenVINO のような最適化された形式にエクスポートすることで、生の PyTorch 実行と比較して推論時間を劇的に短縮できます。

Link to this sectionユースケースと推奨事項#

EfficientDetとYOLOv9のどちらを選ぶかは、特定のプロジェクト要件、展開の制約、およびエコシステムの好みに依存します。

Link to this sectionEfficientDetを選択すべき場合#

EfficientDetは以下の場合に有力な選択肢となります。

  • Google CloudおよびTPUパイプライン: Google Cloud Vision APIやTPUインフラストラクチャと深く統合されたシステムであり、EfficientDetのネイティブ最適化が活かせる環境。
  • 複合スケーリング研究: ネットワークの深さ、幅、解像度のスケーリングバランスが与える影響を調査することに焦点を当てた学術的なベンチマーク。
  • TFLite経由のモバイルデプロイ: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。

Link to this sectionYOLOv9を選択すべき場合#

YOLOv9は以下の場合に推奨されます:

  • 情報ボトルネック研究: Programmable Gradient Information (PGI)およびGeneralized Efficient Layer Aggregation Network (GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化の研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に重点を置いた研究。
  • 高精度検出ベンチマーク: アーキテクチャ比較の基準点として、YOLOv9の強力なCOCOベンチマークパフォーマンスが必要とされるシナリオ。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionUltralyticsの利点: YOLO26を選択する理由#

YOLOv9とEfficientDetは道を切り開きましたが、真にモダンで本番環境に対応したフレームワークを求める開発者は、新たにリリースされた YOLO26 を含む Ultralytics YOLOモデル を検討すべきです。

Ultralytics Platform は、強力なローカル学習スクリプトとクラウド対応のインターフェースを組み合わせ、比類のない使いやすさを提供します。YOLO26はモデル設計の大幅な刷新を表しており、多くの商用アプリケーションにおいて旧来のアーキテクチャを時代遅れなものにしています。

Link to this sectionYOLO26の技術的ハイライト#

  • エンドツーエンドのNMSフリー設計: YOLO26は後処理のボトルネックを完全に排除します。Non-Maximum Suppression を削除することで、展開グラフが統一され、エッジAIチップ上で本質的に高速化されます。
  • 最大43%高速なCPU推論: 組み込みデバイス向けに高度に最適化されており、GPUが使用できない環境ではYOLOv9やEfficientDetよりも大幅に高速です。
  • MuSGDオプティマイザ: LLMの革新をビジョンAIに統合し、このハイブリッドオプティマイザは学習を安定させ、より少ないリソースでモデルをより早く収束させます。
  • 低いメモリ要件: トランスフォーマー主体のアーキテクチャや最適化されていないCNNとは異なり、YOLO26は学習中の CUDA メモリ消費を最小限に抑えるため、一般消費者向けハードウェアでも大きなバッチサイズを使用できます。
  • ProgLoss + STAL: 優れた損失関数設計により、小さな物体の検出精度が大幅に向上し、航空画像やIoTネットワークに最適です。
  • DFLの削除: 簡素化された構造設計により、モバイル展開形式への摩擦のない変換が可能になります。

YOLO26の詳細はこちら

Ultralyticsエコシステムにおけるその他の強力な選択肢として、YOLO11YOLOv8があります。これらもインスタンスセグメンテーション姿勢推定といったマルチタスクの汎用性を提供します。

Link to this sectionPython SDKによる簡素化された学習#

Ultralyticsモデルは開発者のエクスペリエンスを優先します。最先端モデルの学習は、わずか数行の Python コードに凝縮されています。

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Link to this section実際のアプリケーション#

これらのアーキテクチャの選択は、展開ターゲットに大きく依存します。

  • レガシーなクラウド展開: EfficientDetは、高い精度が求められ、厳格なリアルタイム制約が存在しないオフラインのクラウドベース・バッチ処理において普及していました。
  • 学術研究: YOLOv9は、CNNの理論的限界を押し広げ、ネットワーク層を通る勾配フローを分析する研究者にとって興味深い選択肢であり続けています。
  • エッジコンピューティングとIoT: YOLO26 は実世界のアプリケーションを支配します。NMS不要のパイプラインと Oriented Bounding Box (OBB) 機能は、スマートシティの交通分析、小売在庫モニタリング、ドローンによる検査において優れた選択肢となり、高い精度と迅速な推論速度の比類なきバランスを提供します。
コントリビューター

コメント