Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 対 EfficientDet#

最適なニューラルネットワークアーキテクチャを選択することは、あらゆる コンピュータービジョン プロジェクトを成功させるための基盤です。本ガイドでは、物体検出アーキテクチャ の歴史において重要な2つのモデルである YOLOv7EfficientDet について、詳細な技術的比較を行います。開発者は、そのアーキテクチャの革新性、トレーニング手法、理想的なデプロイメントシナリオを検証することで、情報に基づいた意思決定が可能になります。また、画期的な Ultralytics YOLO26 などの現代の進歩が、いかにして現在の最先端(SOTA)を再定義したのかについても探ります。

Link to this sectionモデルの起源と技術的詳細#

両モデルとも著名な研究チームによって開発され、機械学習 分野に重要な進歩をもたらしました。

YOLOv7 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao 組織: 中央研究院 情報科学研究所 (台湾) 日付: 2022-07-06 Arxiv: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors GitHub: WongKinYiu/yolov7 ドキュメント: Ultralytics YOLOv7 ドキュメント

YOLOv7の詳細はこちら

EfficientDet 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le 組織: Google Research 日付: 2019-11-20 Arxiv: EfficientDet: Scalable and Efficient Object Detection GitHub: Google AutoML EfficientDet

EfficientDetについて詳しく知る

Link to this sectionアーキテクチャの相違点とバランスのとれた分析#

効果的な モデルデプロイメント を行うには、これらのネットワークの基本的な構造上の違いを理解することが不可欠です。

Link to this sectionEfficientDet:コンパウンドスケーリングとBiFPN#

TensorFlow エコシステム内で開発された EfficientDet は、モデルスケーリングに対する原理的なアプローチを導入しました。Google の研究者は、ネットワークを恣意的に拡大または深層化するのではなく、解像度、深さ、幅を均一にスケーリングする複合スケーリング手法を採用しました。

さらに、EfficientDet は Bi-directional Feature Pyramid Network (BiFPN) を導入しました。このアーキテクチャコンポーネントにより、マルチスケールの特徴融合を容易かつ高速に行うことが可能です。

長所: パラメータ効率が非常に高く、多くの同世代モデルよりも少ない FLOPs で強力な mAP (mean Average Precision) を達成します。 短所: 従来の AutoML 探索戦略に大きく依存しています。最新の動的な PyTorch ワークフローへの統合は煩雑になることがあり、FLOP カウントが低いにもかかわらずエッジデバイスでのレイテンシが予想より高くなることがよくあります。

Link to this sectionYOLOv7: Trainable Bag-of-Freebies#

YOLOv7 は リアルタイム推論 とトレーニングの最適化を優先しました。これは拡張効率層アグリゲーションネットワーク (E-ELAN) という概念を導入しており、元の勾配パスを破壊することなく、より多様な特徴を継続的に学習できます。YOLOv7 は「Trainable bag-of-freebies」と呼ばれる手法も採用しており、推論コストを増加させることなく検出精度を劇的に向上させます。

長所: 並外れた処理速度と優れた 推論レイテンシ を備えており、高フレームレートのビデオストリームに最適です。 短所: 高い能力を備えていますが、依然としてアンカーボックスに依存しており、後処理で NMS (Non-Maximum Suppression) を必要とするため、非常に混雑したシーンではレイテンシのボトルネックになる可能性があります。

Ultralyticsエコシステムの利点

モデルを評価する際、周辺のエコシステムはアーキテクチャと同じくらい重要です。統合された Ultralytics Platform は、統一された API、広範なドキュメント、活発なコミュニティサポートを提供します。この統一された環境により、大規模な Transformer モデルと比較してトレーニング中のメモリ使用量が削減され、迅速なプロトタイピングとシームレスな 実験追跡 が保証されます。

Link to this sectionパフォーマンス指標とベンチマーク#

以下の表は、主要な パフォーマンス指標 を比較したもので、開発者が速度、パラメータ数、精度の間のトレードオフを評価できるようにしています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

示されているように、EfficientDet-d7 は高い mAP を達成しますが、その TensorRT 速度は YOLOv7 の各バリエーションに比べて大幅に遅れており、GPU アクセラレーションによる リアルタイム物体検出 における YOLOv7 の優位性が際立っています。

Link to this section物体検出の進化: YOLO26#

YOLOv7 と EfficientDet が重要な基礎を築きましたが、ビジョンAI の状況は急速に進化しています。効率性と精度の究極を求める最新のアプリケーションには、2026年1月にリリースされた YOLO26 へのアップグレードを強く推奨します。

YOLO26 addresses the inherent limitations of previous generations, offering unprecedented versatility across object detection, instance segmentation, image classification, and pose estimation.

YOLO26の詳細はこちら

Link to this sectionYOLO26の主な革新点#

  • エンドツーエンドの NMS フリー設計: YOLO26 はネイティブで NMS (Non-Maximum Suppression) 後処理を排除します。最初に YOLOv10 で先駆的に導入されたこの機能により、デプロイメントロジックが簡素化され、オブジェクトの密度に関わらず一貫した低レイテンシの実行が保証されます。
  • DFL 削除: Distribution Focal Loss (DFL) を削除することでモデルアーキテクチャが大幅に簡素化され、制約の厳しい エッジコンピューティング 環境との互換性が向上しました。
  • CPU 推論が最大 43% 高速化: 専用 GPU を持たない環境向けに大幅に最適化されており、軽量なハードウェア上で EfficientDet よりも飛躍的に高速に動作します。
  • MuSGD オプティマイザ: 大規模言語モデルの手法 (Moonshot AI の Kimi K2 など) に触発されたこの SGD と Muon のハイブリッドにより、LLM レベルの安定性と迅速な収束が コンピュータービジョンのトレーニング にもたらされます。
  • ProgLoss + STAL: これらの高度な損失関数は、小さな物体の認識において顕著な改善を実現しており、航空写真ドローンアプリケーション において重要な機能です。
  • タスク固有の改善: セグメンテーションタスク向けのセマンティックセグメンテーション損失とマルチスケールプロトタイプ、複雑な姿勢推定のための Residual Log-Likelihood Estimation (RLE)、方向付きバウンディングボックス (OBB) の境界問題を修正するために調整された専用の角度損失が含まれています。

現在レガシーシステムを使用しているチームにとって、Ultralytics Platform への移行により、これらの最先端モデルを簡単にトレーニングおよびデプロイできる効率的なワークフローが解放されます。開発者は、特定の互換性要件に応じて、YOLO11YOLOv8 といった過去の堅牢なイテレーションを検討することもできます。

Link to this section効率的なトレーニングと使いやすさ#

Ultralytics モデルを特徴づける要因の一つは、その圧倒的な 使いやすさ です。EfficientDet の TensorFlow AutoML 環境で求められるような複雑で多依存なセットアップとは異なり、Ultralytics はシンプルで Pythonic な API を提供します。

This environment minimizes CUDA memory usage during training, ensuring that even large datasets can be processed efficiently without Out-Of-Memory (OOM) errors commonly seen in bulky Transformer-based architectures.

Link to this sectionコード例: Ultralyticsを始める#

以下のスニペットは、開発者が Ultralytics パッケージ を活用して、箱から出してすぐに最先端の YOLO26 モデルをトレーニングする方法を示しています。

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model for object detection
model = YOLO("yolo26n.pt")

# Train the model effortlessly using the integrated Ultralytics ecosystem
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Auto-selects optimal device
    batch=16,
)

# Validate the model's performance
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Export the model for edge deployment (e.g., OpenVINO for CPU optimization)
model.export(format="openvino")
本番環境へのエクスポート

Ultralytics API を通じてトレーニングされたモデルは、OpenVINOONNX などのさまざまな本番用フォーマットに即座にエクスポートでき、ターゲットハードウェアに関わらず高いスループットを保証します。

Link to this section理想的なユースケースと実世界のアプリケーション#

ソリューションを設計する際には、モデルの長所を特定のユースケースと一致させることが不可欠です。

Link to this sectionEfficientDet を使用すべきタイミング#

EfficientDet は、依然としてレガシーな学術研究や、複合スケーリングの実験が主な焦点となる Google Cloud エコシステムに厳密に縛られた環境での候補となります。その小さなバリエーション (d0-d2) は、ディスクサイズが非常に制限されている場合に有益です。

Link to this sectionYOLOv7 の活用#

YOLOv7 は、特に TensorFlow よりも PyTorch の統合が好まれるような、高性能なレガシー設定で優れています。これは広くデプロイされており、以下のような用途に適しています。

  • ビデオ分析: GPU アクセラレーションが豊富な環境における、高フレームレートのセキュリティストリーム処理。
  • 産業検査: 高速で移動する 製造組立ライン での欠陥の特定。

Link to this sectionYOLO26を選ぶべき時#

すべての新規デプロイメントに対しては、YOLO26 を強く推奨します。その比類のない パフォーマンスバランス と堅牢な 十分にメンテナンスされたエコシステム により、以下の用途に最適です。

  • スマートシティおよび交通管理: その NMS フリー設計により、リアルタイムの 交通調整 に不可欠な一貫した推論レイテンシが保証されます。
  • ロボティクスおよび自律システム: CPU 推論速度が 43% 向上したことで、埋め込みデバイス向けの非常に応答性の高いナビゲーションアルゴリズムが確保されます。
  • 農業および航空モニタリング: ProgLoss と STAL を利用して、高高度の画像から特定の作物や野生生物といった小さな物体を正確に特定します。

結論として、EfficientDet と YOLOv7 は貴重な歴史的背景と特定のニッチな有用性を提供しますが、現代のコンピュータービジョンエンジニアにとっては、Ultralytics YOLO26 アーキテクチャを採用するのが最善です。これは前述のボトルネックをエレガントに解決しつつ、人工知能において何が可能であるかの境界を押し広げています。

コントリビューター

コメント