コンテンツにスキップ

YOLOv9 vs YOLO26: アーキテクチャとパフォーマンスの比較分析

リアルタイム物体検出の状況は常に進化しており、新しいイテレーションごとに精度、速度、効率が大幅に向上しています。本記事では、2024年初頭にリリースされた強力なモデルであるYOLOv9と、次世代のエッジAIアプリケーション向けに設計されたUltralyticsの最新の最先端モデルであるYOLO26について、詳細な技術比較を行います。

モデル概要

両モデルはコンピュータビジョンにおける重要なマイルストーンを築いていますが、検出の問題に対しては、わずかに異なるアーキテクチャ哲学でアプローチしています。

YOLOv9: プログラマブル勾配情報

2024年2月に台湾のAcademia Sinicaの研究者によってリリースされたYOLOv9は、深層ニューラルネットワークにおける情報損失に対処するための斬新な概念を導入しました。

  • 著者: Chien-Yao Wang、Hong-Yuan Mark Liao
  • 組織: Institute of Information Science, Academia Sinica, Taiwan
  • 日付: 2024年2月21日
  • 主要なイノベーション: Programmable Gradient Information (PGI) および Generalized Efficient Layer Aggregation Network (GELAN)。
  • 焦点: トレーニング中のパラメータ利用率と勾配フローを改善し、深層における情報保持を最大化すること。

YOLOv9について詳しくはこちら

YOLO26: エッジネイティブな進化

2026年1月にUltralyticsによって発表されたYOLO26は、特にCPUおよびエッジデバイス向けに、エンドツーエンドの効率性と合理化されたデプロイメントへのパラダイムシフトを象徴しています。

  • 著者: Glenn Jocher、Jing Qiu
  • 組織:Ultralytics
  • 日付: 2026年1月14日
  • 主要なイノベーション: エンドツーエンドのNMSフリーアーキテクチャ、MuSGD Optimizer、およびDistribution Focal Loss (DFL) の削除。
  • 焦点: 非GPUハードウェアでの推論レイテンシを最小限に抑え、エクスポートプロセスを簡素化し、大規模言語モデル (LLM) に着想を得た技術を使用してトレーニングダイナミクスを安定させること。

YOLO26についてさらに詳しく

アーキテクチャの違い

これら2つのモデルの核となる相違点は、ヘッド設計と損失関数の定式化にあり、それがデプロイメント速度とトレーニングの安定性に直接影響を与えます。

YOLOv9のアーキテクチャ

YOLOv9はGeneralized Efficient Layer Aggregation Network (GELAN)を利用しています。このアーキテクチャは、速度を犠牲にすることなく、さまざまな計算ブロック(CSPNetやELANなど)を柔軟に統合することを可能にします。Programmable Gradient Information (PGI)の導入は補助的な教師あり学習フレームワークを提供し、PGIは、軽量モデルでよく見られる問題である、深層を伝播する際に重要な特徴情報が失われないようにします。精度には非常に効果的ですが、この構造は従来のアンカーベースのメカニズムと、Non-Maximum Suppression (NMS)のような後処理ステップに依存しています。

YOLO26のアーキテクチャ

YOLO26は、ネイティブなエンドツーエンドのNMSフリー設計を採用しています。複雑な後処理を必要とせずに直接物体を予測することで、YOLO26は、特にNMSが計算上のボトルネックとなりうるエッジデバイスにおいて、レイテンシを大幅に削減します。

YOLO26における主要なアーキテクチャの変更点には以下が含まれます。

  • DFLの削除: Distribution Focal Lossはモデルグラフを簡素化するために削除され、これによりONNXやTensorRTのようなエクスポート形式が、低電力チップ上でよりクリーンかつ高速になります。
  • ProgLoss + STAL: 新しい損失関数は小さな物体の認識を改善し、これは航空画像解析やロボティクスのようなタスクにとって不可欠な要件です。
  • MuSGD Optimizer: SGDとMuon(LLMトレーニングに触発されたもの)のハイブリッドであり、トレーニング中の収束を高速化し、メモリ使用量の急増を抑制します。

NMSフリーが重要である理由

従来の物体検出器は、同じ物体に対して複数のバウンディングボックスを予測し、それらをフィルタリングするためにNon-Maximum Suppression (NMS) を使用します。このステップは、CPU上ではしばしばシーケンシャルで低速です。YOLO26のエンドツーエンド設計は、このステップを完全に排除し、最大43%のCPU推論速度向上を実現します。

パフォーマンス比較

これらのモデルを評価する際、研究者は通常、推論速度と並行してCOCOデータセットでのMean Average Precision (mAP) を考慮します。

ベンチマーク指標

以下の表は、性能のトレードオフを示しています。YOLOv9は高い精度を提供しますが、YOLO26は特にCPUハードウェアにおいて、優れた速度対精度比を達成します。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

分析

  • 速度: YOLO26は推論速度において明確な優位性を示します。例えば、YOLO26nは先行モデルよりも大幅に高速であり、高FPSのビデオ処理に最適です。
  • 精度: YOLO26は、同等のYOLOv9モデルをmAPで上回ります。特に、本番環境で最も一般的に使用されるnano (n) およびsmall (s) バリアントにおいて顕著です。
  • 計算量: YOLO26は、より高い精度を達成するために必要なFLOPs(浮動小数点演算)が常に少なく、より効率的なアーキテクチャ設計を示しています。

トレーニングとユーザビリティ

開発者にとって、トレーニングとデプロイの容易さは、生のメトリクスと同じくらい重要です。

エコシステムとサポート

YOLO26を含むUltralyticsモデルは、堅牢で十分にメンテナンスされたエコシステムの恩恵を受けています。 ultralytics pythonパッケージは、統合されたAPIを提供します トレーニング, 検証、および デプロイメント.

YOLOv9は強力ですが、主に研究用リポジトリです。Ultralyticsフレームワークの「pip installで即利用可能」な体験と比較して、これを本番環境のパイプラインに統合するには、多くの場合、より手動での設定が必要です。

トレーニング効率

YOLO26のMuSGD Optimizerは、トレーニングを安定させ、広範なハイパーパラメータチューニングの必要性を減らします。さらに、Ultralyticsモデルは、トランスフォーマーベースの代替モデルと比較して、トレーニング中のメモリ消費量が少ないことで知られており、これにより、ユーザーはコンシューマーグレードのGPUでより大きなバッチサイズをトレーニングできます。

Ultralytics APIを使用してYOLO26モデルをいかに簡単にトレーニングできるかを示す例を以下に示します。

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

理想的なユースケース

これらのモデルの選択は、特定の制約によって異なります。

YOLOv9を選択すべき時

  • 研究および学術研究: 勾配フローの研究や、YOLOv9論文の特定のベンチマークの再現を伴う作業の場合。
  • 特定のレガシーパイプライン: GELANアーキテクチャに厳密に調整された既存のパイプラインがあり、モデル構造を簡単に交換できない場合。

YOLO26を選択すべき時

  • エッジコンピューティング: 最大43%高速なCPU推論により、YOLO26はRaspberry Pi、Jetson Nano、およびモバイル展開に最適な選択肢です。
  • リアルタイムアプリケーション: NMSフリー設計により一貫したレイテンシが保証され、これは自動運転や安全監視システムにとって不可欠です。
  • 複雑なタスク: YOLO26は、detect以外の多様なタスクに対してネイティブサポートを提供しており、これにはインスタンスセグメンテーション姿勢推定、およびOriented Bounding Box (OBB) detectが含まれます。
  • エンタープライズプロダクション: Ultralyticsエコシステムが提供する安定性、サポート、およびエクスポートの容易さにより、YOLO26は商用製品にとってより安全な選択肢となります。

detectを超えて

標準のYOLOv9リポジトリとは異なり、YOLO26はタスク固有の改善をすぐに利用できます。これには、マスク精度を向上させるためのセマンティックセグメンテーション損失と、より正確な姿勢推定キーポイントのためのResidual Log-Likelihood Estimation (RLE)が含まれます。

結論

YOLOv9はプログラマブル勾配と情報保持に関する魅力的な概念を導入しましたが、YOLO26は、これらのアイデアを実用的な本番環境対応の強力なシステムへと進化させたものです。そのエンドツーエンドのNMSフリーアーキテクチャは、包括的なUltralyticsソフトウェアエコシステムと相まって、2026年に速度、精度、および使いやすさのバランスを求める開発者にとって推奨される選択肢となっています。

他の最新アーキテクチャの探求に興味がある方のために、ドキュメントではYOLO11も取り上げており、これは汎用コンピュータビジョンタスクにおいて依然として非常に有能なモデルです。


コメント