YOLOv9 . YOLO26:現代の物体検出技術への深い考察
リアルタイム物体検出の分野は、ここ数年で大きく進化を遂げてきた。機械学習の実践者が様々なハードウェアにモデルを展開しようとする中、適切なアーキテクチャの選択が極めて重要となる。この包括的な技術ガイドでは、コンピュータビジョン分野における二つの主要なマイルストーンを比較する: YOLOv9(2024年初頭発表、勾配経路最適化に重点)と Ultralytics を比較します。後者は2026年初頭にリリースされた最新鋭のフレームワークであり、エッジ推論とトレーニング安定性を完全に再定義しています。
エグゼクティブサマリー:モデルの系譜と作成者
これらの深層学習モデルの起源を理解することは、そのアーキテクチャ設計上の選択や対象ユーザー層に関する貴重な背景情報を提供する。
YOLOv9
台湾・中央研究院情報科学研究所の王千耀(Chien-Yao Wang)と廖宏源(Hong-Yuan Mark Liao)によって開発YOLOv9 、2024年2月21日にYOLOv9 。本モデルは理論的な深層学習概念に重点を置き、特に深層畳み込みニューラルネットワーク(CNN)における情報ボトルネック問題に対処している。
Ultralytics YOLO26
グレン・ジョッチャーとジン・チウによる執筆 Ultralyticsによって開発され、2026年1月14日にリリースされました。YOLO11やYOLO2などの先行モデルの大成功を基盤としつつ、 YOLO11 や YOLOv8などの先行モデルの大成功を基盤に、YOLO26は生産環境対応、エッジデプロイメント、ネイティブなエンドツーエンド効率を最優先に設計されました。
今日YOLO26を試してみよう
コンピュータビジョンパイプラインのアップグレードをお考えですか?Ultralytics を使えば、コードを一切書くことなく、クラウド上でYOLO26モデルのトレーニングとデプロイを簡単に行えます。
アーキテクチャの革新
両モデルとも、ニューラルネットワークが視覚データを処理する方法に画期的な変化をもたらすが、問題へのアプローチ方法は異なる。
YOLOv9におけるプログラマブル勾配情報
YOLOv9主な貢献YOLOv9、プログラマブル勾配情報(PGI) と汎用効率的層集約ネットワーク(GELAN)の導入である。ニューラルネットワークが深くなるにつれ、順伝播過程で情報損失が生じやすい。PGIは逆伝播時の重み更新に用いる勾配の精度と信頼性を保証し、GELANアーキテクチャがより少ないパラメータで高精度を達成することを可能にする。
しかし、YOLOv9 後処理において従来の非最大抑制(NMS)に大きくYOLOv9 、実世界の推論において遅延のボトルネックとなる可能性がある。
YOLO26のエッジファーストアーキテクチャ
YNMS26は、トレーニングからリアルタイム展開までのパイプライン全体を最適化するという根本的に異なるアプローチを採用しています。これは、最初に YOLOv10で初めて導入されたエンドツーエンドNMS フリー設計を基盤とし、NMS 完全に不要にします。これにより驚異的な低遅延を実現し、ラズベリーパイや NVIDIA などのエッジデバイス向けに高度に最適化されています。
さらに、YOLO26はディストリビューション・フォーカル・ロス(DFL)を完全に除去した。この構造的変更により、 ONNXへのモデルエクスポートが簡素化され、低電力マイクロコントローラーとの互換性が大幅に改善される。
トレーニングフェーズにおいて、YOLO26は新規開発のMuSGDオプティマイザーを統合する。これは確率的勾配降下法とミューオン(Moonshot AIのKimi K2が採用するLLMトレーニング手法に着想を得た)を融合したハイブリッド手法である。これにより大規模言語モデル(LLM)トレーニングの革新とコンピュータビジョンとの隔たりを埋めることで、飛躍的に安定したトレーニングと高速な収束時間を提供する。
パフォーマンスとメトリクスの比較
広く利用されているCOCO ベンチマークにおいて、両モデルとも卓越した能力を発揮するが、Ultralytics は実用的な推論速度とパラメータ効率において優れている。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
結果の分析
- 速度と効率性:YOLO26NMSアーキテクチャと簡素化された損失関数を採用しているため、従来のアーキテクチャと比較して最大43%高速CPU を実現します。YOLO26nモデルはNVIDIA GPU 、驚異的な1.7msで動作します。 TensorRTにより1.7msという驚異的な速度で動作し、リアルタイム動画ストリーム処理における究極の選択肢となります。
- 精度:YOLO26xモデルは比類のない57.5mAPを達成し、最大規模のYOLOv9eモデルを上回る性能を発揮しながら、より低いレイテンシを維持しています。
- メモリ要件: Ultralytics 効率性で知られています。YOLO26は、複雑なトランスフォーマーベースのビジョンモデルと比較して、モデルトレーニングおよび推論時に大幅にCUDA 必要とするため、開発者はコンシューマー向けハードウェアでより大きなバッチサイズを利用できます。
エコシステム、使いやすさ、そして汎用性
Ultralytics 真の強みはユーザー体験にあります。YOLOv9のGitHubコードベースを利用する研究者は複雑な環境設定や手動スクリプト操作を必要としますが、YOLO26はUltralytics Python 完全に統合されています。
簡素化されたAPIの例
最先端のYOLO26モデルのトレーニングには、わずか数行のPython 済みます:
from ultralytics import YOLO
# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export natively to ONNX format in a single command
model.export(format="onnx")
比類なきタスクの汎用性
YOLOv9主に標準的な物体検出向けに設計されているのとは異なり、YOLO26は標準状態で多様なコンピュータビジョンタスクをネイティブにサポートする。このアーキテクチャには、様々な用途に向けた特定の強化が組み込まれている:
- インスタンスセグメンテーション:専用のセマンティックセグメンテーション損失関数とマルチスケールプロトタイプを採用し、完璧なピクセルレベルのマスクを実現します。
- 姿勢推定:残差対数尤度推定(RLE)を統合し、track キーポイントを極めて高精度にtrack 。
- オリエンテッド・バウンディング・ボックス(OBB):航空写真における回転物体検出の境界問題を解決するために特別に設計された、専用の角度損失関数を含む。
- 画像分類:ImageNet 基準に基づく画像全体の堅牢な分類。
統合されたエコシステム
すべてのYOLO26モデルは、Ultralytics とのシームレスな統合により、組み込みのデータセットラベリング、アクティブラーニング、即時デプロイメントパイプラインを提供します。
現実世界のアプリケーション
これらのモデルを選択する際には、導入される環境が重要な判断材料となることが多い。
IoTとエッジロボティクス
ロボティクス、自律型ドローン、スマートホームIoTデバイスにおいて、YOLO26は誰もが認める王者である。ProgLossとSTALの統合により、高高度ドローンによる農業監視に不可欠な小物体認識が顕著に向上した。CPU が43%高速化され、NMS設計と相まって、YOLO26は専用GPUなしのハードウェア上でも滑らかに動作する。
学術研究と勾配分析
YOLOv9 学術界において依然として高く評価されているモデルである。勾配流の理論的限界を調査する研究者や、カスタム PyTorch レイヤーを構築しようとする研究者にとって、YOLOv9コードベースは深層学習理論の探求に最適な基盤となるでしょう。
高速製造パイプライン
高速コンベアベルト上の自動欠陥検出といった産業環境において、YOLO26モデルのTensorRT 驚異的なTensorRT により、フレームの損失を完全に防止。品質保証システムのスループットを最大化します。
ユースケースと推奨事項
YOLOv9 具体的なプロジェクト要件、デプロイメントの制約、およびエコシステムの選好によって決まります。
YOLOv9を選択すべき時
YOLOv9 以下のような場合に有力な選択肢YOLOv9 :
- 情報ボトルネック研究:プログラマブル勾配情報(PGI)および汎用効率的層集約ネットワーク(GELAN)アーキテクチャを研究する学術プロジェクト。
- 勾配フロー最適化研究:深層ネットワーク層における学習中の情報損失の理解と軽減に焦点を当てた研究。
- 高精度検出ベンチマーク: YOLOv9強力なCOCO 性能が、アーキテクチャ比較の基準点として必要とされるシナリオ。
YOLO26を選択すべき時
YOLO26は以下に推奨されます:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
結論
両モデルともオープンソースコミュニティにとって驚異的な飛躍を遂げた。YOLOv9 勾配流れに重要な理論的改良YOLOv9 、今後数年にわたりアーキテクチャ開発の指針となるだろう。しかし、速度・精度・導入容易性の完璧なバランスを求める現代の開発者、スタートアップ、企業チームにとって、Ultralytics 明確な推奨選択肢である。
NMS排除し、強力なMuSGDオプティマイザーを導入し、検出・セグメンテーション・姿勢推定タスクにわたり比類のないツール群を提供することで、YOLO26はコンピュータビジョンプロジェクトが、今日利用可能な最も信頼性が高く将来性のあるフレームワーク上で構築されることを保証します。