Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 と YOLO26 の比較#

リアルタイム物体検出の状況は、ここ数年で劇的に進化しました。機械学習の実務者がさまざまなハードウェアへのモデルデプロイを検討する中で、適切なアーキテクチャの選択は極めて重要です。この包括的な技術ガイドでは、コンピュータビジョンの分野における2つの主要なマイルストーンを比較します。一つは勾配パスの最適化に焦点を当てて2024年初頭に導入されたYOLOv9であり、もう一つはエッジ推論と学習の安定性を完全に再定義した、2026年初頭リリースの最新かつ最先端のフレームワークである**Ultralytics YOLO26**です。

Link to this sectionエグゼクティブサマリー:モデルの系譜と開発者#

これらのディープラーニングモデルの起源を理解することは、アーキテクチャ設計の選択やターゲットユーザーに関する貴重なコンテキストを提供します。

Link to this sectionYOLOv9#

YOLOv9は、台湾の中央研究院情報科学研究所のChien-Yao Wang氏とHong-Yuan Mark Liao氏によって考案され、2024年2月21日にリリースされました。このモデルは、深層畳み込みニューラルネットワーク(CNN)における情報ボトルネック問題の解決に重点を置くなど、ディープラーニングの理論的概念に重きを置いています。

YOLOv9の詳細はこちら

Link to this sectionUltralytics YOLO26#

YOLO26は、UltralyticsのGlenn Jocher氏とJing Qiu氏によって考案され、2026年1月14日にリリースされました。YOLO11YOLOv8といった先行モデルの圧倒的な成功を基盤としており、YOLO26はプロダクション環境での即応性、エッジデプロイ、およびネイティブなエンドツーエンドの効率性を最優先するようにゼロから設計されました。

YOLO26の詳細はこちら

今すぐ YOLO26 を試す

コンピュータビジョンのパイプラインをアップグレードする準備はできていますか?Ultralytics Platformを使用すれば、コードを書かずにクラウド上で簡単に YOLO26 モデルを学習およびデプロイできます。

Link to this sectionアーキテクチャの革新#

両モデルとも、ニューラルネットワークが視覚データを処理する方法に画期的な変化をもたらしていますが、そのアプローチには違いがあります。

Link to this sectionYOLOv9におけるプログラマブル勾配情報#

YOLOv9の分野への主な貢献は、**プログラマブル勾配情報(PGI)汎用効率的レイヤー集約ネットワーク(GELAN)**の導入です。ニューラルネットワークは深くなるにつれて、フィードフォワードの過程で情報損失が発生しやすくなります。PGIは、バックプロパゲーション中に重みを更新するための勾配を正確かつ確実に維持し、GELANアーキテクチャがより少ないパラメータで高い精度を達成できるようにします。

しかし、YOLOv9は後処理に従来の非最大抑制(NMS)を大きく依存しており、これが実環境での推論時にレイテンシのボトルネックとなる可能性があります。

Link to this sectionYOLO26 のエッジファーストアーキテクチャ#

YOLO26は、学習からリアルタイムデプロイに至るパイプライン全体を最適化することで、根本的に異なるアプローチをとっています。YOLOv10で最初に開拓されたエンドツーエンドのNMSフリー設計を基盤としており、NMSの後処理を完全に不要にしました。これにより極めて低いレイテンシを実現し、Raspberry PiNVIDIA Jetsonのようなエッジデバイスに最適化されています。

さらに、YOLO26はDistribution Focal Loss(DFL)を完全に削除しました。この構造変更により、ONNXへのエクスポートが簡素化され、低電力マイクロコントローラーとの互換性が大幅に向上しました。

学習フェーズにおいて、YOLO26は新しいMuSGDオプティマイザを統合しています。これは確率的勾配降下法(SGD)とMuon(Moonshot AIのKimi K2のLLM学習手法に着想を得た)を組み合わせたハイブリッド手法です。これにより、大規模言語モデル(LLM)の学習イノベーションとコンピュータビジョンのギャップを埋め、学習の安定性と収束時間の短縮を劇的に実現します。

Link to this sectionパフォーマンスと指標の比較#

広く使用されているCOCOデータセットでのベンチマークテストにおいて、両モデルとも卓越した性能を発揮しますが、実用的な推論速度とパラメータ効率の面ではUltralyticsエコシステムが際立っています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Link to this section結果の分析#

  • 速度と効率: YOLO26はNMSフリーのアーキテクチャと簡素化された損失関数を採用しているため、レガシーなアーキテクチャと比較してCPU推論速度が最大43%高速化されています。YOLO26nモデルは、TensorRTを使用したNVIDIA T4 GPU上で1.7msという圧倒的な速度で動作し、リアルタイムビデオストリームにとって究極の選択肢となります。
  • 精度: YOLO26xモデルは、最大のYOLOv9eモデルを上回りつつ、より低いレイテンシを維持しながら、比類のない 57.5 mAP を達成しています。
  • Memory Requirements: Ultralytics models are known for their efficiency. YOLO26 requires significantly less CUDA memory during model training and inference compared to complex transformer-based vision models, allowing developers to utilize larger batch sizes on consumer-grade hardware.

Link to this sectionエコシステム、使いやすさ、汎用性#

Ultralyticsエコシステムの真の強みは、ユーザーエクスペリエンスにあります。YOLOv9のGitHubコードベースを利用する研究者は複雑な環境構築と手動のスクリプト作成が必要ですが、YOLO26は直感的な Ultralytics Python API に完全に統合されています。

Link to this section合理化された API の例#

最先端の YOLO26 モデルの学習は、わずか数行のPythonコードで実行可能です。

from ultralytics import YOLO

# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export natively to ONNX format in a single command
model.export(format="onnx")

Link to this section比類のないタスク汎用性#

主に標準的な物体検出向けに調整されたYOLOv9とは異なり、YOLO26は幅広いコンピュータビジョンタスクをネイティブでサポートしています。アーキテクチャには、多様なアプリケーション向けの特定の拡張機能が含まれています。

  • インスタンスセグメンテーション: 完璧なピクセルレベルのマスクを生成するための、特殊なセマンティックセグメンテーション損失とマルチスケールプロト機能を備えています。
  • 姿勢推定: 骨格のキーポイントを極めて高い精度で追跡するための残差対数尤度推定(RLE)が統合されています。
  • 指向性境界ボックス (OBB): 航空写真における回転した物体検出の境界問題を解決するために特別に設計された、角度損失関数が含まれています。
  • 画像分類: ImageNet 基準に基づいた、画像全体の堅牢なカテゴリ分類を行います。
統合エコシステム

すべての YOLO26 モデルは Ultralytics Platform とシームレスに統合されており、データセットのラベル付け、アクティブラーニング、即時のデプロイパイプラインを提供します。

Link to this section実際のアプリケーション#

これらのモデルの選択は、多くの場合、それらがデプロイされる環境によって決まります。

Link to this sectionIoT およびエッジロボティクス#

ロボット工学、自律ドローン、スマートホームIoTデバイスにおいて、YOLO26は揺るぎないチャンピオンです。ProgLoss + STALの統合により、高高度ドローンからの農業モニタリングにおいて不可欠な、小物体認識の顕著な改善がもたらされました。さらに、43%高速なCPU推論とNMSフリー設計により、専用のGPUがないハードウェアでもスムーズに動作します。

Link to this section学術研究および勾配分析#

YOLOv9 は、学術界で高く評価されているモデルであり続けます。勾配フローの理論的限界を探求している研究者や、PGIの概念に基づいてPyTorchのカスタムレイヤーを構築したいと考えているユーザーにとって、YOLOv9のコードベースはディープラーニング理論を探索するための優れた基盤となります。

Link to this section高速製造パイプライン#

高速コンベアベルト上での自動欠陥検出などの産業現場において、YOLO26モデルの圧倒的なTensorRT速度は、フレーム落ちを防ぎ、品質保証システムの処理能力を最大化します。

Link to this sectionユースケースと推奨事項#

YOLOv9とYOLO26のどちらを選ぶかは、特定のプロジェクト要件、デプロイの制約、およびエコシステムの好みに依存します。

Link to this sectionYOLOv9を選択すべき場合#

YOLOv9は以下の場合に強力な選択肢となります:

  • 情報ボトルネック研究: Programmable Gradient Information (PGI)およびGeneralized Efficient Layer Aggregation Network (GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化の研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に重点を置いた研究。
  • 高精度検出ベンチマーク: アーキテクチャ比較の基準点として、YOLOv9の強力なCOCOベンチマークパフォーマンスが必要とされるシナリオ。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は以下のような場合に推奨されます。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section結論#

両モデルとも、オープンソースコミュニティにとって信じられないほどの飛躍を意味しています。YOLOv9は勾配フローに関する重要な理論的改善をもたらし、今後のアーキテクチャのインスピレーションとなるでしょう。しかし、速度、精度、デプロイの容易さの完璧なバランスを求める現代の開発者、スタートアップ、企業チームにとっては、Ultralytics YOLO26 が明確な推奨事項となります。

NMSを排除し、強力なMuSGDオプティマイザを導入し、検出、セグメンテーション、姿勢推定にわたる比類のないツールスイートを提供することで、YOLO26はコンピュータビジョンプロジェクトが今日利用可能な最も信頼性が高く、将来を見据えたフレームワーク上で構築されることを保証します。

コメント