Ultralytics YOLO26

概要

Ultralytics YOLO26は、リアルタイム物体検出器であるYOLOシリーズの最新の進化形であり、エッジデバイスや低消費電力デバイス向けにゼロから設計されています。不要な複雑さを取り除いた合理的な設計を採用し、ターゲットを絞ったイノベーションを統合することで、より高速で軽量、かつ導入が容易なモデルを実現しています。

Ultralytics YOLO26 Comparison Plots

Ultralytics Platformで試す

YOLO26モデルをUltralytics Platform上で直接体験し、実行することができます。

YOLO26のアーキテクチャは、3つの主要な原則に基づいています。

  • シンプルさ: YOLO26はネイティブなエンドツーエンドモデルであり、非最大値抑制(NMS)を必要とせずに直接予測を出力します。この後処理ステップを排除することで、推論はより高速かつ軽量になり、実環境システムへの導入が容易になります。この画期的なアプローチは、清華大学のAo Wang氏によるYOLOv10で初めて先駆的に取り入れられ、YOLO26でさらに進化しました。
  • 導入の効率性: エンドツーエンド設計により、パイプラインのステージ全体が不要となり、統合の劇的な簡素化、レイテンシの低減、そして多様な環境下での導入の堅牢性が向上します。
  • 学習のイノベーション: YOLO26では、SGDMuonを組み合わせたハイブリッドオプティマイザであるMuSGDを導入しています。これは、Moonshot AIのKimi K2がLLMトレーニングで行った画期的な成果に触発されたものです。このオプティマイザは、言語モデルの最適化技術をコンピュータビジョンに応用することで、より高い安定性と高速な収束を実現します。
  • タスク固有の最適化: YOLO26は、特定のタスクに対するターゲットを絞った改善を導入しています。これには、セグメンテーションのためのセマンティックセグメンテーション損失とマルチスケールプロトモジュール、高精度な姿勢推定のための残差対数尤度推定(RLE)、およびOBBにおける境界問題に対処するための角度損失を用いた最適化デコーディングが含まれます。

これらのイノベーションを組み合わせることで、小さな物体に対する高精度化、シームレスな導入、そしてCPU上で最大43%の高速化を実現するモデルファミリーが誕生しました。これにより、YOLO26は、リソースが制限された環境にとって、現在最も実用的で導入しやすいYOLOモデルの一つとなっています。

主な機能

  • DFLの削除 Distribution Focal Loss (DFL)モジュールは効果的ですが、エクスポートを複雑にし、ハードウェアの互換性を制限することがよくありました。YOLO26はDFLを完全に取り除くことで、推論を簡素化し、エッジデバイスや低消費電力デバイスへの対応範囲を広げました。

  • エンドツーエンドのNMSフリー推論 NMSを別個の後処理ステップとして使用する従来の検出器とは異なり、YOLO26はネイティブなエンドツーエンドです。予測が直接生成されるため、レイテンシが低減され、実運用システムへの統合がより高速、軽量、かつ信頼性の高いものになります。

  • ProgLoss + STAL 改良された損失関数により検出精度が向上しました。特に、IoT、ロボット工学、航空写真などのエッジアプリケーションで不可欠な小さな物体の認識において顕著な改善が見られます。

  • MuSGDオプティマイザ SGDMuonを組み合わせた新しいハイブリッドオプティマイザです。Moonshot AIのKimi K2に触発され、MuSGDはLLMトレーニングの先進的な最適化手法をコンピュータビジョンに導入し、より安定した学習と迅速な収束を可能にします。

  • 最大43%の高速CPU推論 エッジコンピューティングに特化して最適化されており、YOLO26はCPUでの推論を大幅に高速化し、GPUを搭載していないデバイスでもリアルタイムのパフォーマンスを保証します。

  • インスタンスセグメンテーションの強化 モデルの収束を改善するためのセマンティックセグメンテーション損失と、より優れたマスク品質を実現するためにマルチスケール情報を活用するアップグレードされたプロトモジュールを導入しました。

  • 高精度な姿勢推定 残差対数尤度推定 (RLE) を統合してキーポイント位置特定をより正確にし、推論速度向上のためにデコーディングプロセスを最適化しています。

  • OBBデコーディングの洗練 四角い物体の検出精度を向上させるための専用の角度損失を導入し、境界の不連続性の問題を解決するためにOBBデコーディングを最適化しました。

Ultralytics YOLO26 End-to-End Comparison Plots


サポートされているタスクとモード

YOLO26は、これまでのUltralytics YOLOリリースによって確立された多彩なモデル範囲を基盤としており、さまざまなコンピュータビジョンのタスクで強化されたサポートを提供します。

モデルファイル名タスク推論検証学習Export(エクスポート)
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt検出
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptインスタンスセグメンテーション
YOLO26-semyolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.ptセマンティックセグメンテーション
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt姿勢/キーポイント
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt指向性検出
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt分類

この統合されたフレームワークにより、YOLO26はリアルタイム検出、インスタンスセグメンテーション、セマンティックセグメンテーション、分類、姿勢推定、および指向性物体検出のすべてにおいて、学習、検証、推論、およびエクスポートのサポートとともに適用可能です。

アーキテクチャのみのバリエーション

yolo26-p2.yamlyolo26-p6.yamlは、P2(小物体)またはP6(大入力)検出ヘッドを追加したもので、YAMLアーキテクチャとしてのみ提供されます。スケール固有のyolo26*-p2.ptyolo26*-p6.ptウェイトはリリースされていません。YAMLからスケール設定をインスタンス化し(例: YOLO("yolo26n-p6.yaml"))、必要に応じて学習や微調整を行ってください。


パフォーマンス指標

パフォーマンス

See Detection Docs for usage examples with these models trained on COCO, which include 80 pretrained classes.

モデルサイズ
(ピクセル)
mAPval
50-95
mAPval
50-95(e2e)
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

ParamsおよびFLOPsの値は、model.fuse()後の融合済みモデルに対するものです。これはConv層とBatchNorm層を結合し、補助的な1対多の検出ヘッドを削除します。事前学習済みのチェックポイントは完全な学習アーキテクチャを保持しており、より高い数値を表示する場合があります。


使用例

このセクションでは、基本的なYOLO26の学習と推論の例を提供します。これらのモードやその他のモードに関する完全なドキュメントについては、予測学習検証、およびエクスポートのドキュメントページを参照してください。

Note that the example below is for YOLO26 Detect models for object detection. For additional supported tasks, see the Segment, Semantic Segmentation, Classify, OBB, and Pose docs.

PyTorchの事前学習済み*.ptモデル、および設定用の*.yamlファイルをYOLO()クラスに渡すことで、Pythonでモデルインスタンスを作成できます。

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
デュアルヘッドアーキテクチャ

YOLO26は、異なるデプロイ環境に柔軟に対応できるデュアルヘッドアーキテクチャを採用しています。

  • 1対1ヘッド(デフォルト): NMSなしでエンドツーエンドの予測を行い、画像あたり最大300個の検出結果を出力する(N, 300, 6)形式の出力を生成します。このヘッドは、高速な推論と簡素化されたデプロイに最適化されています。
  • 1対多ヘッド: NMSの後処理を必要とする従来のYOLO出力を生成し、(N, nc + 4, 8400)形式(ncはクラス数)を出力します。このヘッドは通常、追加の処理コストと引き換えに、わずかに高い精度を実現します。

エクスポート、予測、または検証の実行時にヘッドを切り替えることができます。

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

どちらを選択するかはデプロイ要件によって異なります。最大限の速度とシンプルさを求める場合は1対1ヘッドを、精度を最優先する場合は1対多ヘッドを使用してください。

YOLOE-26: オープンボキャブラリー・インスタンスセグメンテーション

YOLOE-26は、高性能なYOLO26アーキテクチャとYOLOEシリーズのオープンボキャブラリー機能を統合したものです。テキストプロンプト視覚プロンプト、またはゼロショット推論のためのプロンプトフリーモードを使用して、あらゆるオブジェクトクラスのリアルタイム検出とセグメンテーションを可能にし、固定カテゴリ学習の制約を効果的に取り除きます。

YOLO26のNMS不要のエンドツーエンド設計を活用することで、YOLOE-26は高速なオープンワールド推論を実現します。これにより、対象オブジェクトが広範かつ進化し続けるような動的環境におけるエッジアプリケーションのための強力なソリューションとなります。

パフォーマンス

See YOLOE Docs for usage examples with these models trained on Objects365v1, GQA and Flickr30k datasets.

モデルサイズ
(ピクセル)
プロンプトタイプmAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfパラメータ
(M)
FLOPs
(B)
YOLOE-26n-seg640テキスト/ビジュアル23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640テキスト/ビジュアル29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640テキスト/ビジュアル35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640テキスト/ビジュアル36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640テキスト/ビジュアル39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

使用例

YOLOE-26は、テキストベースおよびビジュアルベースのプロンプトをサポートしています。プロンプトの使用は簡単で、以下に示すように predict メソッドに渡すだけです:

テキストプロンプトを使用すると、テキストによる説明を通じて検出したいクラスを指定できます。以下のコードは、YOLOE-26を使用して画像内の人とバスを検出する方法を示しています:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

プロンプト技術、ゼロからのトレーニング、および完全な使用例の詳細については、YOLOEドキュメント をご覧ください。

引用と謝辞

Ultralytics YOLO26の出版物

Ultralyticsは、モデルの進化が非常に速いため、YOLO26に関する正式な研究論文を公開していません。その代わりに、最先端のモデルを提供し、使いやすくすることに重点を置いています。YOLOの機能、アーキテクチャ、および使用方法に関する最新のアップデートについては、当社の GitHubリポジトリ および ドキュメント をご覧ください。

作業でYOLO26またはその他のUltralyticsソフトウェアを使用する場合は、以下のように引用してください:

引用
@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOIは申請中です。YOLO26は AGPL-3.0 ライセンスおよび Enterprise ライセンスの下で利用可能です。


FAQ

YOLO26におけるYOLO11と比較した主な改善点は何ですか?

  • DFLの削除: エクスポートを簡素化し、エッジデバイスとの互換性を拡大
  • エンドツーエンドのNMSフリー推論: NMSを排除し、より高速でシンプルなデプロイを実現
  • ProgLoss + STAL: 特に小さなオブジェクトに対する精度を向上
  • MuSGDオプティマイザー: SGDとMuon(MoonshotのKimi K2に触発)を組み合わせ、より安定した効率的なトレーニングを実現
  • CPU推論が最大43%高速化: CPUのみのデバイスで大幅なパフォーマンス向上

YOLO26はどのようなタスクをサポートしていますか?

YOLO26は統合モデルファミリーであり、複数のコンピュータビジョンタスクに対してエンドツーエンドのサポートを提供します:

各サイズバリアント(n, s, m, l, x)はすべてのタスクをサポートしており、YOLOE-26 を介したオープンボキャブラリーバージョンも利用可能です。

なぜYOLO26はエッジデプロイメント用に最適化されているのですか?

YOLO26は以下により最先端のエッジパフォーマンスを実現します:

  • CPU推論が最大43%高速化
  • モデルサイズとメモリフットプリントを削減
  • 互換性のために簡素化されたアーキテクチャ(DFLおよびNMSは不使用)
  • TensorRT、ONNX、CoreML、TFLite、OpenVINOを含む柔軟なエクスポート形式

YOLO26を始めるにはどうすればよいですか?

YOLO26モデルは2026年1月14日にリリースされ、ダウンロード可能です。ultralyticsパッケージをインストールまたは更新し、モデルをロードしてください:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

トレーニング、検証、エクスポートの手順については、Usage Examplesセクションを参照してください。

コメント