Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOv10#

コンピュータービジョンの分野は、より高速で正確、かつ効率的なモデルへの需要に牽引され、絶えず進化しています。本ガイドでは、リアルタイム物体検出の分野における2つの画期的なアーキテクチャ、YOLO26YOLOv10を技術的な観点から包括的に比較します。両者のアーキテクチャ、パフォーマンス指標、展開能力を分析することで、開発者や研究者が自身のビジョンアプリケーションに最適なモデルを選択できるよう支援します。

Link to this sectionNMSフリーアーキテクチャの進化#

長年、YOLO (You Only Look Once) ファミリーは、ポストプロセッシング(後処理)中に冗長なバウンディングボックスを除去するために、Non-Maximum Suppression (NMS) に大きく依存してきました。NMSは効果的ですが、推論レイテンシを発生させ、Raspberry Piや特殊なニューラルプロセッシングユニット(NPU)といったエッジデバイスへの展開を複雑にする要因となっていました。

YOLOv10の登場は、エンドツーエンドのNMSフリー設計を先駆的に導入し、パラダイムシフトをもたらしました。この根本的なブレークスルーの上に構築されたUltralytics YOLO26は、本番環境向けにアーキテクチャを洗練させ、より幅広いタスクにおいて前例のない効率性と使いやすさを実現しています。

ポストプロセッシングのボトルネック

NMSを排除することで、従来TensorRTOpenVINOといったハードウェアアクセラレータ上でのコンピュータービジョンモデルの最適化を阻害していた、動的でデータ依存のポストプロセッシング手順を排除できます。

Link to this sectionYOLOv10:NMSフリー検出の先駆者#

日付: 2024-05-23 著者: Ao Wang, Hui Chen, Lihao Liu, 他 組織: Tsinghua University リソース: ArXiv Paper | GitHub Repository

Tsinghua Universityの研究者によって開発されたYOLOv10は、一貫したデュアルアサイン戦略を導入し、NMSの必要性を排除しました。効率性と精度のバランスを重視した全体的なモデル設計を採用することで、高いmAP (mean Average Precision)を維持しながら、計算の冗長性を削減しました。

強み:

  • NMSフリーアーキテクチャ: YOLOシリーズにおけるNMSフリー設計のパイオニアであり、リアルタイムアプリケーションのレイテンシを大幅に削減します。
  • 効率性: 従来世代のモデルと比較して、パラメータ数と推論速度の優れたトレードオフを提供します。

弱み:

  • 限定的なタスクサポート: 主に標準的な物体検出に重点を置いており、セグメンテーションや姿勢推定といった高度なタスクに対する標準的なサポートが欠けています。
  • 学術的焦点: コードベースは堅牢ですが、合理化されたエンタープライズグレードの本番展開よりも、研究用途に近いものとなっています。

YOLOv10について詳しく知る

Link to this sectionYOLO26: エッジとクラウドの新たな標準#

日付: 2026-01-14 著者: Glenn Jocher, Jing Qiu 組織: Ultralytics リソース: GitHub Repository | Ultralytics Platform

YOLO11の後継としてリリースされたYOLO26は、NMSフリーのコンセプトを究極の形に昇華させました。エンドツーエンドの検出機能を高度に最適化されたUltralytics Platformにネイティブ統合し、現代の機械学習パイプラインに必要な一連のツールを完全に提供します。

YOLO26はいくつかのアーキテクチャ上の飛躍的進歩を導入しています。

  • DFLの除去: Distribution Focal Lossが完全に除去されました。これによりモデルのエクスポートプロセスが大幅に簡素化され、エッジデバイスや低電力デバイスとの互換性が向上します。
  • 最大43%高速なCPU推論: DFLの除去と構造的な最適化により、YOLO26はCPU上で大幅に高速化されており、IoTやモバイルデバイスへの展開に最適です。
  • MuSGDオプティマイザ: 大規模言語モデル(LLM)の学習テクニック(Moonshot AIのKimi K2など)に着想を得たYOLO26は、SGDとMuonのハイブリッドを採用しています。これにより、コンピュータービジョンにおいて比類のない学習の安定性と高速な収束を実現します。
  • ProgLoss + STAL: これらの高度な損失関数は、航空画像やドローンによるセキュリティ監視において重要な、小物体認識の顕著な向上をもたらします。
  • タスク固有の改善: YOLO26は単なる検出器ではありません。セマンティックセグメンテーションのための損失関数とマルチスケールprotoを用いたセグメンテーション姿勢推定のためのResidual Log-Likelihood Estimation (RLE)、そして指向性バウンディングボックス (OBB)のための特殊な角度損失関数を備えています。

YOLO26の詳細はこちら

Link to this sectionパフォーマンス分析と指標#

以下の表は、YOLO26モデルとYOLOv10モデルのCOCO検出パフォーマンスを比較したものです。YOLO26がいかにして、卓越したパラメータ効率を維持しながら優れた精度を達成しているかに注目してください。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionUltralyticsの利点:学習とメモリの効率性#

モデルを本番環境に展開する際、メモリ要件と学習効率は推論速度と同じくらい重要です。YOLO26をはじめとするUltralyticsモデルは、学習中のCUDAメモリ使用量を削減するように高度に最適化されています。これにより、開発者はコンシューマグレードのGPUでも大きなバッチサイズを使用でき、学習時間と計算コストを大幅に削減できます。逆に、複雑なアーキテクチャや大規模なTransformerモデルであるRT-DETRなどは、効率的に学習するために高価なハイエンドハードウェアを必要とすることがよくあります。

継続的インテグレーションとエコシステム

YOLO26を選択する最大のメリットの1つは、十分にメンテナンスされたUltralyticsエコシステムとの統合にあります。データアノテーションから実験トラッキングまで、プラットフォームは機械学習エンジニアが必要とするすべてを単一の統合された屋根の下で提供します。

Link to this section実践的な実装:コード例#

Ultralyticsの最大の特徴は、業界をリードする「使いやすさ」です。直感的なPython APIにより、YOLOv8のようなレガシーモデルから最先端のYOLO26への移行は、わずか1行のコードを書き換えるだけで完了します。

以下は、YOLO26を使用して学習と推論を行うための100%実行可能な例です。

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Link to this sectionユースケースと推奨事項#

YOLO26とYOLOv10のどちらを選択するかは、特定のプロジェクト要件、展開制約、およびエコシステムの好みによって異なります。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は以下の場合に強力な選択肢となります:

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionYOLOv10を選択すべき場合#

YOLOv10は以下の場合に推奨されます。

  • NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
  • バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
  • 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。

Link to this section結論#

YOLOv10はNMSフリーパラダイムを導入することで学術コミュニティに多大な貢献をしましたが、YOLO26はこの技術をエンタープライズグレードの即戦力レベルへと引き上げました。CPU速度の43%向上、革新的なMuSGDオプティマイザ、そして多様なビジョンタスクへの比類なき汎用性を備えたYOLO26は、エッジコンピューティングから大規模クラウド展開まで、究極の選択肢として際立っています。

活発なコミュニティ、包括的なドキュメント、そして摩擦のない開発者体験を優先するチームにとって、Ultralyticsエコシステムに並ぶものはありません。特殊なシナリオ向けのモデルを検討している場合は、ゼロショットのオープンボキャブラリー検出であるYOLO-Worldを調査するのも良いでしょう。しかし、大多数の実世界のユースケースにおいて、YOLO26が決定的な推奨モデルとなります。

コントリビューター

コメント