YOLOv10 . YOLO26：エンドツーエンド物体検出の新時代

リアルタイム物体検出技術の進化は近年急速に進展しており、速度・精度・導入容易性のバランスに重点が置かれている。本比較ではこの進化の道程における二つの重要なマイルストーンを検証する： YOLOv10：NMS検出を普及させた学術的ブレークスルー。YOLO26：Ultralytics 提供する最新の実用化済み高性能Ultralytics これらの概念を企業向けアプリケーション向けに洗練Ultralytics 。

モデル概要

YOLOv10：学術的先駆者

清華大学の研究者により2024年5月に発表YOLOv10 、推論時の非最大抑制（NMS）を不要とすることでパラダイムシフトYOLOv10 。この「エンドツーエンド」アプローチは、シーンの密度によって後処理の遅延が予測不能に変動するといった、導入パイプラインにおける長年のボトルネックを解決した。

著者: Ao Wang, Hui Chen, Lihao Liu, et al.
組織:清華大学
日付: 2024-05-23
arXiv:arXiv:2405.14458
GitHub:THU-MIG/yolov10

YOLOv10について詳しくはこちら

YOLO26：産業標準

YOLO26（2026年1月リリース）は、先行モデルが築いた基盤の上に構築された、実世界での影響をUltralytics。YOLOv10 先駆けたNMS YOLOv10 よりシンプルな損失関数、新規の最適化アルゴリズム、エッジハードウェアでの大幅な速度向上により強化されています。

著者: Glenn Jocher、Jing Qiu
組織:Ultralytics
日付: 2026-01-14
GitHub:ultralytics/ultralytics

YOLO26についてさらに詳しく

技術比較

NMS問題を解決することを目的としているが、最適化へのアプローチは異なる。YOLOv10 アーキテクチャ探索とトレーニングにおける二重割り当てにYOLOv10 、YOLO26はデプロイの簡便性、CPU 、トレーニングの安定性を優先している。

アーキテクチャと設計

YOLOv10NMSトレーニング向けに一貫性のある二重アサインメントを導入した。この手法は、トレーニング時の豊富な教師情報のための1対多ヘッドと、推論のための1対1ヘッドを組み合わせることで、モデルがオブジェクトごとに単一の最適なボックスを出力することを保証する。また、軽量分類ヘッドや空間チャネル分離型ダウンサンプリングを含む、効率性と精度を重視した包括的なモデル設計を採用した。

YOLO26はこれをさらに改良し、分布焦点損失（DFL）を完全に除去した。DFLは初期バージョンではボックス精度向上に寄与したが、その除去によりエクスポートグラフが大幅に簡素化され、YOLO26モデルはリソース制約のあるエッジデバイスや低消費電力マイクロコントローラー上での実行が容易になった。さらに、YOLO26はMuSGDオプティマイザーを採用している。SGD ミューオンオプティマイザー（LLMトレーニングに着想を得た）のハイブリッドであり、コンピュータビジョンタスクに大規模バッチトレーニングの安定性を初めて提供するものである。

パフォーマンス指標

以下の表は性能差を比較したものです。YOLO26はCPU上で優れた速度を発揮し、特に大規模モデルにおいて、全モデル規模で高い精度を示しています。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

CPU のブレークスルー

YOLO26は専用GPUのない環境向けに特別に最適化されています。前世代と比較して最大43%高速CPU を実現し、ラズベリーパイやモバイル展開において画期的な進化をもたらします。

ユースケースと実世界アプリケーション

YOLOv10を選択すべき時

YOLOv10 、研究者や特定の検出のみを目的とするシナリオにおいて、YOLOv10 優れた選択肢YOLOv10 。

学術研究：その二重割り当て戦略は、損失関数設計におけるさらなる研究対象として興味深いテーマである。
レガシーNMSパイプライン：プロジェクトがYOLOv10 ONNX を基盤に構築されている場合、信頼性の高い低遅延検出を継続して提供します。

YOLO26が生産環境における優れた選択肢である理由

ほとんどの開発者にとって、YOLO26はより堅牢で汎用性の高いソリューションを提供する。

エッジコンピューティングとIoT：損失関数の簡素化とDFLの削除により、YOLO26はメモリと演算能力が限られるエッジデバイスへの展開に最適である。
小型物体検出： ProgLossとSTAL（ソフトターゲットアンカー損失）により、YOLO26は小型物体の検出に優れており、これは航空写真やドローン検査において極めて重要な要件である。
複合マルチタスク処理：主に検出モデルであるYOLOv10異なり、YOLO26は同一フレームワーク内でインスタンスセグメンテーション、姿勢推定、および方向付き境界ボックス（OBB）タスクをネイティブにサポートする。

Ultralyticsの利点

Ultralytics を選択することで、単純な指標をはるかに超えたメリットが得られます。統合されたエコシステムにより、データ収集から最終的なデプロイメントまでプロジェクト全体がサポートされます。

合理化されたユーザーエクスペリエンス

Python 提供する使いやすさは他に類を見ません。他のリポジトリでは複雑なセットアップスクリプトが必要になる場合もありますが、Ultralytics 最小限のコードで読み込み、トレーニング、デプロイが可能です。

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

包括的なエコシステムサポート

Ultralytics 完全に統合されており、シームレスなデータセット管理、リモートトレーニング、TensorRT、CoreML、OpenVINO形式へのワンクリックエクスポートが可能です。このよく整備されたエコシステムにより、頻繁なアップデート、活発なコミュニティフォーラム、あらゆる問題のトラブルシューティングに役立つ豊富なドキュメントへのアクセスが保証されます。

トレーニング効率とメモリ

Ultralytics トレーニング効率の高さで知られています。YOLO26がMuSGDオプティマイザを採用したことで、Transformerベースのモデルと比較してメモリ要件を抑えつつ安定したトレーニングが可能となりました。 RT-DETRといったトランスフォーマーベースのモデルと比較して、より少ないメモリ要件で安定したトレーニングを実現します。これにより、VRAM不足に陥ることなくコンシューマー向けGPUで高精度モデルをトレーニング可能となり、ハイエンドAI機能へのアクセスが民主化されます。

結論

両アーキテクチャはコンピュータビジョンにおける重要な成果である。 YOLOv10NMS手法の普及に貢献し、エンドツーエンド検出がリアルタイムアプリケーションで実現可能であることを証明した点で高く評価されるべきである。

しかし、YOLO26はこのコンセプトをさらに洗練させ、2026年の実用的なニーズに対応しています。優れたCPU 、ProgLossによる小型物体への特化サポート、Ultralytics 支援を背景に、YOLO26はスケーラブルで将来性のあるAIソリューションを構築したい開発者に推奨される選択肢です。スマート小売分析、自律ロボット、高速製造のいずれに取り組んでいても、YOLO26は成功に必要な性能バランスを実現します。

その他の検討すべきモデル

YOLO11: YOLO26の強固な前身であり、現在も実運用で広く使用されている。
RT-DETR:GPU 豊富なシナリオ向けに高精度を提供する、トランスフォーマーベースの代替手法。
YOLO: クラスがテキストプロンプトで定義されるオープンボキャブラリ検出タスクに最適です。