Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10とYOLO26の比較#

コンピュータビジョンの分野は近年、複雑で後処理に依存したアーキテクチャから、合理化されたエンドツーエンドのモデルへと劇的な進化を遂げてきました。この技術比較では、この進化における2つの重要なマイルストーン、つまり学術的なブレークスルーであるYOLOv10と、最先端で企業利用に対応したYOLO26に焦点を当てます。アーキテクチャ、学習手法、そして実環境でのデプロイ能力を検証することで、開発者が次世代のAIビジョンアプリケーションを構築する際に、十分な情報に基づいた意思決定を行えるよう支援します。

Link to this sectionYOLOv10:エンドツーエンドの物体検出の先駆者#

著者: Ao Wang, Hui Chen, Lihao Liu 他 所属: Tsinghua University 日付: 2024-05-23 リンク: arXiv Paper | GitHub Repository

2024年中盤にリリースされたYOLOv10は、リアルタイム物体検出における最も永続的なボトルネックの1つである非最大値抑制(NMS)に対処することで、学術的なコンピュータビジョン研究において大きな飛躍を遂げました。従来の物体検出器は、冗長なバウンディングボックスを排除するためにNMSに大きく依存しており、推論時のレイテンシが変動し、エッジへのデプロイを複雑にしていました。

清華大学のチームは、NMSフリーの学習に向けた一貫性のある二重割り当て戦略を導入しました。これにより、モデルは後処理のフィルタリングステップを必要とせずにバウンディングボックスを正確に予測できるようになり、推論レイテンシを直接的に改善し、ハードウェアアクセラレータ上でのデプロイの障壁を下げました。標準的な検出タスクにおいて非常に効率的である一方、このモデルは主にバウンディングボックスの予測に焦点を当てており、インスタンスセグメンテーションや姿勢推定のようなより複雑なタスクに対するネイティブなサポートは欠けていました。

YOLOv10について詳しく知る

Link to this sectionYOLO26:エッジおよびクラウドビジョンAIの新たな標準#

著者: Glenn Jocher, Jing Qiu 所属: Ultralytics 日付: 2026-01-14 リンク: GitHub Repository | Ultralytics Platform

先に開拓されたNMSフリーのコンセプトを基盤として、新たにリリースされたYOLO26は、パフォーマンスと汎用性の頂点を極めたモデルです。学術研究と企業レベルのデプロイメントの両方を目的に設計されており、エンドツーエンドのNMSフリー設計をネイティブに組み込むことで、すべての対応ハードウェアにおいてNMSの後処理を完全に排除し、より高速かつ簡潔なデプロイを実現します。

YOLO26はいくつかの画期的なアーキテクチャの改善を導入しています。Distribution Focal Loss (DFL) の削除は、モデルのエクスポートプロセスを大幅に簡素化し、低電力のエッジデバイスとの互換性を向上させます。これらの構造的な変更と相まって、YOLO26は最大43%のCPU推論の高速化を達成しており、GPUアクセラレーションが利用できない環境におけるIoTやロボティクスアプリケーションにおいて、極めて優れた選択肢となります。

さらに、LLMの学習技術に着想を得たSGDとMuonのハイブリッドであるMuSGD Optimizerの使用により、学習の安定性と収束速度が刷新されました。ProgLoss + STALのような高度な損失関数を組み合わせることで、YOLO26は小物体認識において顕著な改善を誇ります。また、セグメンテーションのためのマルチスケールプロトタイピング、姿勢推定のためのResidual Log-Likelihood Estimation (RLE)、Oriented Bounding Box (OBB) 検出における境界問題を解決するための専門的な角度損失など、タスク固有の強化も導入されています。

YOLO26の詳細はこちら

企業レベルのデプロイ

コンピュータビジョンのワークフローを拡張しようとするチームのために、Ultralytics PlatformはYOLO26とのシームレスな統合を提供し、直感的なデータアノテーション、自動化されたクラウド学習、そして広範なMLOpsインフラを必要としないワンクリックでのデプロイオプションを提供します。

Link to this section技術パフォーマンスの比較#

これらのモデルを評価する際、精度、モデルサイズ、および推論速度のバランスは極めて重要です。以下の表は、標準的なCOCO datasetで評価された、両モデルファミリーの様々なスケールにおけるパフォーマンスを強調しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

データは、新しいアーキテクチャの進化的な利点を明確に示しています。YOLO26は、非常に競争力のある推論速度を維持しながら、すべてのサイズ階層においてより高いmAP (mean Average Precision)を達成しています。YOLO26におけるDFLの削除は、特にCPUでのONNXパフォーマンスに寄与しており、これは以前の世代が苦戦していた指標です。

Link to this sectionトレーニング方法論とエコシステム#

モデルはそれを支えるエコシステムがあってこそ有用です。YOLOv10はPyTorchに基づいた優れた学術的な実装を提供していましたが、基本的な検出を超えるタスクには、多くの場合手動の設定が必要でした。

対照的に、YOLO26は十分にメンテナンスされたUltralyticsエコシステムに完全に統合されています。これにより、RT-DETRのようなTransformerベースのモデルと比較して、学習中のメモリ要件が大幅に低減され、研究者はコンシューマーグレードのハードウェア上で最先端のネットワークを学習させることが可能になります。その使い勝手は比類のないものであり、データ拡張、ハイパーパラメータのチューニング、およびロギングを自動的に処理する統合APIを提供しています。

Link to this sectionコード例: YOLO26の学習#

汎用性が高く正確なモデルを学習するには、数行のPythonコードだけで十分です:

from ultralytics import YOLO

# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with automatic memory management
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
)

# Export natively to TensorRT without NMS complexities
model.export(format="engine")

Link to this section実世界のアプリケーションとユースケース#

適切なアーキテクチャを選択することは、デプロイメントの制約に完全に依存します。

Link to this section高速エッジコンピューティング#

マイクロコントローラ、ロボティクス、またはレガシーなモバイルデバイスへの迅速なデプロイを必要とするアプリケーションにとって、YOLO26の43%高速なCPU推論は決定的な選択肢となります。そのNMSフリーかつDFLフリーのアーキテクチャは、スマートシティインフラにおけるリアルタイム動画解析に理想的なOpenVINOTensorRTのようなフォーマットにシームレスに変換されます。

Link to this section高度なマルチタスクビジョン#

YOLOv10は純粋なバウンディングボックス検出に優れていますが、リッチな視覚的理解を必要とするプロジェクトではYOLO26に頼る必要があります。医療用画像処理におけるインスタンスセグメンテーションから、スポーツ分析のための精密な姿勢推定に至るまで、YOLO26は多様なドメインにおいて優れた精度を保証するタスク固有の損失関数を提供します。

代替の選択肢

プロジェクトで堅牢なオープンボキャブラリー検出が必要な場合は、YOLO-Worldの調査を検討してください。レガシーなパイプラインを維持しているユーザー向けには、YOLO11が、Ultralyticsフレームワーク内で完全にサポートされた強力な代替手段として残されています。

Link to this sectionユースケースと推奨事項#

YOLOv10とYOLO26のどちらを選ぶかは、特定のプロジェクトの要件、デプロイメントの制約、そしてエコシステムの好みによって異なります。

Link to this sectionYOLOv10を選択すべき場合#

YOLOv10は以下の用途に最適です。

  • NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
  • バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
  • 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は以下のような場合に推奨されます。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section結論#

YOLOv10からYOLO26への移行は、学術的な概念実証から製品化可能な企業向けソリューションへの決定的なシフトを浮き彫りにしています。先駆的なNMSフリー設計を採用し、MuSGDオプティマイザ、ProgLoss、合理化されたエッジ互換性で強化することで、YOLO26はリアルタイムコンピュータビジョンで何が可能かという新たなベンチマークを打ち立てます。速度、精度、使いやすさの最良のバランスを達成しようとする開発者にとって、YOLO26は究極の推奨モデルとして際立っています。

コメント