Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11対YOLO26#

コンピュータビジョンの急速な進化は、速度、精度、展開効率の限界を絶えず押し広げています。リアルタイム物体検出の分野において、Ultralyticsは一貫して標準を確立してきました。本技術比較では、高い成功を収めたYOLO11から最先端のYOLO26への移行を探り、そのアーキテクチャ、パフォーマンス指標、および理想的な展開シナリオを分析します。

ドローン配送システムの構築であれ、グローバルなスマートマニュファクチャリングパイプラインの最適化であれ、これら2つのモデルの微妙な違いを理解することで、堅牢で将来にわたって通用するAIソリューションを構築できるようになります。

Link to this sectionモデルの系譜とエコシステム#

両モデルとも、使いやすいAPI、継続的なメンテナンス、そして活気あるコミュニティを特徴とする包括的なUltralyticsエコシステムの恩恵を受けています。これらは比類のない汎用性を提供し、物体検出インスタンスセグメンテーション画像分類姿勢推定、および指向性バウンディングボックス(OBB)タスクをすぐにサポートします。

Link to this sectionYOLO11: 確立された標準#

2024年後半にリリースされたYOLO11は、初期世代の進歩を洗練させ、本番環境における信頼できる主力製品としての地位を確固たるものにしました。

YOLO11の詳細はこちら

Link to this sectionYOLO26: 新たなフロンティア#

2026年初頭に導入されたYOLO26は、エッジコンピューティングとエンドツーエンドアーキテクチャのパラダイムシフトを体現しており、処理速度と統合の容易さにおいて大幅な改善をもたらします。

YOLO26の詳細はこちら

データとデプロイメントの管理

YOLO11とYOLO26はどちらもUltralyticsプラットフォームと完全に統合されており、データセットのアノテーション、クラウドトレーニング、フリート監視のためのシームレスなノーコードワークフローを提供します。

Link to this sectionアーキテクチャの革新#

YOLO11は長年コンピュータビジョンを支えてきた従来の後処理手法に依存していますが、YOLO26はボトルネックを解消するために設計されたいくつかの構造的なブレークスルーを導入しています。

Link to this sectionエンドツーエンドの NMS 不要設計#

YOLO26における最も重要なアップグレードの1つは、ネイティブなエンドツーエンドアーキテクチャです。これは、YOLOv10で初めて開拓された概念であるNMS(非最大値抑制)後処理を排除します。NMSを回避することで、デプロイメントパイプラインが大幅に簡素化され、自律走行アルゴリズムのようなリアルタイムアプリケーションに不可欠な一貫したレイテンシが保証されます。

Link to this sectionエッジ最適化のためのDFL削除#

YOLO26はDFL(Distribution Focal Loss)を削除します。DFLはYOLO11では微細なローカリゼーションに有用でしたが、削除することでネットワークのエクスポートグラフが簡素化されます。この変更により、低電力ハードウェアとの互換性が向上し、YOLO26はRaspberry PiNVIDIA Jetsonなどのエッジデバイスにおいて絶対的なパワーハウスとなります。

Link to this sectionMuSGDオプティマイザー#

大規模言語モデル(LLM)の学習メカニズム、具体的にはMoonshot AIのKimi K2から着想を得たYOLO26は、革新的なMuSGDオプティマイザを活用しています。確率的勾配降下法(SGD)とMuonを組み合わせたこのハイブリッド手法により、古いアーキテクチャで使用されていた標準的なAdamWオプティマイザよりもはるかに高速に収束する、非常に安定したトレーニングが実現します。

Link to this section高度な損失関数#

YOLO26にはProgLoss + STAL(プログレッシブ損失およびスケール認識タスクアライメント学習)が組み込まれています。この組み合わせにより、小さく密集した物体の検出能力が飛躍的に向上します。さらに、YOLO26にはタスク固有の機能強化が導入されています。セマンティックセグメンテーション用の専用マルチスケールプロトタイプ、複雑な人間の姿勢推定用の残差対数尤度推定(RLE)、およびOBB検出タスクにおける境界問題を緩和するための特殊な角度損失です。

Link to this sectionパフォーマンスの比較#

これらのモデルを評価する際、パラメータ数、計算複雑性(FLOPs)、速度のバランスがハードウェアの選択を左右します。YOLO26は特にCPU推論速度をターゲットにしており、前モデルと比較して最大43%高速なCPU推論を達成しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

実証されているように、YOLO26 Nano (YOLO26n) は精度が大幅に向上し、ONNX Runtimeを使用してCPU推論時間を56.1msから38.9msに短縮しました。

最高速度のためのエクスポート

これらのモデルのパフォーマンスを最大限に引き出すには、NVIDIAハードウェア上ではTensorRTを使用し、Intel CPU上ではOpenVINOを使用してエクスポートしてください。YOLO26のNMSフリー設計により、このエクスポートプロセスはこれまで以上にスムーズになります。

Link to this sectionユースケースと実際のアプリケーション#

YOLO11とYOLO26のどちらを選ぶかは、主に特定のインフラストラクチャとプロジェクトの目標によって決まります。

Link to this sectionエッジコンピューティングとIoT#

ドローンによるスマート農業監視やローカルのセキュリティアラームシステムなど、電力とハードウェアに制限があるアプリケーションでは、YOLO26が圧倒的な勝者です。DFLの削除とCPU速度の43%向上により、専用のGPUを搭載していないデバイス上でも、高いフレームレートを維持しながら複雑な視覚モデルを実行できます。

Link to this sectionクラウドおよびエンタープライズ規模#

YOLO11は、巨大なサーバーファームがすでにそのテンソル構造に合わせて最適化されているエンタープライズソリューションにおいて、依然として優れた選択肢です。クラウドベースのビデオ解析や、特定の出力フォーマットに深く統合された大規模なメディア処理パイプラインに最適です。

Link to this section複雑なマルチタスク#

回路基板の欠陥検出や航空画像における遠方の車両追跡など、微小な物体に対してピンポイントの精度が必要なプロジェクトの場合、YOLO26に実装されたProgLoss + STALは、困難なエッジケースにおいてリコールと精度の顕著な向上をもたらします。

Link to this sectionトレーニングの効率とメモリ要件#

Ultralyticsフレームワークの大きな利点は、トレーニング中のメモリ消費量が非常に少ないことです。RT-DETRや古いYOLOv8のような巨大なビジョントランスフォーマーは膨大なCUDAメモリを消費する可能性がありますが、YOLO11とYOLO26はどちらもコンシューマーグレードのハードウェアで効率的にトレーニングできるように最適化されています。

YOLO26にMuSGDオプティマイザが統合されたことで、モデルが最適な重みをより高速に見つけることが可能になり、GPUの計算時間全体とクラウドコンピューティングのコストが削減されます。

以下は、ネイティブなPython APIを使用して最新のYOLO26モデルをいかに簡単にトレーニングできるかを示す簡単な例です。

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

Link to this section代替アーキテクチャの探求#

YOLO26はリアルタイム検出の頂点を代表するものですが、Ultralyticsドキュメント内の他のモデルを探求することも有益です。レガシー環境に縛られているユーザーには、YOLOv5のような初期のアーキテクチャが依然として堅牢なパフォーマンスを提供します。クラスを事前に定義することが不可能なゼロショット機能が必要な場合は、YOLO-Worldがテキストプロンプトによるオープンボキャブラリー検出を提供します。

Link to this section結論#

YOLO11からYOLO26への飛躍は、単なる段階的な更新ではありません。これは、リアルタイム物体検出モデルが本番環境でどのように動作するかという構造的な再考です。複雑な後処理ステップを排除し、エッジ優先の実行に最適化したYOLO26は、現代の開発者にとって最高の選択肢として際立っています。堅牢なUltralyticsエコシステムと包括的なドキュメントに裏打ちされたYOLO26へのアップグレードは、事実上あらゆるコンピュータビジョンタスクにおいて、より高速なデプロイメント、安定したトレーニング、そしてSOTA(State-of-the-Art)の精度を保証します。

コメント