YOLO11 vs YOLO26: 次世代ビジョンAIの進化

コンピュータビジョンの急速な進化により、速度、精度、展開効率の限界が絶えず押し広げられています。リアルタイム物体検出の分野において、Ultralyticsは一貫して標準を確立してきました。本技術比較では、非常に成功したYOLO11から最先端のYOLO26への移行について、アーキテクチャ、パフォーマンス指標、および理想的な展開シナリオを分析します。

ドローン配送システムを構築する場合でも、グローバルなスマート製造パイプラインを最適化する場合でも、これら2つのモデルの微妙な違いを理解することは、堅牢で将来性のあるAIソリューションを構築するのに役立ちます。

モデルの系譜とエコシステム

両モデルとも、使いやすいAPI、継続的なメンテナンス、活発なコミュニティを特徴とする包括的なUltralyticsエコシステムの恩恵を受けています。これらは比類のない汎用性を提供し、物体検出インスタンスセグメンテーション画像分類姿勢推定、および指向性バウンディングボックス(OBB)タスクをすぐにサポートします。

YOLO11: 確立された標準

2024年後半にリリースされたYOLO11は、初期世代の進歩を洗練させ、本番環境向けの信頼性の高いワークホースとしての地位を固めました。

YOLO11の詳細はこちら

YOLO26: 新たなフロンティア

2026年初頭に導入されたYOLO26は、エッジコンピューティングとエンドツーエンドアーキテクチャにおけるパラダイムシフトを表しており、処理速度と統合の容易さが大幅に向上しています。

YOLO26の詳細はこちら

データと展開の管理

YOLO11とYOLO26はどちらもUltralytics Platformと完全に統合されており、データセットのアノテーション、クラウドトレーニング、フリート監視のためのシームレスなノーコードワークフローを提供します。

アーキテクチャの革新

YOLO11は長年コンピュータビジョンを支えてきた従来のポストプロセッシング手法に依存していますが、YOLO26はボトルネックを解消するために設計されたいくつかの構造的なブレークスルーを導入しています。

エンドツーエンドのNMS不要設計

YOLO26における最も重要なアップグレードの1つは、ネイティブなエンドツーエンドアーキテクチャです。これにより、YOLOv10で初めて採用された概念であるNon-Maximum Suppression (NMS)のポストプロセッシングが不要になります。NMSを回避することで展開パイプラインが大幅に簡素化され、自動運転アルゴリズムのようなリアルタイムアプリケーションに不可欠な一貫したレイテンシが保証されます。

エッジ最適化のためのDFLの削除

YOLO26はDistribution Focal Loss (DFL)を削除しました。DFLはYOLO11では細かいローカリゼーションに役立っていましたが、削除することでネットワークのエクスポートグラフが簡素化されます。この変更により、低電力ハードウェアとの互換性が向上し、YOLO26はRaspberry PiNVIDIA Jetsonなどのエッジデバイスで圧倒的なパフォーマンスを発揮します。

MuSGDオプティマイザ

大規模言語モデル(LLM)のトレーニングメカニズム、特にMoonshot AI's Kimi K2から着想を得たYOLO26は、革新的なMuSGD Optimizerを活用しています。Stochastic Gradient Descent (SGD)とMuonのこのハイブリッドは、非常に安定したトレーニング実行を提供し、古いアーキテクチャで使用されていた標準的なAdamWオプティマイザよりもはるかに高速に収束します。

高度な損失関数

YOLO26はProgLoss + STAL (Progressive Loss and Scale-Aware Task Alignment Learning)を組み込んでいます。この組み合わせにより、小さな物体や密集した物体の検出が大幅に改善されます。さらに、YOLO26はタスク固有の機能強化を導入しています。セマンティックセグメンテーション用の専用マルチスケールプロトタイプ、複雑な人間の姿勢推定用のResidual Log-Likelihood Estimation (RLE)、OBB検出タスクの境界問題を軽減するための特殊な角度ロスなどです。

パフォーマンスの比較

これらのモデルを評価する際、パラメータ数、計算量(FLOPs)、速度のバランスがハードウェアの選択を左右します。YOLO26は特にCPU推論速度をターゲットにしており、前世代と比較して最大43%のCPU推論高速化を実現しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

実証されているように、YOLO26 Nano (YOLO26n)は精度が大幅に向上し、ONNX Runtimeを使用してCPU推論時間を56.1msから38.9msに短縮しました。

最大速度のためのエクスポート

これらのモデルから最大限のパフォーマンスを引き出すには、NVIDIAハードウェアの場合はTensorRTを、Intel CPUの場合はOpenVINOを使用してエクスポートしてください。YOLO26のNMSフリー設計により、このエクスポートプロセスはこれまで以上にスムーズになります。

ユースケースと実世界のアプリケーション

YOLO11とYOLO26のどちらを選択するかは、主にインフラストラクチャとプロジェクトの目標によって異なります。

エッジコンピューティングとIoT

ドローンによるスマート農業監視やローカルのセキュリティアラームシステムなど、電力とハードウェアに制約があるアプリケーションでは、YOLO26が紛れもないチャンピオンです。DFLの削除とCPU速度の43%向上により、GPU専用デバイスがなくても、高いフレームレートを維持しながら複雑なビジョンモデルを実行できます。

クラウドとエンタープライズ規模

YOLO11は、大規模サーバーファームがすでにそのテンソル構造に最適化されているエンタープライズソリューションにとって、依然として優れた選択肢です。これは、特定の出力形式とすでに深く統合されているクラウドベースのビデオ解析や大規模なメディア処理パイプラインに最適です。

複雑なマルチタスク

回路基板の欠陥検出や航空画像内の遠方の車両追跡など、小さな物体に対して正確な精度が必要なプロジェクトの場合、YOLO26ProgLoss + STAL実装は、困難なエッジケースにおいてリコールと精度の顕著な向上を提供します。

トレーニング効率とメモリ要件

Ultralyticsフレームワークの大きな利点は、トレーニング中のメモリ消費量が非常に少ないことです。RT-DETRや古いYOLOv8のような大規模なビジョントランスフォーマーは大量のCUDAメモリを消費する可能性がありますが、YOLO11とYOLO26の両方は、民生用ハードウェアでも効率的にトレーニングできるように最適化されています。

YOLO26にMuSGDオプティマイザが統合されたことで、モデルが最適な重みをより高速に見つけられるようになり、GPUの計算時間全体とクラウドコンピューティングコストが削減されます。

以下は、ネイティブなPython APIを使用して最新のYOLO26モデルをいかに簡単にトレーニングできるかを示す簡単な例です。

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

代替アーキテクチャの調査

YOLO26はリアルタイム検出の頂点ですが、Ultralyticsドキュメント内の他のモデルを調査することも有益です。レガシー環境に縛られているユーザーには、YOLOv5のような以前のアーキテクチャが依然として堅牢なパフォーマンスを提供します。事前にクラスを定義できないゼロショット機能が必要な場合は、YOLO-Worldがテキストプロンプトによるオープンボキャブラリー検出を提供します。

結論

YOLO11からYOLO26への飛躍は、単なる増分アップデートではありません。それは本番環境でリアルタイム物体検出モデルがどのように動作するかという構造的な再考です。複雑なポストプロセッシングステップを排除し、エッジ優先の実行に最適化することで、YOLO26は現代のデベロッパーにとって最高の選択肢として際立っています。堅牢なUltralyticsエコシステムと包括的なドキュメントに裏打ちされたYOLO26へのアップグレードは、実質的にあらゆるコンピュータビジョンタスクにおいて、より高速なデプロイメント、安定したトレーニング、そしてSOTAの精度を保証します。

コメント