Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOv7: 包括的な技術比較#

リアルタイム物体検出の進化には数多くのマイルストーンが存在し、Ultralytics YOLO26YOLOv7は、コンピュータビジョンの能力において重要な飛躍を遂げた2つのモデルです。YOLOv7は2022年に精度ベンチマークを塗り替えた強力な「bag-of-freebies」手法を導入しましたが、新しくリリースされたYOLO26アーキテクチャは、エッジファーストの最適化、ネイティブなエンドツーエンド処理、そして大規模言語モデル(LLM)の革新から着想を得た安定した学習ダイナミクスを先駆けて導入しています。

本稿では、これら2つのアーキテクチャを深く掘り下げ、パフォーマンス指標、構造的な違い、および理想的なデプロイシナリオを分析します。これにより、機械学習エンジニアが次のビジョンAIプロジェクトに向けて十分な情報に基づいた意思決定ができるよう支援します。

Link to this sectionモデルの背景と詳細#

パフォーマンスデータを検討する前に、各モデルの起源と主要な目的を理解しておくことが重要です。

Link to this sectionUltralytics YOLO26#

著者: Glenn Jocher および Jing Qiu
組織: Ultralytics
日付: 2026-01-14
GitHub: Ultralytics リポジトリ
ドキュメント: YOLO26 ドキュメント

YOLO26の詳細はこちら

Link to this sectionYOLOv7#

著者: Chien-Yao Wang、Alexey Bochkovskiy、および Hong-Yuan Mark Liao
組織: 中央研究院 情報科学研究所(台湾)
日付: 2022-07-06
Arxiv: YOLOv7 論文
GitHub: YOLOv7 リポジトリ

YOLOv7の詳細はこちら

検討すべき代替モデル

より広範なエコシステムを調査されている場合は、バランスの取れたマルチタスクデプロイメントを実現するYOLO11や、シーケンスベースの検出に適したTransformerベースのRT-DETRもご検討ください。なお、YOLOv8YOLOv5のような旧モデルについても、レガシーな統合のためにUltralytics Platformで引き続き完全にサポートされています。

Link to this sectionアーキテクチャの深掘り#

YOLO26とYOLOv7のアーキテクチャ設計思想は大きく異なっており、ハイエンドGPUのパフォーマンス最大化から、シームレスなエンドツーエンドのエッジデプロイメントへの最適化へと変化しています。

Link to this sectionYOLO26: エッジファーストのパラダイム#

2026年にリリースされたYOLO26は、デプロイパイプラインを根本から再考しました。その最も重要なブレイクスルーは、NMSフリーのEnd-to-End設計です。非最大値抑制(NMS)のポストプロセスを排除することで、YOLO26はレイテンシの変動を大幅に低減しました。このコンセプトはYOLOv10で初めて試験的に成功したものです。これにより、混雑したシーンでも安定したフレームレートが保証され、自律ロボティクスや交通監視において極めて重要となります。

さらに、YOLO26ではDistribution Focal Loss (DFL) が完全に削除されています。この DFL Removal により、ONNXApple CoreML といったフォーマットへのエクスポート処理が簡素化され、CPU推論が最大43%高速化されます。

学習の安定性も重要な焦点です。標準的なStochastic Gradient DescentとMuon(Kimi K2の学習ダイナミクスに触発された)をハイブリッドしたMuSGDオプティマイザーの導入により、コンピュータビジョンに高度なLLMの学習安定性をもたらします。ProgLoss + STAL損失関数と組み合わせることで、YOLO26はリアルタイム検出器にとって歴史的な課題であった小物体認識において優れた性能を発揮します。

Link to this sectionYOLOv7: Bag-of-Freebiesの極致#

YOLOv7は、勾配パス最適化に関する徹底的な研究に基づいて構築されました。その核心的な革新はExtended Efficient Layer Aggregation Network (E-ELAN)であり、これによりモデルは元の勾配パスを乱すことなく、より多様な特徴を学習できるようになりました。

YOLOv7アーキテクチャは、推論中の再パラメータ化技術にも大きく依存しており、本質的にレイヤーを融合させることで、学習中に得られた豊かな特徴表現を損なうことなく高速化を実現しています。標準的なNVIDIA TensorRTサーバーGPUでは強力ですが、このアプローチは依然としてアンカーベースの検出ヘッドと従来のNMSに依存しており、低電力デバイスでのデプロイ時に摩擦が生じる可能性があります。

Link to this sectionパフォーマンスの比較#

以下の表は、標準的なCOCOデータセットで学習されたモデルの直接比較です。YOLO26は、精度(mAP)の大幅な向上を示すと同時に、パラメーター数とFLOPsの比率において卓越したバランスを維持しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

注: YOLO26xはYOLOv7xをmAPで大幅に上回り(57.5対53.1)、必要なパラメーター数も約22%削減されています。

Link to this sectionUltralyticsエコシステムの利点#

開発者が一貫してYOLO26を選択する主な理由は、Ultralytics Platformへの深い統合にあります。古いアーキテクチャで必要だったスタンドアロンのスクリプトとは異なり、Ultralyticsはシームレスで統一されたワークフローを提供します。

  1. 使いやすさ: Python APIを使用することで、数行のコードでモデルの読み込み、学習、デプロイが可能です。TensorFlow Lite のようなモバイル向けフォーマットへのエクスポートも、引数を1つ変更するだけで完了します。
  2. メモリ要件: Ultralyticsモデルは学習効率を考慮して緻密に設計されています。重いVision Transformerモデルと比較してCUDAメモリの消費量が大幅に少ないため、研究者はコンシューマーハードウェア上でも大きなバッチサイズを扱うことができます。
  3. 汎用性: YOLOv7ではタスクごとに異なるリポジトリが必要でしたが、YOLO26は画像分類インスタンスセグメンテーション姿勢推定、および指向性バウンディングボックス(OBB)検出を1つの統合ライブラリからネイティブにサポートします。人間姿勢パイプライン向けのResidual Log-Likelihood Estimation (RLE)のような、タスク特有の損失関数も含まれています。
  4. 活発な開発: Ultralyticsのオープンソースコミュニティは頻繁にアップデートを提供しており、エッジケースの迅速な解決と、最新のPyTorchリリースとの継続的な互換性を確保しています。
合理化されたエクスポート

YOLO26はネイティブでNMSフリーであるため、Intel OpenVINOやONNX Runtimeを使用して組み込みターゲットへデプロイする際、複雑なポスト処理スクリプトを完全に取り除くことができます。

Link to this section実際のユースケース#

これらのモデルのアーキテクチャの違いは、理想的なデプロイシナリオを決定づけます。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は、現代的で未来志向のコンピュータビジョンシステムにおいて、疑う余地のない推奨モデルです。

  • エッジAIとIoT: 43%高速なCPU推論と軽量なパラメーター数により、YOLO26nはRaspberry Piやスマートシティカメラなどの制約のあるデバイスに最適です。
  • ドローンおよび空撮画像: ProgLoss + STALの統合により、小物体の検出性能が飛躍的に向上しており、パイプライン検査や精密農業において最高の選択肢となります。
  • マルチタスクロボティクス: バウンディングボックス、セグメンテーションマスク、姿勢キーポイントを最小限のメモリオーバーヘッドで同時に扱えるため、動的なロボットナビゲーションやインタラクションに非常に適しています。

Link to this sectionYOLOv7を検討すべき場面#

新しいアーキテクチャに取って代わられつつありますが、YOLOv7は特定のニッチな用途で利用価値を維持しています。

  • 学術的ベンチマーク: 新しいアンカーベースの検出ヘッドを開発する研究者や、勾配パス戦略を研究する研究者は、Papers With Codeのようなプラットフォームでの標準的なベースライン比較として、頻繁にYOLOv7を使用します。
  • レガシーなGPUパイプライン: 強力なAWS EC2 P4dインスタンス上で、YOLOv7固有のテンソル出力やカスタムNMS構成に合わせてカスタムビルドされたエンタープライズシステムでは、システム全体のリファクタリングが必要になるまで、新しいモデルへの移行を延期する場合もあります。

Link to this sectionコード例:はじめに#

開発者のエクスペリエンスを見ると、標準的な研究リポジトリとUltralyticsエコシステムの決定的な違いがわかります。カスタムYOLO26モデルの学習は驚くほど簡単です:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

Link to this section結論#

YOLOv7はリアルタイム物体検出の歴史における尊敬すべきマイルストーンであり続けていますが、業界は、デプロイの単純さ、マルチタスクの汎用性、エッジ効率を優先するモデルへと積極的に移行しています。

NMSを排除し、MuSGDオプティマイザーを導入し、CPU推論速度を劇的に向上させたUltralytics YOLO26は、今日の開発者やエンタープライズエンジニアにとって決定的な選択肢です。堅牢でユーザーフレンドリーなUltralyticsエコシステムと相まって、速度、精度、そしてエンジニアリングの楽しさの比類なきバランスを提供します。

コメント