コンテンツにスキップ

YOLOv7 vs YOLO26: リアルタイム物体detectの進化

コンピュータビジョンの分野は急速に進化しており、新しいモデル世代が登場するたびに、リアルタイム分析で可能なことの限界が押し広げられています。この包括的な比較では、レガシーなYOLOv7と最先端のYOLO26の違いを探り、それぞれのアーキテクチャ、パフォーマンス指標、および理想的なデプロイメントシナリオを分析します。YOLOv7は2022年に重要なマイルストーンを築きましたが、YOLO26はエンドツーエンド処理や大規模言語モデル(LLM)トレーニングから派生した最適化戦略など、画期的なイノベーションを導入しています。

モデル概要

YOLOv7

2022年7月にリリースされたYOLOv7は、「trainable bag-of-freebies」の概念を導入し、推論コストを増加させることなく精度を向上させるためにトレーニングプロセスを最適化しました。Extended Efficient Layer Aggregation Networks (E-ELAN) やモデルスケーリング技術などのアーキテクチャ改革に重点を置いていました。

著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
所属:台湾中央研究院情報科学研究所
日付: 2022年7月6日
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7

Ultralytics YOLO26

2026年初頭にリリースされたYOLO26は、YOLO系統におけるパラダイムシフトを象徴しています。これは、エッジデバイスでの最大限の効率と、合理化されたデプロイメントのために設計されています。主な革新点としては、複雑な後処理が不要になるネイティブなエンドツーエンドのNMSフリー設計、およびエクスポートの簡素化を目的としたDistribution Focal Loss (DFL) の削除が挙げられます。

著者: Glenn Jocher and Jing Qiu
所属:Ultralytics
日付: 2026年1月14日
ドキュメント:Ultralytics YOLO26
GitHub:ultralytics/ultralytics

YOLO26についてさらに詳しく

技術比較

以下の表は、YOLOv7からYOLO26へのパフォーマンスの飛躍を示しています。YOLOv7はその時代にベンチマークを確立しましたが、YOLO26は特にCPUベースの推論において、優れた速度と効率を提供します。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

パフォーマンス分析

YOLO26lは、はるかに重いYOLOv7xの精度(55.0 mAP vs 53.1 mAP)を上回りながら、パラメータ数(24.8M vs 71.3M)とFLOPs(86.4B vs 189.9B)を大幅に削減しています。この効率性により、YOLO26はモデル最適化が不可欠なリソース制約のある環境に最適です。

アーキテクチャの違い

YOLOv7アーキテクチャ

YOLOv7のアーキテクチャは、最短および最長の勾配パスを制御することで、ネットワークがより多様な特徴を学習できるようにするE-ELAN(Extended Efficient Layer Aggregation Network)に依存しています。また、連結ベースモデルのモデルスケーリングを採用し、ネットワークの深さと幅を同時に調整します。しかし、YOLOv7は依然としてアンカーベースの検出ヘッドに依存しており、重複するバウンディングボックスをフィルタリングするために後処理中にNon-Maximum Suppression (NMS)を必要とします。このNMSステップはデプロイにおけるボトルネックとなる可能性があり、TensorRTやCoreMLのような異なるハードウェアバックエンドに対してカスタム実装が必要となることがよくあります。

YOLO26アーキテクチャ

YOLO26は、ユーザーエクスペリエンスを簡素化し、パフォーマンスを向上させるために設計されたいくつかの抜本的な変更を導入しています。

  • エンドツーエンドのNMSフリー: YOLOv10で先駆的に導入されたネイティブなエンドツーエンドアーキテクチャを採用することで、YOLO26はNMSの必要性を排除します。モデルは最終的な検出結果を直接出力するため、レイテンシが削減され、デプロイパイプラインが大幅に簡素化されます。
  • DFLの削除: Distribution Focal Lossの削除により、出力ヘッドが合理化され、モデルがエッジデバイスやINT8のような低精度フォーマットとの互換性が向上します。
  • MuSGDオプティマイザ: Moonshot AIのKimi K2のような大規模言語モデル(LLM)のトレーニングにおける革新に触発され、YOLO26はハイブリッドMuSGDオプティマイザを利用します。これはSGDの運動量とMuonオプティマイザの適応特性を組み合わせることで、より安定したトレーニングと高速な収束を実現します。
  • 小物体最適化: Progressive Loss Balancing (ProgLoss)Small-Target-Aware Label Assignment (STAL)の統合により、小物体をdetectする際の一般的な課題に直接対処し、YOLO26は航空画像やIoTアプリケーションに特に効果的です。

トレーニングとユーザビリティ

使いやすさ

の特長の一つは Ultralyticsエコシステム のアクセシビリティです。YOLOv7は特定のリポジトリをクローンし、複雑な設定ファイルを管理する必要がありますが、YOLO26はに直接統合されています。 ultralytics これにより、トレーニング、検証、デプロイメントのための統一されたAPIが提供されます。

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100)

汎用性

YOLOv7は主に物体検出と姿勢推定に焦点を当てています。対照的に、YOLO26は以下を含むより広範なコンピュータビジョンタスクをサポートする統合フレームワークを提供します。

  • インスタンスセグメンテーション: 精密なマスキングのための特殊な損失を伴います。
  • 姿勢推定: 正確なキーポイントのためにResidual Log-Likelihood Estimation (RLE)を利用します。
  • Oriented Bounding Boxes (OBB): 回転した物体に対する特殊な角度損失を特徴とします。
  • 分類: 効率的な画像分類のため。

トレーニング効率

YOLO26のトレーニングプロセスは高度に最適化されています。MuSGDオプティマイザはより速い収束を可能にし、これによりユーザーは古いオプティマイザと比較して、より少ないエポックでより良い結果を達成できることがよくあります。さらに、YOLO26モデルのメモリフットプリントが低いことで、同じハードウェアでより大きなバッチサイズが可能になり、トレーニングサイクルがさらに加速されます。これは、通常大量のCUDAメモリを必要とするトランスフォーマーベースのモデルに対する大きな利点です。

現実世界のアプリケーション

YOLOv7が優れている点

YOLOv7は、ELANネットワークの特定のアーキテクチャ特性に関心のある研究者や、Darknetスタイルのアーキテクチャを中心に構築されたレガシーシステムを維持している人々にとって、依然として有能なモデルです。学術的な比較のための優れたベンチマークとして機能します。

YOLO26が優れている点

YOLO26は、そのパフォーマンスバランスとデプロイの容易さから、ほとんどの最新アプリケーションに推奨される選択肢です。

  • エッジコンピューティング: 最大43%高速なCPU推論により、YOLO26はRaspberry Pi、モバイルデバイス、または専用GPUなしのローカルサーバーでの実行に最適です。
  • ロボティクス&自律システム: エンドツーエンド設計によりレイテンシの変動が減少し、これはロボティクスにおけるリアルタイムの意思決定に不可欠です。改善された小物体detect(STAL経由)は、ナビゲーションと障害物回避を支援します。
  • 商用デプロイ: NMSとDFLの削除により、ONNX、TensorRT、CoreMLなどのフォーマットへのエクスポートプロセスが簡素化され、さまざまなデプロイ環境で一貫した動作が保証されます。
  • 農業モニタリング: 小さな物体検出における高い精度により、YOLO26はドローン画像からの害虫特定や作物計数といったタスクに優れています。

YOLOv7からの移行

YOLOv7からYOLO26へ移行するユーザーは、Ultralytics APIのおかげでシームレスな移行が可能であることに気づくでしょう。速度とエクスポートの容易さにおける大幅な改善は、通常、本番システムでのアップグレードを正当化します。他の最新の代替案を探している方には、YOLO11もUltralyticsエコシステムによって完全にサポートされている堅牢な選択肢です。

結論

YOLOv7はオープンソースコミュニティに大きく貢献しましたが、YOLO26は効率的なコンピュータビジョンの未来を象徴しています。NMSのような重要なボトルネックに対処し、LLMの世界からの最新の最適化技術を活用することで、YOLO26はより速く、より軽量であるだけでなく、トレーニングとデプロイがはるかに容易なモデルを提供します。

信頼性が高く、適切にメンテナンスされ、多用途なソリューションを求める開発者にとって、YOLO26は優れた選択肢です。Ultralyticsエコシステムへの統合により、継続的なアップデート、広範なドキュメント、そして活発なサポートコミュニティへのアクセスが保証されます。

YOLO26についてさらに詳しく


コメント