コンテンツにスキップ

YOLOv7 YOLO26:リアルタイム物体検出における世代を超えた飛躍

コンピュータビジョンの進化は重要なマイルストーンによって特徴づけられており、従来のアーキテクチャと最新鋭のモデルを比較することは機械学習エンジニアにとって貴重な知見を提供する。この技術的比較では、非常に影響力の大きい YOLOv7 と革新的なUltralytics の差異を詳細に分析し、アーキテクチャ、トレーニング手法、デプロイ効率における進歩を明らかにする。

YOLOv7: 「フリービーの袋」の先駆者

2022年半ばに導入されたYOLOv7 、推論コストを増加させることなく精度を向上させる複数のアーキテクチャ最適化を導入することで、GPU で実現可能な限界をYOLOv7 。

モデルの詳細

YOLOv7 、再パラメータ化技術を多用し、効率的な層集約ネットワーク(E-ELAN)を拡張した、学習可能な「bag-of-freebies」YOLOv7 。 これにより、モデルはより多様な特徴を学習し、元の勾配経路を破壊することなくネットワークの学習能力を継続的に向上させることが可能となった。 COCO驚異的な最先端ベンチマークを達成したものの、そのアーキテクチャは依然としてアンカーベースの出力に大きく依存しており、複雑な非最大抑制(NMS)後処理を必要とするため、デプロイ時にレイテンシのボトルネックを引き起こす可能性がある。

YOLOv7について詳しくはこちら

YOLO26:エッジファーストのビジョンAI標準

2026年1月にリリースUltralytics 、検出パイプラインを根本的に再考し、導入の容易さ、トレーニングの安定性、ハードウェア効率を優先させるというパラダイムシフトを実現しています。

モデルの詳細

YOLO26は、現代のエンジニアリング課題を解決するために一から構築されました。そのアーキテクチャは、前世代を大幅に凌駕するいくつかの重要な革新をもたらします:

  • エンドツーエンドのNMSフリー設計: YOLO26はネイティブにNMS後処理を排除します。これはYOLOv10で最初に開拓された画期的なアプローチです。これにより、より高速で大幅にシンプルなデプロイメントパイプラインが実現され、混雑したシーンで通常発生する可変レイテンシが回避されます。
  • DFLの削除: Distribution Focal Loss (DFL)を削除することで、モデルのエクスポートが大幅に簡素化され、エッジデバイスや低電力IoTハードウェアとの互換性が飛躍的に向上します。
  • 最大43%高速なCPU推論: アーキテクチャの簡素化と構造的な枝刈りにより、YOLO26はエッジコンピューティングおよび専用GPUを持たないデバイス向けに特化して最適化されており、標準プロセッサ上で古いアーキテクチャを容易に凌駕します。
  • MuSGDオプティマイザ: 大規模言語モデルの学習技術 (特にMoonshot AIのKimi K2) に触発され、YOLO26は確率的勾配降下法とMuonのハイブリッドであるMuSGDオプティマイザを使用しています。これにより、コンピュータビジョンタスクに比類のない学習安定性と大幅な高速収束がもたらされます。
  • ProgLoss + STAL: これらの高度な損失関数の導入は、小オブジェクト認識において顕著な改善をもたらし、航空画像、ロボット工学、および自動品質検査にとって不可欠です。
  • タスク固有の改善: 標準的なobject detectionに加え、YOLO26はsegmentation tasksのためにマルチスケールプロトと特化したsemantic segmentation lossを、pose estimationのためにResidual Log-Likelihood Estimation (RLE) を、そしてOriented Bounding Boxes (OBB)における境界問題を解決するために特化した角度損失アルゴリズムを導入します。

YOLO26についてさらに詳しく

YOLO26への移行

古いアーキテクチャからYOLO26へのアップグレードは、Python 内のモデル文字列を以下のように変更するだけで簡単に行えます。 yolo26n.pt。Ultralyticsパッケージは、自動的な重みダウンロードや設定スケーリングを含む、移行全体を処理します。

パフォーマンスとメトリクスの比較

計算リソースの足跡を比較すると、YOLO26は性能とメモリ要件のバランスにおいて明らかな優位性を示している。トランスフォーマーベースのモデルや従来の重いアーキテクチャは、しばしば膨大なCUDA 割り当てを必要とするが、YOLO26はコンシューマー向けGPU上で効率的に学習できる。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

上記で示されているように、その YOLO26m モデルは、大規模なモデルと同等の精度(53.1mAP)を達成する YOLOv7x、しかし、パラメータ数は3分の1未満(20.4M対71.3M)で、非常に高速な推論時間を実現します。 TensorRT.

Ultralyticsエコシステムの利点

レガシーモデルのデプロイには、複雑なサードパーティリポジトリ、依存関係の地獄、手動のエクスポートスクリプトとの格闘が伴うことがよくあります。対照的に、Ultralytics Platformは、機械学習ライフサイクル全体を合理化する、適切に維持された一貫性のあるエコシステムを提供します。

  • 使いやすさ: 直感的なPython APIと網羅的なドキュメントがあれば、モデルのアノテーション、トレーニング、デプロイを数分で行うことができます。ONNXCoreMLのような形式へのエクスポートは、わずか1行のコードで可能です。
  • メモリ要件: Ultralyticsモデルは、メモリ使用量の少なさで有名です。一部の大型ビジョントランスフォーマーとは異なり、YOLO26はメモリ不足 (OOM) エラーに遭遇することなく、標準的なハードウェアで簡単にファインチューニングできます。
  • 汎用性: YOLOv7が主に物体検出器であった(他のタスク向けにいくつかの実験的なブランチがあった)のに対し、YOLO26はdetect、分類、track、姿勢、およびOBBを同等の熟練度で処理するネイティブな統合フレームワークです。

Ultralytics

YOLO26が推奨される標準ですが、レガシーシステムを移行する開発者は以下の選択肢も検討できます YOLO11を検討することも可能です。Ultralytics 別の高性能な世代であり、長期サポートプロジェクトにおいて優れた安定性を提供します。

コード例:トレーニングとデプロイ

以下の例は、その洗練された簡潔さを示しています。 ultralytics パッケージ。古いモデルで長いコマンドライン引数を呼び出す場合と比べて、インターフェースがいかに洗練されているかに注目してください。

from ultralytics import YOLO

# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # Efficient memory usage allows larger batch sizes
    device=0,
)

# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")

実際のユースケース

適切なアーキテクチャの選択は、生産上の制約に完全に依存します。

YOLOv7を検討するタイミング: YOLOv7は、2022年の標準に対する学術的なベンチマークとして依然として貴重なツールです。インフラストラクチャがYOLOv7の特定のアンカー出力に強くハードコードされた深いレガシーCUDAパイプラインを利用しており、リファクタリングのためのリソースを割り当てられない場合、堅牢なベースラインdetect器として機能し続けます。

YOLO26を選択するタイミング: あらゆる新規プロジェクトにおいて、YOLO26は決定的な選択肢です。そのNMSフリーアーキテクチャは、低遅延の自律航法やリアルタイムセキュリティシステムに最適です。DFLの削除と大幅なCPU速度向上により、Raspberry Piへの展開や家電製品内での展開など、エッジAI展開における揺るぎないチャンピオンとなっています。さらに、ProgLoss + STALの強化により、製造品質保証や衛星画像における微細な異常をdetectするのに非常に優れています。

究極的に、YOLO26は開発者に比類のない精度、速度、簡便性の融合を提供し、オープンソースコミュニティの包括的なサポートによって支えられています。


コメント