YOLOv7 YOLO26:リアルタイム物体検出における世代を超えた飛躍
コンピュータビジョンの進化は重要なマイルストーンによって特徴づけられており、従来のアーキテクチャと最新鋭のモデルを比較することは機械学習エンジニアにとって貴重な知見を提供する。この技術的比較では、非常に影響力の大きい YOLOv7 と革新的なUltralytics の差異を詳細に分析し、アーキテクチャ、トレーニング手法、デプロイ効率における進歩を明らかにする。
YOLOv7: 「フリービーの袋」の先駆者
2022年半ばに導入されたYOLOv7 、推論コストを増加させることなく精度を向上させる複数のアーキテクチャ最適化を導入することで、GPU で実現可能な限界をYOLOv7 。
モデルの詳細
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織:中央研究院情報科学研究所
- 日付: 2022-07-06
- Arxiv:2207.02696
- GitHub:WongKinYiu/yolov7
- ドキュメント:Ultralytics YOLOv7 ドキュメンテーション
YOLOv7 、再パラメータ化技術を多用し、効率的な層集約ネットワーク(E-ELAN)を拡張した、学習可能な「bag-of-freebies」YOLOv7 。 これにより、モデルはより多様な特徴を学習し、元の勾配経路を破壊することなくネットワークの学習能力を継続的に向上させることが可能となった。 COCO驚異的な最先端ベンチマークを達成したものの、そのアーキテクチャは依然としてアンカーベースの出力に大きく依存しており、複雑な非最大抑制(NMS)後処理を必要とするため、デプロイ時にレイテンシのボトルネックを引き起こす可能性がある。
YOLO26:エッジファーストのビジョンAI標準
2026年1月にリリースUltralytics 、検出パイプラインを根本的に再考し、導入の容易さ、トレーニングの安定性、ハードウェア効率を優先させるというパラダイムシフトを実現しています。
モデルの詳細
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2026-01-14
- GitHub:ultralytics/ultralytics
- プラットフォーム:Ultralytics on Platform
YOLO26は、現代のエンジニアリング課題を解決するために一から構築されました。そのアーキテクチャは、前世代を大幅に凌駕するいくつかの重要な革新をもたらします:
- エンドツーエンドのNMS設計:YOLO26はネイティブにNMS 排除し、この画期的な手法は YOLOv10で初めて確立された画期的な手法です。これにより、混雑したシーンで生じがちな変動遅延を回避し、より高速で大幅に簡素化されたデプロイメントパイプラインを実現します。
- DFL除去:分布焦点損失(DFL)を除去することで、モデルはエクスポート向けに大幅に簡素化され、エッジデバイスや低消費電力IoTハードウェアとの互換性が飛躍的に向上します。
- 最大43%高速CPU :アーキテクチャの簡素化と構造的プルーニングにより、YOLO26はエッジコンピューティングおよび専用GPUを持たないデバイス向けに最適化されており、標準プロセッサ上で従来のアーキテクチャを容易に凌駕します。
- MuSGDオプティマイザ:大規模言語モデル訓練技術(特にMoonshot AIのKimi K2)に着想を得たYOLO26は、確率的勾配降下法とミューオンのハイブリッドであるMuSGDオプティマイザを採用しています。これにより、コンピュータービジョンタスクにおいて比類のない訓練安定性と大幅な収束速度の向上が実現されます。
- ProgLoss + STAL:これらの先進的な損失関数の導入により、航空画像、ロボティクス、自動品質検査において極めて重要な小規模物体認識において顕著な改善がもたらされる。
- タスク特化型改良点:標準的な物体検出に加え、YOLO26ではセグメンテーションタスク向けにマルチスケールプロトおよび特化型セマンティックセグメンテーション損失を導入。姿勢推定には残差対数尤度推定(RLE)を採用。方向付き境界ボックス(OBB)の境界問題を解決するため、特化型角度損失アルゴリズムを実装。
YOLO26への移行
古いアーキテクチャからYOLO26へのアップグレードは、Python 内のモデル文字列を以下のように変更するだけで簡単に行えます。 yolo26n.ptUltralytics 、自動ウェイトダウンロードや構成スケーリングを含む移行プロセス全体を処理します。
パフォーマンスとメトリクスの比較
計算リソースの足跡を比較すると、YOLO26は性能とメモリ要件のバランスにおいて明らかな優位性を示している。トランスフォーマーベースのモデルや従来の重いアーキテクチャは、しばしば膨大なCUDA 割り当てを必要とするが、YOLO26はコンシューマー向けGPU上で効率的に学習できる。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
上記のように、 YOLO26m モデルは、大規模なモデルと同等の精度(53.1mAP)を達成する YOLOv7xしかし、そのパラメータ数は3分の1未満(2040万対7130万)であり、さらに驚くほど高速な推論時間を実現している。 TensorRT.
Ultralyticsエコシステムの利点
レガシーモデルのデプロイでは、複雑なサードパーティリポジトリや依存関係の地獄、手動のエクスポートスクリプトとの格闘がしばしば発生します。これに対し、Ultralytics 、機械学習ライフサイクル全体を効率化する、よく管理された一貫性のあるエコシステムを提供します。
- 使いやすさ:直感的なPython 網羅的なドキュメントにより、モデルへのアノテーション、トレーニング、デプロイを数分で実行できます。ONNXなどの形式へのエクスポートも可能です。 ONNX や CoreML へのエクスポートはたった1行のコードで実現できます。
- メモリ要件: Ultralytics 低メモリ使用量で知られています。一部の巨大なビジョン・トランスフォーマーとは異なり、YOLO26は標準的なハードウェア上でメモリ不足(OOM)エラーに陥ることなく容易に微調整が可能です。
- 汎用性: YOLOv7 主に物体検出器YOLOv7 に対し(他のタスク向けの実験的分岐も一部存在)、YOLOv26は検出、分類、追跡、姿勢推定、OBBを同等の能力で処理するネイティブに統合されたフレームワークである。
Ultralytics
YOLO26が推奨される標準ですが、レガシーシステムを移行する開発者は以下の選択肢も検討できます YOLO11を検討することも可能です。Ultralytics 別の高性能な世代であり、長期サポートプロジェクトにおいて優れた安定性を提供します。
コード例:トレーニングとデプロイメント
以下の例は、その洗練された簡潔さを示しています。 ultralytics パッケージ。古いモデルで長いコマンドライン引数を呼び出す場合と比べて、インターフェースがいかに洗練されているかに注目してください。
from ultralytics import YOLO
# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # Efficient memory usage allows larger batch sizes
device=0,
)
# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")
実際のユースケース
適切なアーキテクチャの選択は、完全に生産上の制約に依存します。
YOLOv7を検討すべきタイミング: YOLOv7 2022年の基準に対する学術的なベンチマークとしてYOLOv7 有用なツールYOLOv7 。インフラストラクチャが、YOLOv7アンカー出力に強くハードコードされた深層レガシーCUDA 多用しており、リファクタリングのためのリソースを割り当てられない場合、堅牢なベースライン検出器として機能し続けます。
YOLO26を選択すべき場合: 新規プロジェクトにおいては、YOLO26が最適な選択肢です。そのNMSアーキテクチャは、低遅延自律航行やリアルタイムセキュリティシステムに理想的です。 DFLの排除とCPU 向上により、ラズベリーパイや民生電子機器内などエッジAI展開において圧倒的な優位性を発揮します。さらにProgLoss + STALの強化により、製造品質保証や衛星画像処理における微小な異常検出に極めて高い適応性を有します。
究極的に、YOLO26は開発者に比類のない精度、速度、簡便性の融合を提供し、オープンソースコミュニティの包括的なサポートによって支えられています。