YOLOv6.0 vs. YOLO26: リアルタイム物体検出の進化
コンピュータビジョンの領域は急速な進化によって特徴づけられ、アーキテクチャの革新がエッジデバイスとクラウドサーバー双方における可能性を絶えず再定義している。本比較ではこの進化の道程における二つの重要なマイルストーンを探る:美团(Meituan)による堅牢な産業用YOLOv6.YOLOv6と、エンドツーエンドの効率性をUltralytics 最新鋭モデル Ultralytics 。
YOLOv6.0:産業用ワークホース
2023年初頭にリリースされたYOLOv6、産業応用という一点に焦点を当てて設計された。美团の研究者らはこのモデルをGPU 向けに最適化し、NVIDIA T4などのハードウェア上で動作する高速製造システムや自動検査システムにおいて広く採用されている。
YOLOv6 概要
著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
組織:Meituan
日付: 2023-01-13
Arxiv:YOLOv6 .0: A Full-Scale Reloading
GitHub:YOLOv6
主な機能と強み
YOLOv60のアーキテクチャは、双方向連結(BiC)モジュールとアンカー補助学習(AAT)戦略を活用している。その主な強みはRepVGGスタイルのバックボーンにあり、これによりモデルは学習時には複雑な分岐構造を持ちつつ、推論時には単純で高速な構造に融合することが可能となる。
- GPU :モデルはTensorRT向けに高度に調整されています TensorRT デプロイ向けに高度にチューニングされており、専用GPU 割り当てられた環境で優れた性能を発揮します。
- 量子化対応:INT8精度に圧縮した場合でも高い精度を維持するため、量子化対応学習(QAT)技術を導入した。
- 産業向け:厳格なレイテンシ予算が課される実運用環境向けに設計され、かつ高性能なハードウェアを備えています。
ただし、GPU 重点を置いているため、YOLOv6.YOLOv6、より広範なエッジ互換性を考慮して設計された新しいモデルと比較すると、CPUデバイスでは効率が低下する可能性があります。
YOLO26:エンドツーエンドのエッジ革命
2026年1月にUltralytics 、検出アーキテクチャにおけるパラダイムシフトを体現しています。非最大抑制(NMS)の必要性を排除することで、YOLO26はデプロイメントパイプライン全体を合理化し、レイテンシのばらつきを低減し統合を簡素化するネイティブなエンドツーエンド体験を提供します。
YOLO26 概要
著者: Glenn Jocher と Jing Qiu
所属: Ultralytics
日付: 2026-01-14
ドキュメント:Ultralytics ドキュメント
GitHub:ultralytics
画期的な機能
YOLO26は、優れた性能を達成するために、コンピュータビジョンと大規模言語モデル(LLM)のトレーニングの両方からの革新を取り入れています:
- エンドツーエンドのNMS:YOLOv10の遺産を継承し、YOLO26NMS 排除しました。これにより、より高速で決定論的な推論速度が実現され、デプロイメントロジックが簡素化されます。
- MuSGDオプティマイザー:Moonshot AIのKimi K2に着想を得た、SGD ミューオンのハイブリッド手法。LLMトレーニングの安定性をビジョンタスクにもたらし、収束速度を向上させます。
- CPU :分布焦点損失(DFL)の削除と最適化されたアーキテクチャ選択により、YOLO26はCPU上で最大43%高速化され、IoT、モバイル、ロボティクスに最適な選択肢となっています。
- ProgLoss + STAL:先進的な損失関数(プログラム損失とソフトターゲットアンカー損失)は、航空画像とセキュリティにとって重要な要件である小型物体検出を大幅に改善する。
性能指標の比較
以下の表は、2つのアーキテクチャ間の性能差を比較したものです。YOLOv6.0はGPU環境では依然として競争力を維持していますが、CPU 優れた効率性を示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
データの分析
YOLO26は、同YOLOv6 と比較してパラメータ数とFLOPsを約半分に抑えながら、大幅に高い精度(mAP)を達成する。例えば、YOLO26sはわずか950万mAP 48.6mAP を達成する一方、YOLOv6.YOLOv645.0mAP到達するために1850万パラメータを必要とする。
アーキテクチャの詳細
これら二つのモデルの基本的な違いは、予測と最適化へのアプローチにある。
YOLOv6.0: GPU向けに最適化
YOLOv6 はEfficientRepバックボーンYOLOv6 、GPU上で高い並列処理能力を発揮する。アンカーベースとアンカーフリーの両手法を組み合わせたアンカー補助トレーニング戦略を用い、学習の安定化を図っている。3x3畳み込みへの依存度が高いため、NVIDIA などの当該演算を高速化するハードウェアでは驚異的な速度を実現するが、特定の最適化が施されていないCPUやNPUでは計算コストが高くなる可能性がある。
YOLO26: あらゆるプラットフォーム向けに最適化
YOLO26はより汎用的なアプローチを採用しています。分布焦点損失(DFL)モジュールを削除することで出力層が簡素化され、 CoreML や TFLiteといった形式へのエクスポートを容易にします。
エンドツーエンドNMS設計が最大の特長である。従来の物体検出器は数千もの重複する検出領域を出力し、NMSフィルタリングする必要があるが、この処理は遅く、組み込みアクセラレータでの最適化が困難である。YOLO26は学習時に二重割り当て戦略を採用し、モデルが物体ごとに単一の正しい検出領域を予測するよう強制することで、推論時のNMS をNMS 不要としている。
Ultralyticsの利点
YOLOv6.YOLOv6強力なオープンソースリポジトリですが、Ultralytics を選択することで、AIライフサイクル全体を簡素化する包括的なエコシステムへのアクセスが可能になります。
1. シームレスなユーザー体験
Ultralytics 開発者体験をUltralytics 。CLI を使用CLI Python を使用CLI 、最先端モデルのトレーニングはわずか数行のコードで実現できます。この「ゼロからヒーローへ」のワークフローは、複雑な環境設定や手動でのデータフォーマットを必要とする研究リポジトリとは対照的です。
from ultralytics import YOLO
# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer automatically engaged
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
2. 比類なき汎用性
YOLOv6.YOLOv6主に物体検出モデルです。一方、Ultralytics 多様なビジョンタスクをサポートします。プロジェクト要件が検出からインスタンスセグメンテーションや姿勢推定へ移行する場合でも、ワークフローやライブラリを変更せずにタスクを切り替えることが可能です。
3. 訓練効率と記憶
Ultralytics ハードウェア制約を考慮して最適化されています。YOLO26は、従来のアーキテクチャやTransformerベースのハイブリッドモデルと比較して、トレーニング中に一般的に少ないCUDA 必要とします。 RT-DETRなどのトランスフォーマーベースのハイブリッドモデルと比較して、トレーニング時のCUDAメモリ使用量が少ない傾向にあります。これにより、開発者はコンシューマー向けGPU上でより大きなバッチサイズでのトレーニングが可能となり、研究サイクルの加速が図られます。
4. 強固なエコシステム
Ultralytics (旧称HUB)は、データセットの管理、クラウド上でのモデルトレーニング、エッジデバイスへのデプロイを可能にするウェブベースのインターフェースを提供します。 Weights & Biases、MLflowなどの統合機能と組み合わせることで、YOLO26は現代的なMLOpsパイプラインに自然に組み込まれます。
結論: どのモデルを選ぶべきか?
以下の場合にYOLOv6.0を選択してください:
- NVIDIA または V100 GPU 上でのみデプロイしています。
- レガシーパイプラインは、RepVGGアーキテクチャを基に特別に構築されています。
- 貴社のアプリケーションは、CPU 関係のない管理された産業環境における純粋な物体検出です。
YOLO26を選択する場合:
- 多様なハードウェア(CPU、GPU、NPU、モバイル)において、速度と精度の最適なバランスが必要です。
- よりシンプルなデプロイメントロジックのため、エンドツーエンドのNMS推論が必要です。
- あなたは、ラズベリーパイ、ジェトソンナノ、またはスマートフォンといったエッジデバイス上で作業しており、CPU 極めて重要です。
- 将来を見据えたソリューションが必要であり、それは積極的なメンテナンス、ドキュメント、そして活発なコミュニティによって支えられている必要があります。
- あなたのプロジェクトでは、検出に加えてOBBやセグメンテーションといった複雑なタスクが含まれています。
今日、新規プロジェクトを開始するほとんどの開発者や企業にとって、YOLO26は優れた汎用性、使いやすさ、そして性能を提供し、次世代コンピュータビジョンアプリケーションにおける推奨選択肢となっています。
他の高効率モデルを探索したいユーザーには、以下のモデルもおすすめです YOLO11 による堅牢な汎用物体検出や、YOLOによるオープンボキャブラリタスクもご検討ください。