YOLO YOLOv6.0:産業用物体検出器の包括的比較
コンピュータビジョンの急速な進化により、産業用途に特化した高度に専門化されたアーキテクチャが生み出されている。その中でも、リアルタイム性能と導入効率に焦点を当てた二つの有力な手法が際立っている:YOLOv6である。本ページでは、これらのアーキテクチャ、性能指標、およびトレーニング手法について詳細な技術比較を行い、導入選択肢の検討を支援する。
YOLO: 神経アーキテクチャ探索と物体検出の融合
アリババグループの研究者によって開発されたYOLO 、バックボーン設計にニューラルアーキテクチャ検索(NAS)を高度に統合することで、YOLO に新たなアプローチYOLO 。
- 著者: Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang、Xiuyu Sun
- 組織:Alibaba Group
- 日付: 2022-11-23
- Arxiv:2211.15444v2
- GitHub:tinyvision/DAMO-YOLO
アーキテクチャの革新
YOLO 、特定の遅延制約下で最適なネットワーク構造を自動探索するNAS最適化バックボーン「MAE-NAS」YOLO 。これにより、異なるハードウェア構成間での効率的なモデルスケーリングが保証される。特徴融合の改善のため、本アーキテクチャは効率的なRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)を採用し、マルチスケール表現を大幅に強化している。
さらに、本モデルは「ZeroHead」設計を導入している。検出ヘッド内の複雑なマルチブランチ構造を排除することで、空間情報をより効果的に保持しつつ計算オーバーヘッドを低減する。学習手法ではAlignedOTA(整列最適輸送割り当て)と頑健な知識蒸留を活用し、軽量な生徒モデルが重厚な教師ネットワークから学習することを可能にしている。
蒸留の複雑性
知識蒸留YOLO に寄与する一方、多段階のトレーニングパイプラインを必要とする。これにより、標準的な単一段階モデルのトレーニングと比較して、必要なGPU 大幅に増加する。
YOLOv6.0: 産業用スループットの最大化
美団ビジョンAI部門が開発したYOLOv6.YOLOv6、産業用物体検出器として明示的に位置付けられており、NVIDIA 上での処理能力を最大化するために特別に設計されている。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織:Meituan
- 日付: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
主な機能と強化点
YOLOv6.YOLOv6ハードウェアに優しいEfficientRepバックボーンを基盤として構築されており、 TensorRT などの最適化を最新のGPUで活用する場合に非常に高速です。v3.0では、大小様々な物体の位置特定精度を向上させるため、双方向連結(BiC)モジュールが統合されています。
もう一つの際立った特徴は、アンカー支援学習(AAT)戦略である。AATは、学習時のアンカーベース検出器の安定性と、アンカーフリー設計の推論速度を組み合わせる。このハイブリッドアプローチは、展開レイテンシを犠牲にすることなく優れた収束性を実現し、スマートシティ分析や自動レジシステムにおける大規模な動画ストリーム処理に強力な選択肢となる。
パフォーマンス比較
これらのモデルをリアルタイム推論向けに評価する際には、パラメータ数、FLOPs、精度をバランスさせることが極めて重要です。以下に、それらの性能を比較した詳細な評価を示します。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLO 小規模クラスでわずかな優YOLO (46.0mAP 45.0mAP)一方、YOLOv6.YOLOv6優れたスケーラビリティを発揮し、中規模および大規模クラスで勝利を収めると同時に、ナノ構成において絶対的に最小のパラメータを維持している。
二者択一
ハードウェア環境がバックボーンのカスタマイズに重度の自動検索を許容する場合、YOLOは非常に効果的です。ただし、標準化されたGPU (T4やA100など)に完全に依存している場合、YOLOv6多くの場合、より高い生のFPSに直結します。
ユースケースと推奨事項
YOLOv6 YOLO 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステム上の好みにYOLOv6 。
DAMO-YOLOを選択するタイミング
YOLO 以下に最適YOLO :
- 高スループット動画解析:固定NVIDIA GPU 上で高FPS動画ストリームを処理し、バッチ1スループットを主要指標とする。
- 産業用製造ライン:専用ハードウェア上でGPU 厳しい制約があるシナリオ。例:組立ラインにおけるリアルタイム品質検査。
- ニューラルアーキテクチャ探索研究:自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化バックボーンが検出性能に及ぼす影響の検討。
YOLOv6を選択すべき時
YOLOv6 以下に推奨YOLOv6 :
- 産業用ハードウェア対応デプロイメント:モデルのハードウェア対応設計と効率的な再パラメータ化により、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
- 高速シングルステージ検出:制御された環境におけるリアルタイム動画処理GPU 上での生の推論速度を優先するアプリケーション。
- 美団エコシステム統合: 美団のテクノロジースタックおよびデプロイメントインフラストラクチャ内で既に稼働しているチーム。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
Ultralytics :YOLO26のご紹介
YOLO YOLOv6YOLO 高性能である一方、断片化されたエコシステム、単一タスクへの制約、複雑なデプロイメントパイプラインといった課題を抱えています。現代のエンジニアリングチームにとって、Ultralytics 開発者体験を大幅に改善し、画期的なYOLO26の実現に至っています。
2026年1月にリリースされたYOLO26は、エッジおよびクラウド展開における新たな標準となり、メモリ要件と計算効率を大幅に最適化しています。
YOLO26を選ぶ理由
- エンドツーエンドのNMS:YOLOv10の概念を基盤とし、YOLO26はノンマキシマム抑制後処理をネイティブに排除します。これにより、デプロイメントコードが大幅に簡素化され、全てのエッジデバイスにおける推論遅延のばらつきが低減されます。
- 優れた最適化:YOLO26はMuSGDオプティマイザーを採用している。これはSGD ミューオン(大規模言語モデルに着想を得た)のハイブリッドであり、極めて安定したトレーニング実行とより速い収束をもたらす。
- ハードウェアの汎用性: DFL除去(分布焦点損失)を実装することで出力ヘッドが簡素化され、エッジデバイスの互換性が向上します。実際、YOLO26 CPU 最大43%高速化し、モバイルやIoTエッジYOLOv6 大幅に凌駕します。
- 精度向上: ProgLoss + STALの採用により、YOLO26は微小物体検出において劇的な改善を実現し、航空写真や欠陥検査に最適な選択肢となっています。
- 比類なき汎用性:境界ボックスのみを扱う産業用モデルとは異なり、YOLO26ファミリーは画像分類、インスタンスセグメンテーション、姿勢推定、向き付き境界ボックス(OBB)を含むマルチモーダルタスクをサポートします。
シームレスなエコシステム体験
Ultralytics 機械学習ライフサイクル全体を変革します。モデルのトレーニングはもはや多段階の蒸留という頭痛の種ではありません。自動データ拡張、統一されたハイパーパラメータ調整、ワンクリックでのONNXなどの形式へのエクスポートにより ONNX、 OpenVINO、CoreMLなどの形式へのワンクリックエクスポートにより、データセットから本番環境への移行が数週間ではなく数時間で実現します。
さらに、Ultralytics メモリ効率に優れており、Transformerアーキテクチャを悩ませる巨大なVRAMボトルネックを回避します。 RT-DETRなどのトランスフォーマーアーキテクチャに存在する巨大なVRAMボトルネックを回避します。
クイックスタートコードの例
Ultralytics (YOLO26など)を用いたトレーニングと推論は驚くほどシンプルです。以下のPython は、わずか数行のコードで即座に物体追跡を開始する方法を示しています:
from ultralytics import YOLO
# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")
# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)
結論
YOLO YOLOv6YOLO ずれも、産業用物体検出の限界を押し広げる印象的な技術的偉業である。しかし、これらは高度に専門化されたツールであり、複雑な設定や厳格なハードウェア制約を必要とすることが多い。
完璧な性能バランス、マルチタスク能力、そして活発に維持管理されるエコシステムを求める開発者や研究者にとって、Ultralytics YOLO26は比類のない存在です。LLMに着想を得た最適化手法と、NMSクリーンなアーキテクチャを融合させることで、YOLO26はAIデプロイメントを簡素化すると同時に、エッジ環境とクラウド環境の両方で最先端の精度を実現します。
新しいコンピュータビジョンプロジェクト向けにモデルを評価している場合、Ultralyticsの機能を探索することを強くお勧めします。 Ultralytics YOLO エコシステムの機能を検討されることを強くお勧めします。また、EfficientDetのような他のアーキテクチャや、YOLO11 といった過去の成果と比較することも、リアルタイムビジョンAIの進化を把握する上で有益でしょう。