DAMO-YOLO 対 YOLOv6-3.0: 産業用物体検出器の包括的な比較

コンピュータビジョンの急速な進化により、産業用途に特化した高度に専門化されたアーキテクチャが生み出されている。その中でも、リアルタイム性能と導入効率に焦点を当てた二つの有力な手法が際立っている：YOLOv6である。本ページでは、これらのアーキテクチャ、性能指標、およびトレーニング手法について詳細な技術比較を行い、導入選択肢の検討を支援する。

DAMO-YOLO: ニューラルアーキテクチャ探索と物体detect

Alibaba Groupの研究者によって開発されたDAMO-YOLOは、バックボーン設計にニューラルアーキテクチャ探索（NAS）を深く統合することで、YOLOファミリーに新しいアプローチを導入しています。

著者: Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang、Xiuyu Sun
組織:Alibaba Group
日付: 2022-11-23
Arxiv:2211.15444v2
GitHub:tinyvision/DAMO-YOLO

アーキテクチャの革新

DAMO-YOLOは、特定のレイテンシ制約の下で最適なネットワーク構造を自動的に探索するMAE-NASというNAS最適化バックボーンを利用しています。これにより、モデルは異なるハードウェアプロファイル間で効率的にスケールすることが保証されます。特徴融合を改善するために、このアーキテクチャはEfficient RepGFPN（Reparameterized Generalized Feature Pyramid Network）を採用しており、マルチスケール表現を大幅に強化しています。

さらに、本モデルは「ZeroHead」設計を導入している。検出ヘッド内の複雑なマルチブランチ構造を排除することで、空間情報をより効果的に保持しつつ計算オーバーヘッドを低減する。学習手法ではAlignedOTA（整列最適輸送割り当て）と頑健な知識蒸留を活用し、軽量な生徒モデルが重厚な教師ネットワークから学習することを可能にしている。

DAMO-YOLOの詳細

蒸留の複雑性

知識蒸留YOLO に寄与する一方、多段階のトレーニングパイプラインを必要とする。これにより、標準的な単一段階モデルのトレーニングと比較して、必要なGPU 大幅に増加する。

YOLOv6.0: 産業用スループットの最大化

美団ビジョンAI部門が開発したYOLOv6.YOLOv6、産業用物体検出器として明示的に位置付けられており、NVIDIA 上での処理能力を最大化するために特別に設計されている。

著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
組織:Meituan
日付: 2023-01-13
Arxiv:2301.05586
GitHub:meituan/YOLOv6

主な機能と強化点

YOLOv6.YOLOv6ハードウェアに優しいEfficientRepバックボーンを基盤として構築されており、 TensorRT などの最適化を最新のGPUで活用する場合に非常に高速です。v3.0では、大小様々な物体の位置特定精度を向上させるため、双方向連結（BiC）モジュールが統合されています。

もう1つの際立った特徴は、アンカー支援トレーニング（AAT）戦略です。AATは、トレーニング中のアンカーベース検出器の安定性と、アンカーフリー設計の推論速度を組み合わせています。このハイブリッドアプローチは、デプロイのレイテンシを犠牲にすることなく優れた収束をもたらし、スマートシティ分析や自動チェックアウトシステムにおける大規模なビデオストリーム処理のための強力な選択肢となります。

YOLOv6について詳しくはこちら

パフォーマンス比較

これらのモデルをリアルタイム推論向けに評価する際には、パラメータ数、FLOPs、精度をバランスさせることが極めて重要です。以下に、それらの性能を比較した詳細な評価を示します。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLO 小規模クラスでわずかな優YOLO （46.0mAP 45.0mAP）一方、YOLOv6.YOLOv6優れたスケーラビリティを発揮し、中規模および大規模クラスで勝利を収めると同時に、ナノ構成において絶対的に最小のパラメータを維持している。

両者の選択

ハードウェア環境がバックボーンのカスタマイズに重度の自動検索を許容する場合、YOLOは非常に効果的です。ただし、標準化されたGPU （T4やA100など）に完全に依存している場合、YOLOv6多くの場合、より高い生のFPSに直結します。

ユースケースと推奨事項

DAMO-YOLOとYOLOv6のどちらを選択するかは、特定のプロジェクト要件、デプロイ制約、およびエコシステムの好みに依存します。

DAMO-YOLOを選択するタイミング

DAMO-YOLOは以下のような場合に強力な選択肢となります。

高スループットビデオ分析: バッチ1スループットが主要な指標となる、固定のNVIDIA GPUインフラストラクチャ上での高FPSビデオストリーム処理。
産業用製造ライン: 組立ラインでのリアルタイム品質検査など、専用ハードウェアにおける厳格なGPUレイテンシー制約があるシナリオです。
ニューラルアーキテクチャ探索研究: 自動化されたアーキテクチャ探索（MAE-NAS）と効率的な再パラメータ化されたバックボーンがdetect性能に与える影響を研究しています。

YOLOv6を選択すべき時

YOLOv6 以下に推奨YOLOv6 ：

産業用ハードウェア対応デプロイメント: モデルのハードウェア対応設計と効率的な再パラメータ化により、特定のターゲットハードウェアで最適化されたパフォーマンスを提供するシナリオです。
高速シングルステージdetect: 制御された環境でのリアルタイムビデオ処理のために、GPUでの生の推論速度を優先するアプリケーション。
美団エコシステム統合: 美団の技術スタックとデプロイメントインフラストラクチャ内で既に作業しているチーム。

Ultralytics YOLO26）を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。

NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。

Ultralytics ：YOLO26のご紹介

YOLO YOLOv6YOLO 高性能である一方、断片化されたエコシステム、単一タスクへの制約、複雑なデプロイメントパイプラインといった課題を抱えています。現代のエンジニアリングチームにとって、Ultralytics 開発者体験を大幅に改善し、画期的なYOLO26の実現に至っています。

2026年1月にリリースされたYOLO26は、エッジおよびクラウド展開における新たな標準となり、メモリ要件と計算効率を大幅に最適化しています。

YOLO26を選ぶ理由

エンドツーエンドNMSフリー設計: YOLOv10の概念に基づいて構築されたYOLO26は、Non-Maximum Suppressionの後処理をネイティブに排除します。これにより、デプロイメントコードが大幅に簡素化され、すべてのエッジデバイスにおける推論レイテンシのばらつきが低減されます。
優れた最適化: YOLO26は、SGDとMuon（大規模言語モデルに触発された）のハイブリッドであるMuSGD Optimizerを採用しており、これにより、非常に安定した訓練実行と高速な収束が得られます。
ハードウェアの汎用性: DFL Removal (Distribution Focal Loss) を実装することで出力ヘッドが簡素化され、エッジデバイスとの互換性が向上します。実際、YOLO26は最大43%高速なCPU推論を実現し、モバイルまたはIoTエッジ環境においてYOLOv6よりもはるかに優れています。
精度向上: ProgLoss + STALを活用することで、YOLO26は小オブジェクト検出において劇的な改善を見せ、航空画像や欠陥検査に最適な選択肢となります。
比類ない汎用性: バウンディングボックスのみを行う産業用モデルとは異なり、YOLO26ファミリーは画像分類、インスタンスsegment、姿勢推定、Oriented Bounding Boxes (obb)を含むマルチモーダルタスクをサポートしています。

YOLO26についてさらに詳しく

シームレスなエコシステム体験

Ultralytics 機械学習ライフサイクル全体を変革します。モデルのトレーニングはもはや多段階の蒸留という頭痛の種ではありません。自動データ拡張、統一されたハイパーパラメータ調整、ワンクリックでのONNXなどの形式へのエクスポートにより ONNX、 OpenVINO、CoreMLなどの形式へのワンクリックエクスポートにより、データセットから本番環境への移行が数週間ではなく数時間で実現します。

さらに、Ultralyticsモデルはメモリ効率が高いことで知られており、RT-DETRのようなトランスフォーマーアーキテクチャを悩ませる大規模なVRAMボトルネックを回避します。

クイックスタートコードの例

Ultralytics （YOLO26など）を用いたトレーニングと推論は驚くほどシンプルです。以下のPython は、わずか数行のコードで即座に物体追跡を開始する方法を示しています：

from ultralytics import YOLO

# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)

結論

DAMO-YOLOとYOLOv6-3.0はどちらも、産業用物体検出の限界を押し広げる印象的なエンジニアリングの偉業です。しかし、これらは高度に専門化されたツールであり、多くの場合、複雑なセットアップと厳格なハードウェア制約を必要とします。

完璧なパフォーマンスバランス、マルチタスク機能、そして活発に維持管理されているエコシステムを求める開発者や研究者にとって、Ultralytics YOLO26は比類のない存在です。LLMにインスパイアされたオプティマイザーと、クリーンでNMSフリーのアーキテクチャを融合することで、YOLO26はAIデプロイメントを簡素化しつつ、エッジおよびクラウド環境全体で最先端の精度を実現します。

新しいコンピュータビジョンプロジェクト向けにモデルを評価している場合、Ultralyticsの機能を探索することを強くお勧めします。 Ultralytics YOLO エコシステムの機能を検討されることを強くお勧めします。また、EfficientDetのような他のアーキテクチャや、YOLO11 といった過去の成果と比較することも、リアルタイムビジョンAIの進化を把握する上で有益でしょう。