YOLOv6-3.0 vs DAMO-YOLO: リアルタイム物体検出における技術対決
コンピュータビジョンの領域は常に進化しており、新しいアーキテクチャがリアルタイム物体検出の可能性の境界を押し広げています。この分野における注目すべき2つの競合モデルがYOLOv6-3.0とDAMO-YOLOです。どちらのモデルも、産業用ハードウェアでのパフォーマンスを最大化するように設計された独自のアーキテクチャ革新を導入しています。本ガイドでは、これら2つのモデルのアーキテクチャ、学習手法、理想的なユースケースを探り、さらにYOLO26のようなUltralyticsモデルの次世代の利点を紹介し、包括的な技術比較を提供します。
モデルのプロファイル
YOLOv6-3.0: 産業グレードのスループット
MeituanのVision AI部門によって開発されたYOLOv6-3.0は、高スループットの産業用途向けに特別に設計されています。NVIDIA GPUのようなハードウェアアクセラレータでのパフォーマンスを最大化することに重点を置いています。
- 著者: Chuyi Li, Lulu Li, Yifei Geng 他
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
- Docs: Ultralytics YOLOv6 ドキュメント
YOLOv6-3.0は、特徴融合を改善するために双方向連結(BiC)モジュールを導入し、アンカー補助学習(AAT)戦略を利用しています。この戦略は、学習中にアンカーベース検出器とアンカーフリー検出器の両方の利点を組み合わせつつ、推論時は厳密にアンカーフリーを維持するものです。そのEfficientRepバックボーンは、GPUバッチ処理において非常にハードウェアフレンドリーであり、膨大な動画理解データの処理に最適です。
DAMO-YOLO: NASによる高速かつ高精度な検出
Alibaba Groupによって作成されたDAMO-YOLOは、ニューラルアーキテクチャ探索(NAS)を活用して、リアルタイム推論のための最も効率的なバックボーン構造を自動的に発見します。
- 著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, 他
- 組織: Alibaba Group
- 日付: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
DAMO-YOLOは、効率的なマルチスケール特徴融合のためのRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)と、検出ヘッドの計算オーバーヘッドを大幅に削減するZeroHead設計が際立っています。また、精度の向上を図るためにAlignedOTAラベル割り当てと堅牢な知識蒸留技術を組み込んでおり、モデルのパラメータ数を増やすことなく精度を高めています。
DAMO-YOLOは優れた精度を実現していますが、学習中に知識蒸留に大きく依存するため、はるかに大きな「教師」モデルを必要とします。これにより、単純なアーキテクチャと比較して、学習フェーズで必要なCUDAメモリが大幅に増加します。
パフォーマンスの比較
物体検出モデルを評価する際、平均精度(mAP)と推論速度のバランスが極めて重要です。以下に、YOLOv6-3.0とDAMO-YOLOのモデル規模ごとの詳細な比較を示します。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv6-3.0は、TensorRT最適化を活用してNVIDIA GPU上で並外れた速度を示し、特にnanoおよびsmallバリエーションで顕著です。しかし、DAMO-YOLOのNAS最適化されたバックボーンは、中規模および大規模スケールでFLOPsが少なくなる傾向があり、大規模なデプロイメントにおいてわずかなレイテンシの利点をもたらします。
Ultralyticsの優位性: YOLO26の登場
YOLOv6-3.0とDAMO-YOLOは強力なツールですが、開発者は複雑なデプロイメントパイプライン、学習中の高いメモリ要件、柔軟性に欠ける単一タスクのアーキテクチャといった課題に直面することがよくあります。Ultralyticsエコシステムは、大幅に合理化された開発者体験を提供します。
YOLO26のリリースにより、Ultralyticsは最先端のVision AIを再定義しました。2026年1月にリリースされたUltralytics YOLO26は、効率性と汎用性の限界を押し広げます。
YOLO26の主な革新点
- エンドツーエンドのNMSフリー設計: YOLOv10で開拓された概念に基づき、YOLO26はNMS(非最大値抑制)後処理をネイティブで排除します。これにより、レイテンシのばらつきが大幅に減少し、CoreMLやTFLiteを介したエッジデバイスへのデプロイメントが簡素化されます。
- DFLの削除: Distribution Focal Lossを削除することで、YOLO26はエクスポートプロセスを簡素化し、低電力マイクロコントローラやエッジハードウェアとの互換性を大幅に向上させます。
- CPU推論速度が最大43%高速化: 専用のGPUハードウェアを持たないアプリケーション向けに、YOLO26のCPU最適化は比類のない速度を実現し、YOLOv6のようなGPU依存度の高いモデルを凌駕します。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のようなLLM学習手法に触発され、YOLO26はMuSGDオプティマイザ(SGDとMuonのハイブリッド)を採用し、安定した学習と迅速な収束を保証します。
- ProgLoss + STAL: 高度な損失関数が小物体認識を劇的に改善し、YOLO26をドローン運用や遠方のターゲット追跡に最適なものにします。
- マルチタスク対応の汎用性: 厳密に検出器であるDAMO-YOLOとは異なり、YOLO26は単一の統一されたAPI内でインスタンスセグメンテーション、姿勢推定(残差対数尤度推定を使用)、および指向性バウンディングボックス(OBB)をすぐにサポートします。
RT-DETRのような複雑なTransformerアーキテクチャや、DAMO-YOLOのような蒸留を多用するパイプラインとは異なり、Ultralyticsモデルはその低いVRAMフットプリントで知られています。コンシューマグレードのハードウェアでも簡単にYOLO26モデルを学習させることができます。
合理化されたPythonワークフロー
最先端のモデルの学習とデプロイメントに、何百行ものボイラープレートコードは必要ありません。Ultralytics Pythonパッケージは、機械学習のライフサイクルを簡素化します。
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")理想的な使用ケース
適切なアーキテクチャの選択は、デプロイメントの制約に完全に依存します。
YOLOv6-3.0を使用すべき場合
- 高バッチ動画分析: TensorRTを最大限に活用できるエンタープライズGPUサーバー上で、高密度な動画ストリームを処理するのに最適です。
- 産業オートメーション: 品質管理の欠陥検出を行う高速製造ライン。
DAMO-YOLO の使用時期
- カスタムシリコン: 特定の独自のNPUハードウェア向けのニューラルアーキテクチャ探索マッピングの研究。
- 学術研究: リアルタイムネットワークのための新しい知識蒸留技術のベンチマーク。
Ultralytics YOLO26を使用すべきタイミング
- エッジおよびモバイルデプロイメント: NMSフリー設計、DFLの削除、および43%のCPU速度向上により、iOS、Android、Raspberry Pi統合における決定的な勝者となります。
- 迅速なプロトタイピングから本番環境へ: Ultralytics Platformとのシームレスな統合により、チームはデータセットのアノテーションから世界規模のクラウドデプロイメントまでを数ヶ月ではなく数日で完了できます。
- 複雑なビジョンパイプライン: バウンディングボックスの検出と同時に、人間の姿勢キーポイントや正確なセグメンテーションマスクの検出が必要なプロジェクトに最適です。
結論
YOLOv6-3.0とDAMO-YOLOの双方は、リアルタイム物体検出の科学に大きく貢献しました。YOLOv6はGPUの最大活用を洗練させ、DAMO-YOLOは自動化されたアーキテクチャ探索の力を実証しました。
しかし、精度、推論速度、およびエコシステムの保守性の究極の融合を求める開発者にとって、Ultralytics YOLOファミリーは依然として第一の選択肢です。YOLO26で導入された画期的な最適化により、エンタープライズグレードのコンピュータビジョンアプリケーションを作成するための参入障壁はかつてないほど低くなりました。
さらに詳しく知りたい場合は、YOLO11やRT-DETRのようなTransformerベースのアプローチなど、ドキュメント内の他のアーキテクチャとこれらのモデルを比較することもできます。