コンテンツにスキップ

YOLO11 vs DAMO-YOLO:技術比較

急速に進化するコンピュータビジョンにおいて、適切な物体検出モデルを選択することはプロジェクトの成功に不可欠です。このページでは Ultralytics YOLO11YOLO-YOLOの詳細な技術比較を紹介します。DAMO-YOLO 学術研究の革新的な技術を導入しているのに対し、YOLO11 堅牢なエコシステムに支えられた汎用性の高い量産可能なソリューションとして際立っています。

エグゼクティブ・サマリー

Ultralytics YOLO11は、エッジデバイスからクラウドサーバーまで、多様なハードウェアにわたってリアルタイム推論を最適化する、YOLO シリーズの最新の進化形です。検出、セグメンテーション、ポーズ推定など複数のタスクをネイティブにサポートし、複雑なAIパイプラインのための統合ソリューションとなっています。

アリババ・グループによって開発されたDAMO-YOLO、ニューラル・アーキテクチャー・サーチ(NAS)と新しい特徴フュージョン技術を使用して、検出速度と精度のバランスに重点を置いている。DAMO-YOLOは、主にGPU スループットに最適化された研究指向の検出器です。

Ultralytics YOLO11

著者Glenn Jocher, Jing Qiu
組織:Ultralytics
日付:2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 、高効率を維持しながら特徴抽出を強化するアーキテクチャの改良を導入することで、最先端技術に磨きをかけています。改良型CSPNetバックボーンと先進のアンカーフリーヘッドを採用し、前世代と比較して少ないパラメータで優れた精度を実現している。

主な機能と強み

  • 汎用性:多くの特殊モデルと異なり、YOLO11 11はマルチタスクフレームワークである。オブジェクト検出インスタンス分割画像分類ポーズ推定オリエンテッドバウンディングボックス(OBB)をサポートする。
  • 洗練されたアーキテクチャ:C3k2ブロックとC2PSA(Cross-Stage Partial with Spatial Attention)モジュールを組み込み、複雑なパターンを効果的に捉え、小さな物体や困難な背景に対するパフォーマンスを向上。
  • 幅広いハードウェアをサポート以下に最適化 CPUおよびGPU 推論に最適化されており、Raspberry Piから NVIDIA A100クラスタまでの制約に適合する多様なモデルスケール(NanoからX-Large)を提供します。
  • 使いやすさ: Ultralytics Python APIとCLI 、開発者は最小限のコードでモデルのトレーニング、検証、デプロイを行うことができます。

生産準備エコシステム

YOLO11 Ultralytics エコシステムとシームレスに統合されており、データ管理のためのツール、Ultralytics HUBを介したモデルトレーニング、以下のようなフォーマットへのワンクリックでのエクスポートが可能です。 ONNX, TensorRTやCoreMLフォーマットへのワンクリックでのエクスポートが可能です。

YOLO11の詳細について。

DAMO-YOLO

著者Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
Organization:Alibaba Group
Date:2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO

DAMO-YOLO 、産業用アプリケーション向けの低レイテンシーと高スループットに重点を置いて設計されている。スピードと精度のトレードオフの限界を押し広げるために、YOLO ファミリーにいくつかの「新技術」コンポーネントを導入している。

建築イノベーション

  • MAE-NASバックボーン:平均絶対誤差(MAE)によって導かれるニューラル・アーキテクチャ・サーチ(NAS)を利用して、効率的なネットワーク・トポロジを自動的に発見する。
  • 効率的なRepGFPN:再パラメータ化を採用した一般化特徴ピラミッドネットワーク(GFPN)。学習時には複雑な特徴の融合を可能にし、推論時にはより高速でシンプルな構造に縮退する。
  • ZeroHead:分類と回帰のタスクを分離し、最終出力層の計算オーバーヘッドを大幅に削減する軽量な検出ヘッド。
  • AlignedOTA:学習中の分類信頼度と回帰精度のずれを解決する、強化されたラベル割り当て戦略。

YOLO -YOLOは特定のメトリクスに秀でているが、主に研究用のリポジトリである。Ultralytics エコシステムに見られるような、広範なドキュメント、継続的なアップデート、幅広いコミュニティサポートはありません。

DAMO-YOLOの詳細

パフォーマンス指標直接対決

以下の表は、COCO val2017データセットにおける YOLO11 YOLO -YOLOの性能を比較したものである。主な指標は、CPU GPU ハードウェアにおける平均平均精度mAP)と推論速度である。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

結果の分析

  1. 効率の優位性: YOLO11 優れたパラメータ効率を示している。例えば、YOLO11mモデルは、わずか2,010万パラメータで5,150mAP達成しているのに対し、DAMO-YOLOmモデルは、2,820万パラメータと大きなフットプリントで、4,920mAP 遅れをとっている。
  2. 究極の精度:最大のバリエーションであるYOLO11xは54.7mAP達し、リストにあるDAMO-YOLO 最大モデルを凌ぐ。このため、YOLO11 11は、医療画像や欠陥検出のような高精度の作業に適した選択肢となっている。
  3. エッジ展開: YOLO11n(Nano)モデルは、非常に軽量(2.6Mパラメータ)で高速(T4で1.5ms)であるため、メモリが乏しい組み込みシステムに最適です。対照的に、最小のDAMOYOLO YOLOモデルはかなり重い(8.5M params)。
  4. CPU パフォーマンス: Ultralytics 透過的なCPU ベンチマークを提供し、YOLO11専用アクセラレータを使用しないデプロイメントで実行可能であることを強調している。YOLO -YOLOはCPU 速度を公式に報告していないため、低消費電力IoTアプリケーションの評価が制限される。

テクニカル・ディープ・ダイブ

トレーニングと建築

DAMO-YOLO 、そのバックボーンを定義するためにニューラル・アーキテクチャー・サーチ(NAS)に大きく依存している。これによって理論的に最適な構造を得ることができる反面、不規則なブロックになることが多く、すべてのデバイスでハードウェアフレンドリーでない可能性がある。対照的に、YOLO11 、標準的な GPUおよびCPU アクセラレーション・ライブラリ用に直感的に設計されています。

YOLO11 トレーニングの効率も重視している。最適化されたハイパーパラメータとデータ増強戦略により、収束が速い。学習時に必要なメモリは、複雑な変換器ベースやNASベースのアーキテクチャよりも一般的に少なく、研究者はコンシューマーグレードのハードウェアで効果的なモデルを学習することができる。

エコシステムとユーザビリティ

最も大きな差別化要因のひとつは、エコシステムである。DAMO-YOLO 、主に研究論文の結果を再現するためのコードリポジトリである。

しかし、Ultralytics YOLO1111はフルサービスのプラットフォームである:

  • ドキュメント:パイプラインのあらゆる側面に関する包括的なガイド。
  • 統合: MLFlowTensorBoard、TensorBoardのネイティブサポート Weights & Biases実験トラッキング
  • コミュニティ: GitHubとDiscord上の大規模で活発なコミュニティにより、バグは迅速に修正され、質問には確実に回答される。
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

推奨ユースケース

Ultralytics YOLO11を選択する場合

  • 実世界での展開:多様なハードウェア(iOSAndroid、EdgeTPU、Jetson)に展開する必要がある場合、YOLO11エクスポート機能は比類のないものです。
  • 複雑なビジョンパイプライン:オブジェクトの追跡や 体のポーズの推定など、バウンディングボックス以上のものが必要な場合、YOLO11 11はこれらをネイティブに処理します。
  • 迅速なプロトタイピング:使い勝手が良いので、開発者はデータから動作するデモまで数分で行うことができます。
  • リソースの制約:ナノとスモールのモデルは、バッテリー駆動のデバイスに最適な精度対サイズ比を提供します。

DAMO-YOLOを検討する場合

  • 学術研究:物体検出や再パラメータ化技術におけるNASの有効性を研究している研究者は、DAMO-YOLO 貴重なベースラインとなるかもしれない。
  • 特定のGPU セットアップ:DAMO-YOLO 特定のアーキテクチャー・ブロックがターゲット・アクセラレータのキャッシュ階層と完全に一致するシナリオでは、競争力のあるスループットを提供できるかもしれない。

結論

DAMO-YOLO MAE-NASやRepGFPNのような印象的な学術的概念を紹介する一方で、 Ultralytics YOLO11は、依然として大多数の開発者や企業にとって優れた選択肢である。最先端の精度、軽量アーキテクチャ、盛んなエコシステムの組み合わせにより、プロジェクトはパフォーマンスだけでなく、保守性や拡張性も保証される。

YOLO11 、信頼性、汎用性、高性能のコンピュータ・ビジョン・ソリューションを求める開発者に、2025年以降の成功に必要なツールと指標を提供します。

その他のモデル比較

物体検出モデルの状況をさらに理解するために、これらの関連する比較を調べてみよう:


コメント