DAMO-YOLO 対 PP-YOLOE+: 詳細な技術比較
リアルタイムコンピュータビジョンの競争が激しい環境において、特定の導入ニーズに最適なアーキテクチャを選択することは極めて重要です。本ガイドでは、DAMO-YOLOとPP-YOLOE+の包括的な技術比較を提供し、両モデルのアーキテクチャ設計、トレーニング手法、性能指標を詳細に分析します。さらに、新たにUltralytics 26などの最先端ソリューションとの比較評価も行います。
モデルの概要
両方のフレームワークは2022年に、洗練された技術を活用して精度と推論速度の限界を押し広げ、産業用途向けの強力な代替手段として登場しました。
DAMO-YOLO
Alibaba Groupによって開発されたDAMO-YOLOは、自動探索技術と高度な特徴融合に大きく依存し、レイテンシと精度のトレードオフを最適化するためのいくつかの新しい技術を導入しました。
- 著者:徐賢哲、江一琪、陳偉華、黄一倫、張元、孫秀宇
- 組織:アリババグループ
- 日付: 2022年11月23日
- Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
- GitHub:YOLO
- ドキュメント: DAMO-YOLO README
DAMO-YOLOは、ハードウェア効率に最適化されたバックボーンを自動的に設計するために、Multi-Scale Architecture Search (MAE-NAS) を採用しています。また、ネック部の特徴融合には効率的なRepGFPN (Re-parameterized Generalized Feature Pyramid Network) を、軽量な「ZeroHead」設計を特徴としています。さらに、トレーニング中に蒸留技術を多用することで、学生モデルの表現力を高めています。
PP-YOLOE+
百度 PaddlePaddle によるPP-YOLOE+は、PP-YOLOEアーキテクチャの段階的アップグレード版です。大規模な事前学習と洗練された損失関数に焦点を当て、特にネイティブの深層学習フレームワーク内で高いmAPを実現します。
- 著者: PaddlePaddle Authors
- 組織: Baidu
- 日付: 2022-04-02
- Arxiv: PP-YOLOE: YOLOの進化版
- GitHub:PaddlePaddle
- ドキュメント: PP-YOLOE+ 設定
PP-YOLOE+はCSPRepResNetバックボーンとET-head(効率的なタスク整合ヘッド)を採用している。「プラス」バージョンではObjects365データセット上で強力な事前学習戦略を導入し、多様な実環境における汎化能力を大幅に向上させている。
アーキテクチャの比較
これら2つのモデルの設計思想の相違は、その理想的な使用ケースとハードウェア互換性に大きく影響する。
特徴融合とバックボーン
DAMO-YOLOのMAE-NASによって生成されたバックボーンは、エッジデバイスに高度に特化しており、多くの場合、良好な速度対パラメータ比を提供します。しかし、これらのカスタムアーキテクチャは、instance segmentationのような新しいタスクに適応させるのが困難で複雑になる可能性があります。RepGFPNネックはマルチスケール特徴融合を改善しますが、再パラメータ化エクスポート段階で複雑さを増します。
PP-YOLOE+は、より伝統的でありながら非常に効果的なCSPRepResNetを基盤としています。このバックボーンは、同等の精度YOLO 多くのパラメータを必要としますが、学習が非常に安定しており、既存のパイプラインへの統合が容易です。そのETヘッドは分類と回帰を効率的に処理しますが、それでも非最大抑制(NMS)などの後処理ステップが必要です。
後処理の遅延を排除する
DAMO-YOLOとPP-YOLOE+はどちらも、バウンディングボックスの後処理にNMSを必要とします。推論レイテンシが重要である場合、ネイティブなエンドツーエンドNMSフリー設計を特徴とするUltralytics YOLO26の使用を検討してください。この画期的なアプローチにより、NMSの後処理が不要になり、より高速でシンプルなデプロイメントパイプラインが実現します。
パフォーマンスとメトリクスの分析
これらのモデルを実運用で評価する際には、精度(mAP)、推論速度、パラメータサイズのバランスが極めて重要である。以下に主要なバリエーションの直接比較を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
表が示すように、DAMO-YOLOはNAS最適化されたバックボーンのおかげで、一般的に小規模(s)および極小規模(t)において低レイテンシーを達成します。しかし、PP-YOLOE+は中規模(m)および大規模(l)の層で驚くほど優れたスケーリングを発揮し、T4 TensorRTの速度にはわずかなコストがかかりますが、著しく高いmAPスコアを誇ります。
メモリ要件とトレーニング効率
DAMO-YOLOが蒸留に依存しているということは、小規模な生徒モデルをトレーニングする前に、はるかに大規模な教師モデルをトレーニングする必要があることを意味します。これにより、CUDA memory requirementsと全体の計算予算が大幅に増加します。PP-YOLOE+は標準的な単一ステージトレーニングでこれを簡素化しますが、PaddlePaddleフレームワークに密接に結合されたままであり、これはPyTorchに慣れているチームにとって柔軟性を制限する可能性があります。
対照的に、最新のUltralytics YOLO26モデルはこれらのボトルネックを解決します。LLMトレーニングの革新に触発されたSGDとMuonのハイブリッドである新しいMuSGD Optimizerを利用することで、YOLO26は複雑な蒸留パイプラインを必要とせずに、より速い収束と非常に安定したトレーニングを実現します。さらに、YOLOモデルは通常、RT-DETRのようなトランスフォーマーベースのdetect器と比較して、トレーニング中に必要なCUDAメモリがはるかに少なくなります。
実世界での応用例と理想的な使用事例
YOLOの使用タイミング
DAMO-YOLOは、レイテンシーが究極のボトルネックとなる高スループットのエッジ推論に最適です。エンジニアリングチームが複雑な蒸留および再パラメータ化プロセスを管理する能力がある場合、その小型バリアントは交通管理システムや基本的なドローン監視のような環境で優れた性能を発揮します。
PP-YOLOE+の使用タイミング
PP-YOLOE+は、既に百度エコシステムに深く投資している場合や大規模なサーバー展開を実行している場合に真価を発揮します。その優れたmAP 、複雑な医療画像解析や高密度な製造欠陥検出 mAP 。
Ultralyticsの利点
YOLO はいずれも特定の局所的な利点を提供しますが、最大限の汎用性、速度、使いやすさを求める開発者は一貫してUltralytics を選択します。
コンピュータビジョンパイプラインをアップグレードする際、Ultralytics 比類のない開発者体験を提供します:
- 最大43%高速なCPU推論: Distribution Focal Loss (DFL) の完全な除去により、YOLO26はエッジCPUおよび低電力IoTデバイス上で驚くほど高速です。
- 小物体検出の改善: ProgLossとSTAL損失関数の統合により、小物体認識が劇的に改善され、航空画像にとって不可欠です。
- 優れた汎用性: detectに厳密に焦点を当てたPP-YOLOE+とは異なり、YOLO26はタスク固有のアーキテクチャ改善により、姿勢推定、oriented bounding boxes (obb)、およびセマンティックセグメンテーションをシームレスに処理します。
結論
DAMO-YOLOとPP-YOLOE+は、アンカーフリー物体検出の進化における重要なマイルストーンを表しています。DAMO-YOLOはエッジレイテンシのためのニューラルアーキテクチャ探索の限界を押し広げ、PP-YOLOE+は大規模事前学習の力を示しました。
ただし、速度、精度、デプロイの簡便性の最適なバランスを求める開発者にとって、Ultralytics モデルが決定的な選択肢です。NMSアーキテクチャ、Python 、および Weights & Biases や TensorRT とのシームレスな連携により、プロジェクトがプロトタイプから本番環境へ円滑に移行することを保証します。
始めましょうか?Ultralytics ガイドを閲覧するか、YOLO11 YOLOYOLO11 概要でさらに多くのモデルを比較してください。