Link to this sectionDAMO-YOLO 対 PP-YOLOE+#

競争の激しいリアルタイム・コンピュータビジョンの分野において、特定のデプロイメント・ニーズに最適なアーキテクチャを選択することは極めて重要です。本ガイドでは、DAMO-YOLOと**PP-YOLOE+**を網羅的に技術比較し、アーキテクチャ設計、トレーニング手法、およびパフォーマンス指標を詳細に解説します。また、これらのモデルが新しくリリースされたUltralytics YOLO26のような最先端のソリューションと比較してどのような立ち位置にあるのかについても検証します。

Link to this sectionモデルの概要#

どちらのフレームワークも2022年に登場し、産業用途における強力な代替手段として、高度な技術を駆使して精度と推論速度の限界を押し広げています。

Link to this sectionDAMO-YOLO#

Alibaba Groupによって開発されたDAMO-YOLOは、レイテンシと精度のトレードオフを最適化するためにいくつかの新しい手法を導入しており、自動検索技術と高度な特徴融合に大きく依存しています。

著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
組織: Alibaba Group
日付: 2022-11-23
Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
GitHub: tinyvision/DAMO-YOLO
ドキュメント: DAMO-YOLO README

DAMO-YOLOは、ハードウェア効率を最適化するバックボーンを自動設計するために、Multi-Scale Architecture Search (MAE-NAS) を採用しています。また、ネック部分の特徴融合には効率的なRepGFPN (Re-parameterized Generalized Feature Pyramid Network) を、ヘッド部分には軽量な「ZeroHead」設計を採用しています。さらに、トレーニング中に蒸留技術を多用することで、生徒モデルの表現能力を向上させています。

DAMO-YOLOの詳細はこちら

Link to this sectionPP-YOLOE+#

BaiduのPaddlePaddleチームによるPP-YOLOE+は、PP-YOLOEアーキテクチャのインクリメンタルなアップグレード版です。大規模な事前トレーニングと洗練された損失関数に焦点を当て、特に独自のディープラーニング・フレームワーク内において高いmAPを実現します。

著者: PaddlePaddle Authors
組織: Baidu
日付: 2022-04-02
Arxiv: PP-YOLOE: An evolved version of YOLO
GitHub: PaddlePaddle/PaddleDetection
ドキュメント: PP-YOLOE+ Configs

PP-YOLOE+は、CSPRepResNetバックボーンとET-head (Efficient Task-aligned head) を活用しています。「プラス」バージョンでは、Objects365データセットに対する強力な事前トレーニング戦略が導入されており、多様な実世界の環境に対する汎化能力が大幅に向上しています。

PP-YOLOE+の詳細はこちら

Link to this sectionアーキテクチャの比較#

これら2つのモデルの設計哲学の相違は、その理想的なユースケースとハードウェア互換性に大きな影響を与えています。

Link to this section特徴融合とバックボーン#

DAMO-YOLOのMAE-NASによって生成されたバックボーンはエッジデバイスに高度に適合しており、多くの場合、速度とパラメータの良好な比率を提供します。しかし、これらのカスタムアーキテクチャは柔軟性に欠ける場合があり、インスタンスセグメンテーションのような新しいタスクへの適応は複雑になる可能性があります。RepGFPNネックはマルチスケールの特徴融合を改善しますが、再パラメータ化の書き出し段階での複雑さが増します。

PP-YOLOE+は、より伝統的でありながら非常に効果的なCSPRepResNetに依存しています。このバックボーンは同等の精度に対してDAMO-YOLOよりも多くのパラメータを必要としますが、トレーニングが非常に安定しており、既存のパイプラインへの統合が容易です。そのET-headは分類と回帰を効率的に処理しますが、依然としてNon-Maximum Suppression (NMS) のような後処理ステップを必要とします。

後処理の遅延を排除する

DAMO-YOLOとPP-YOLOE+はどちらもバウンディングボックスの後処理にNMSを必要とします。推論レイテンシが重要な場合は、ネイティブなエンドツーエンドNMSフリー設計を特徴とするUltralytics YOLO26の使用を検討してください。この革新的なアプローチはNMSの後処理を排除し、より高速でシンプルなデプロイメント・パイプラインを実現します。

Link to this section性能と指標の分析#

これらのモデルを本番環境向けに評価する際には、精度 (mAP)、推論速度、およびパラメータサイズのバランスが極めて重要です。以下は、主要なバリアントの直接比較です。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

表が示すように、DAMO-YOLOはNAS最適化されたバックボーンのおかげで、一般的に小 (s) および極小 (t) スケールでより低いレイテンシを達成します。しかし、PP-YOLOE+は中 (m) および大 (l) の階層で非常に優れたスケーリングを発揮し、T4 TensorRT速度ではわずかに劣るものの、大幅に高いmAPスコアを誇ります。

Link to this sectionメモリ要件とトレーニング効率#

DAMO-YOLOは蒸留に依存しているため、小さな生徒モデルをトレーニングする前に、多くの場合、はるかに大きな教師モデルをトレーニングする必要があります。これはCUDAメモリ要件と全体の計算予算を大幅に増加させます。PP-YOLOE+は標準的な単一ステージのトレーニングでこれを簡素化していますが、PaddlePaddleフレームワークと密接に結合されているため、PyTorchに慣れたチームにとっては柔軟性が制限される可能性があります。

対照的に、最新のUltralytics YOLO26モデルはこれらのボトルネックを解消します。LLMトレーニングの革新に触発されたSGDとMuonのハイブリッドである新しいMuSGD Optimizerを活用することで、YOLO26は複雑な蒸留パイプラインを必要とせずに、より高速な収束と非常に安定したトレーニングを実現します。さらに、YOLOモデルは、RT-DETRのようなTransformerベースの検出器と比較して、トレーニング中のCUDAメモリ消費量が大幅に少ない傾向があります。

Link to this section実環境での応用と理想的なユースケース#

Link to this sectionDAMO-YOLOの用途#

DAMO-YOLOは、レイテンシが最大のボトルネックとなる高スループットのエッジ推論に最適です。そのエンジニアリングチームに複雑な蒸留や再パラメータ化プロセスを管理する余裕があるならば、交通管理システムや基本的なドローン監視のような環境で、その小さなバリアントは優れた性能を発揮します。

Link to this sectionPP-YOLOE+の使用時期#

PP-YOLOE+は、すでにBaiduエコシステムに深く投資している場合や、大規模なサーバーデプロイメントを実行している場合に輝きを放ちます。その印象的なmAPは、複雑な医療画像解析や緻密な製造業の欠陥検出に適しています。

Link to this sectionUltralyticsの利点#

DAMO-YOLOとPP-YOLOE+はそれぞれ特定の局所的な利点を提供しますが、最大限の汎用性、速度、および使いやすさを求める開発者は、一貫してUltralytics Platformを選択しています。

コンピュータビジョンのパイプラインをアップグレードする際、Ultralytics YOLO26は他に類を見ない開発者体験を提供します：

CPU推論を最大43%高速化： Distribution Focal Loss (DFL) を完全に排除したことで、YOLO26はエッジCPUや低電力のIoTデバイス上で驚異的な高速化を実現しています。
小物体検出の改善： ProgLossとSTAL損失関数の統合により、小物体認識が劇的に向上し、航空画像において不可欠な役割を果たします。
広範な汎用性： 検出のみに特化したPP-YOLOE+とは異なり、YOLO26は姿勢推定、指向性バウンディングボックス (OBB)、およびセマンティックセグメンテーションを、タスク固有のアーキテクチャ改善によりシームレスに処理します。

Link to this section結論#

DAMO-YOLOとPP-YOLOE+は、アンカーフリー物体検出の進化における重要なマイルストーンを象徴しています。DAMO-YOLOはエッジでのレイテンシを重視したニューラルアーキテクチャ探索の限界を押し広げ、PP-YOLOE+は大規模な事前トレーニングの力を証明しました。

しかし、速度、精度、およびデプロイメントの単純さの最適なバランスを求める開発者にとって、Ultralytics YOLO26モデルが決定的な選択肢となります。そのNMSフリーのアーキテクチャ、堅牢なPython API、そしてWeights & BiasesやTensorRTなどのツールとのシームレスな統合により、プロジェクトをプロトタイプから本番環境へとスムーズに移行できます。

準備はできましたか？Ultralyticsクイックスタートガイドをご覧いただくか、YOLO11 vs DAMO-YOLOの概要で他のモデルと比較してみてください。

貢献者

GLglenn-jocher¹⁵ PDpderrenger¹

作成日 2025年1月27日更新日 3 週間前