Link to this sectionPP-YOLOE+ と DAMO-YOLO の比較#
コンピュータビジョンの絶え間ない進化により、リアルタイム物体検出のための高度に専門化されたアーキテクチャが数多く生み出されてきました。産業用および研究用のアプリケーション向けモデルを評価する際、2022年の2つの著名なフレームワークがよく議論に上がります。Baiduによる PP-YOLOE+ と、Alibaba Groupによる DAMO-YOLO です。両モデルとも、新規のバックボーン、高度なラベル割り当て戦略、および専門化された特徴融合技術を導入することで、アンカーフリー検出の限界を押し広げました。
本ガイドでは、PP-YOLOE+ と DAMO-YOLO の詳細な技術分析を行い、それらのアーキテクチャ、トレーニング手法、およびデプロイ時の強みを探ります。また、これらのフレームワークが Ultralytics YOLO26 のような最新のソリューションとどのように比較されるかを検証し、お客様のデプロイ環境の制約に合わせて最適なツールを選択できるよう支援します。
Link to this sectionPP-YOLOE+: 洗練された産業用物体検出#
Baiduエコシステム内で開発された PP-YOLOE+ は、オリジナルの PP-YOLOE を反復的に改善したものであり、PaddlePaddle ディープラーニングフレームワーク向けに高度に最適化されています。サーバーグレードのハードウェア上で精度と推論速度を最大化するように設計されており、産業検査や スマートリテール アプリケーションにとって強力な候補となります。
Link to this sectionアーキテクチャの革新#
PP-YOLOE+ は、従来のアンカーフリー検出器を改善するために、いくつかのアーキテクチャ上の強化を導入しています。
- CSPRepResNet バックボーン: このバックボーンは、RepVGGスタイルのアーキテクチャと Cross Stage Partial (CSP) 接続を組み合わせており、特徴抽出能力と推論レイテンシの強力なバランスを提供します。
- Task Alignment Learning (TAL): PP-YOLOE+ は、トレーニング中に分類タスクと回帰タスクを整合させる高度な動的ラベル割り当て戦略を採用しており、トレーニングと推論のパフォーマンス間のギャップを縮小します。
- Efficient Task-aligned Head (ET-head): 空間解像度を犠牲にすることなく特徴を迅速に処理するように設計された効率的な検出ヘッドであり、高い mAP指標 を維持するのに非常に有益です。
PP-YOLOE+の詳細:
- 著者: PaddlePaddle Authors
- 組織: Baidu
- 日付: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
- ドキュメント: PP-YOLOE+ ドキュメント
Link to this sectionDAMO-YOLO: エッジにおけるニューラルアーキテクチャ探索#
Alibaba DAMO Academy によって作成された DAMO-YOLO は、明らかに異なるアプローチを採用しています。研究チームはバックボーンを手動で設計する代わりに、ニューラルアーキテクチャ探索 (NAS) を利用して、厳しいレイテンシ制約に合わせて調整された高効率なネットワークトポロジを発見しました。
Link to this section主な特徴とトレーニングパイプライン#
DAMO-YOLO は、自動化された蒸留重視の方法論を通じて、低レイテンシと高精度を重視しています。
- MAE-NAS バックボーン: Method of Automating Efficient Neural Architecture Search を利用することで、DAMO-YOLO は パラメータと精度のトレードオフ に最適化されたバックボーンを構築します。
- Efficient RepGFPN: 再パラメータ化された Generalized Feature Pyramid Network により、堅牢なマルチスケール特徴融合が可能となり、モデルはフレーム内で大きく異なるサイズの物体を検出できるようになります。
- ZeroHead デザイン: 推論フェーズ中の計算オーバーヘッドを大幅に削減する、高度に簡素化された検出ヘッドです。
- 蒸留による強化: 小型バリアントのパフォーマンスを向上させるために、DAMO-YOLO は、より大きな教師モデルが学生モデルを導く複雑な知識蒸留プロセスに大きく依存しています。
DAMO-YOLO の詳細:
- 著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
- 組織: Alibaba Group
- 日付: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
- ドキュメント: DAMO-YOLO Documentation
PP-YOLOE+ と DAMO-YOLO はどちらも堅牢な理論的革新を提供しますが、それぞれのフレームワーク(PaddlePaddle および特定の Alibaba 環境)に密接に結合されています。これにより、これらのモデルを標準化されたクラウドまたはエッジ環境へ移行しようとする際に摩擦が生じる可能性があります。
Link to this sectionパフォーマンス分析#
これらのモデルを評価する際、レイテンシ、計算複雑性 (FLOPs)、および mean Average Precision (mAP) の間のトレードオフが、理想的なデプロイ環境を決定します。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
DAMO-YOLO は一般的に nano および tiny スケールでより低い TensorRT レイテンシを実現しており、高スループットのビデオストリームにおいて高い競争力を持ちます。しかし、PP-YOLOE+ は x バリアントまで非常にうまくスケーリングし、推論時間が二の次となるような複雑な画像処理においてトップレベルの精度を達成します。
Link to this sectionUltralytics の優位性: 2022年のアーキテクチャを超えて#
PP-YOLOE+ と DAMO-YOLO は重要なマイルストーンを築きましたが、現代の開発では、より高い汎用性、より簡単なトレーニングパイプライン、およびより少ないメモリ要件が求められています。 Ultralytics Platform は、旧来のモデルで必要とされていた複雑な蒸留やフレームワーク固有のセットアップを大幅に上回る、摩擦のないエクスペリエンスを提供することで、これらのニーズに対応します。
今日、最高のパフォーマンスバランスを達成したい開発者にとって、Ultralytics YOLO26 は、実環境へのデプロイ効率において革命的な飛躍を提供します。
Link to this sectionなぜ YOLO26 が業界をリードするのか#
2026年初頭にリリースされた YOLO26 は、YOLO11 のレガシーを基盤としており、プロダクション向けに調整された画期的な技術を導入しています。
- エンドツーエンドの NMS フリー設計: YOLO26 は Non-Maximum Suppression (NMS) 後処理を排除しました。これは、よりシンプルなデプロイロジックと、一貫性があり予測可能な推論レイテンシを実現することを意味します。
- MuSGD オプティマイザ: 大規模言語モデルのトレーニング技術に触発された YOLO26 は、ハイブリッドな MuSGD オプティマイザを利用しています。これにより非常に安定したトレーニングと迅速な収束が保証され、貴重な GPU 時間を節約します。
- 優れた CPU 推論: Distribution Focal Loss (DFL) を削除し、ネットワークグラフを最適化することで、YOLO26 は最大43%高速な CPU 推論を実現しており、エッジ AI デバイス にとって最高の選択肢となっています。
- ProgLoss + STAL: これらの高度な損失関数は、ドローン運用 やリモートセンシングにおいて不可欠な、小さな物体の認識において驚くべき改善をもたらします。
- 比類のない汎用性: 検出のみに特化した PP-YOLOE+ とは異なり、YOLO26 は 姿勢推定、インスタンスセグメンテーション、画像分類、および 指向性バウンディングボックス (OBB) をネイティブでシームレスにサポートします。
Link to this section使いやすさと学習の効率性#
DAMO-YOLO モデルのトレーニングには、複雑な教師・学生蒸留パイプラインの管理が必要です。対照的に、Ultralytics モデルのトレーニングはわずか数行の Python コードで済み、競合するアーキテクチャと比較して CUDA メモリの使用量も最小限に抑えられます。
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")Link to this section理想的なユースケースと推奨事項#
最適なコンピュータビジョンアーキテクチャの選択は、チームのエコシステム統合とデプロイ対象に大きく依存します。
- PP-YOLOE+ を選択すべき場合: パイプライン全体が Baidu PaddlePaddle エコシステムに深く組み込まれている場合。精度を最大化することが最優先事項である強力なサーバー上での静止画像解析には、依然として優れた選択肢です。
- DAMO-YOLO を選択すべき場合: ニューラルアーキテクチャ探索アルゴリズムに関する特定の研究を行っている場合、あるいは、野心的な TensorRT レイテンシの目標を達成するために複雑な蒸留パイプラインを維持するエンジニアリングリソースがある場合。
- Ultralytics YOLO26 を選択すべき場合: ほぼすべての現代のプロダクションシナリオ。 Ultralytics エコシステム は、比類のないドキュメント、低いメモリ要件、および効率化された API を提供します。 自動品質管理 システムの構築でも、Raspberry Pi 上でのリアルタイムトラッキングの実行でも、YOLO26 の NMS フリーアーキテクチャは、箱から出してすぐに高速で安定した高精度の結果を保証します。
他の最先端ソリューションを検討している開発者のために、Ultralytics のドキュメントでは、広く採用されている YOLOv8 や堅牢な YOLO11 に関する広範なリソースも提供しており、あらゆるコンピュータビジョンの課題に対して適切なモデルを確実に選択できるようになっています。