YOLO PP-YOLOE+:詳細な技術比較
リアルタイムコンピュータビジョンの競争が激しい環境において、特定の導入ニーズに最適なアーキテクチャを選択することは極めて重要です。本ガイドでは、DAMO-YOLOとPP-YOLOE+の包括的な技術比較を提供し、両モデルのアーキテクチャ設計、トレーニング手法、性能指標を詳細に分析します。さらに、新たにUltralytics 26などの最先端ソリューションとの比較評価も行います。
モデルの概要
両フレームワークは2022年に登場し、産業用途向けの強力な選択肢として、高度な技術を活用して精度と推論速度の限界を押し広げている。
DAMO-YOLO
アリババグループが開発したYOLO 、遅延と精度のトレードオフを最適化するため、自動探索技術と高度な特徴量融合に大きく依存した複数の新規手法YOLO 。
- 著者:徐賢哲、江一琪、陳偉華、黄一倫、張元、孫秀宇
- 組織:アリババグループ
- 日付: 2022年11月23日
- Arxiv:YOLO: リアルタイム物体検出設計に関する報告
- GitHub:YOLO
- ドキュメント:YOLO
YOLO 、ハードウェア効率に最適化されたバックボーンを自動設計するため、マルチスケールアーキテクチャ探索(MAE-NAS)YOLO 。また、ネック部特徴融合のための効率的な再パラメータ化汎用特徴ピラミッドネットワーク(RepGFPN)と軽量な「ZeroHead」設計を備える。さらに、学習中に蒸留技術を多用し、生徒モデルの表現力を強化する。
PP-YOLOE+
百度 PaddlePaddle によるPP-YOLOE+は、PP-YOLOEアーキテクチャの段階的アップグレード版です。大規模な事前学習と洗練された損失関数に焦点を当て、特にネイティブの深層学習フレームワーク内で高いmAPを実現します。
- 著者: PaddlePaddle Authors
- 組織: Baidu
- 日付: 2022-04-02
- Arxiv:PP-YOLOE:YOLOの進化版
- GitHub:PaddlePaddle
- ドキュメント:PP-YOLOE+ 設定
PP-YOLOE+はCSPRepResNetバックボーンとET-head(効率的なタスク整合ヘッド)を採用している。「プラス」バージョンではObjects365データセット上で強力な事前学習戦略を導入し、多様な実環境における汎化能力を大幅に向上させている。
アーキテクチャの比較
これら2つのモデルの設計思想の相違は、その理想的な使用ケースとハードウェア互換性に大きく影響する。
特徴融合とバックボーン
YOLOエッジデバイス向けに高度に最適化されており、速度とパラメータ数のバランスに優れることが多い。しかし、これらのカスタムアーキテクチャは、インスタンスセグメンテーションのような新規タスクへの適応が困難で複雑になりがちである。RepGFPNネックはマルチスケール特徴融合を改善するが、再パラメータ化エクスポート段階で複雑性を付加する。
PP-YOLOE+は、より伝統的でありながら非常に効果的なCSPRepResNetを基盤としています。このバックボーンは、同等の精度YOLO 多くのパラメータを必要としますが、学習が非常に安定しており、既存のパイプラインへの統合が容易です。そのETヘッドは分類と回帰を効率的に処理しますが、それでも非最大抑制(NMS)などの後処理ステップが必要です。
後処理遅延の解消
YOLO NMS ディングNMS 必要とします。推論レイテンシが重要な場合は、Ultralytics の使用をご検討ください。本モデルはネイティブ NMS設計を特徴としており、この画期的なアプローチNMS 不要となり、より高速でシンプルなデプロイメントパイプラインを実現します。
パフォーマンスとメトリクスの分析
これらのモデルを実運用で評価する際には、精度(mAP)、推論速度、パラメータサイズのバランスが極めて重要である。以下に主要なバリエーションの直接比較を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
表が示すように、YOLO NAS最適化バックボーンにより、小規模(s)および超小規模(t)ではYOLO 低遅延を実現する。しかしPP-YOLOE+は中規模(m)および大規模(l)において驚異的な拡張性を示し、T4TensorRT 若干の犠牲を伴うものの、著しくmAP 誇る。
メモリ要件とトレーニング効率
YOLO蒸留に依存しているため、より小さな生徒モデルを訓練する前に、はるかに大規模な教師モデルを訓練する必要が生じることが多い。CUDA と全体の計算リソースが大幅に増加する。PP-YOLOE+は標準的な単一段階訓練でこれを簡素化するが、PaddlePaddle 緊密な結合を維持しており、PyTorchに慣れたチームにとっては柔軟性が制限される可能性がある。
対照的に、Ultralytics モデルはこれらのボトルネックを解消する。LLMトレーニングの革新に着想を得たSGD ミューオンのハイブリッドである新開発のMuSGDオプティマイザーを活用することで、YOLO26は複雑な蒸留パイプラインを必要とせず、より高速な収束と極めて安定したトレーニングを実現する。さらに、YOLO トレーニング中に、Transformerベースの検出器と比較してはるかに少ないCUDA しか必要としない。 RT-DETRと比較して、はるかに少ないCUDAメモリを必要とします。
実世界での応用例と理想的な使用事例
YOLOの使用タイミング
YOLO レイテンシが究極のボトルネックとなる高スループットのエッジ推論にYOLO 。その小型バリエーションは、交通管理システムや基本的なドローン監視といった環境で優れた性能を発揮します。ただし、エンジニアリングチームが複雑な蒸留と再パラメータ化プロセスを管理する余裕があることが前提となります。
PP-YOLOE+の使用タイミング
PP-YOLOE+は、既に百度エコシステムに深く投資している場合や大規模なサーバー展開を実行している場合に真価を発揮します。その優れたmAP 、複雑な医療画像解析や高密度な製造欠陥検出 mAP 。
Ultralyticsの利点
YOLO はいずれも特定の局所的な利点を提供しますが、最大限の汎用性、速度、使いやすさを求める開発者は一貫してUltralytics を選択します。
コンピュータビジョンパイプラインをアップグレードする際、Ultralytics 比類のない開発者体験を提供します:
- 最大43%CPU :分布焦点損失(DFL)を完全に除去したことで、YOLO26はエッジCPUや低消費電力IoTデバイス上で驚異的な高速性を発揮します。
- 小型物体検出の改善:ProgLossとSTAL損失関数の統合により、航空画像において極めて重要な小型物体認識が劇的に向上した。
- 広範な汎用性:検出に特化したPP-YOLOE+とは異なり、YOLO26は姿勢推定、方向付き境界ボックス(OBB)、セマンティックセグメンテーションを、タスク特化型のアーキテクチャ改良によりシームレスに処理する。
結論
YOLO アンカーフリー物体検出の進化における重要なマイルストーンである。YOLO エッジ遅延におけるニューラルアーキテクチャ探索の限界をYOLO 、一方PP-YOLOE+は大規模事前学習の威力を実証した。
ただし、速度、精度、デプロイの簡便性の最適なバランスを求める開発者にとって、Ultralytics モデルが決定的な選択肢です。NMSアーキテクチャ、Python 、および Weights & Biases や TensorRT とのシームレスな連携により、プロジェクトがプロトタイプから本番環境へ円滑に移行することを保証します。
始めましょうか?Ultralytics ガイドを閲覧するか、YOLO11 YOLOYOLO11 概要でさらに多くのモデルを比較してください。