PP-YOLOE+ 対YOLOv10: 現代的な物体検出器の比較
リアルタイム物体検出の分野は、高精度と低遅延を両立するモデルの必要性から急速に進化している。この分野における二つの重要な貢献は、BaiduがPaddleDetectionスイートの一部として開発したPP-YOLOE+とYOLOv10が挙げられる。後者は清華大学による学術リリースであり、NMSを導入した。
本ガイドでは、これらのアーキテクチャについて、パフォーマンス指標、トレーニング手法、および様々なコンピュータビジョンアプリケーションへの適合性を詳細に技術的に比較します。両モデルとも優れた能力を提供しますが、Ultralytics やYOLO26のような新 Ultralytics 、より統一された効率的なデプロイメントの道筋を提供する方法についても強調します。
モデル概要と技術仕様
各モデルの由来と設計思想を理解することは、特定の技術的制約に合った適切なツールを選択する上で役立ちます。
PP-YOLOE+
PP-YOLOE+はPP-YOLOEのアップグレード版であり、アンカーフリー機構の改良と学習効率の向上に重点を置いています。PaddlePaddle に深く統合されています。
- 著者:PaddlePaddle
- 組織:Baidu
- 日付:2022年4月
- 参考文献:arXiv:2203.16250
- 主要なアーキテクチャ:CSPRepResNetバックボーンを使用し、タスクアラインメント学習(TAL)ラベル割り当て戦略を採用。標準的なアンカーフリーヘッド設計に依存する。
YOLOv10
YOLOv10YOLO 、推論時に非最大抑制(NMS)を不要とするエンドツーエンド設計を導入したことで、YOLO 重要な転換点となった。
- 著者:王昱、陳慧ら
- 組織:清華大学
- 日付:2024年5月
- 参考文献:arXiv:2405.14458
- 主要なアーキテクチャ: NMS学習のための一貫した二重割り当てと、効率性と精度を重視した包括的なモデル設計を特徴とする。
パフォーマンスベンチマーク
COCO モデル比較を示します。主要指標には平均精度(mAP)と各種ハードウェア構成での推論速度が含まれます。YOLOv10 効率性の大幅な向上、特にパラメータ数の削減に注目してください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
パフォーマンス分析
YOLOv10 優れた効率YOLOv10 、多くの場合、大幅に少ないパラメータで同等またはそれ以上の精度を達成する。例えば、mAP ほぼmAP を達成しながら、パラメータを約42%削減しており、メモリ制約のあるエッジデプロイメントにはるかに適している。
アーキテクチャの深掘り
PP-YOLOE+ デザイン
PP-YOLOE+は、PP-YOLOv2の強固な基盤の上に構築されています。スケーラブルなバックボーンであるCSPRepResNetを採用しており、残差接続とクロスステージ部分ネットワークを組み合わせることで勾配の流れを改善します。ヘッドはアンカーフリーであり、YOLOv4のようなアンカーベースの前世代モデルと比較して、ハイパーパラメータの探索空間を簡素化しています。
ただし、PP-YOLOE+は複雑な後処理ステップに依存している。正確ではあるものの、NMS への依存は、多数のバウンディングボックスが重なり合う混雑したシーンにおいて遅延のボトルネックを引き起こすNMS
YOLOv10 :エンドツーエンド処理
YOLOv10 NMS 排除することでパラダイムシフトYOLOv10 。これは一貫した二重アサインメントによって実現される:
- 一対多割り当て:学習中に豊富な教師信号を提供するために使用される。
- 一対一割り当て:推論に使用され、オブジェクトごとに一意の予測を保証する。
この調整により、ボックスのソートやフィルタリングといった計算上のオーバーヘッドなしにモデルを展開できるため、リアルタイムアプリケーションにおいて大きな利点となる。
エコシステムと使いやすさ
モデルを取り巻くエコシステムは、アーキテクチャ自体と同様に重要な場合が多い。この点こそが、PaddlePaddleモデルとUltralyticsとの違いが最も顕著に表れる部分である。
Ultralyticsの利点
Python では、YOLOv10 新しいYOLO26の両方がサポートされており、開発者にシームレスな体験を提供します。
- 統一API:単一の文字列引数を変更するだけでモデルを切り替えられます(例:YOLOv10 )。
- プラットフォーム統合:ユーザーUltralytics を活用し、データセットの管理、トレーニング実行の可視化、モデルをウェブおよびエッジエンドポイントへ数クリックでデプロイできます。
- 幅広いエクスポートサポート:PP-YOLOE+はPaddle推論向けに最適化されていますが、Ultralytics はネイティブで ONNX、 TensorRT、 CoreML、および OpenVINOにより、より幅広いデプロイメントハードウェアをカバーします。
from ultralytics import YOLO
# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for broad compatibility
path = model.export(format="onnx")
PP-YOLOE+ ワークフロー
PP-YOLOE+は通常PaddlePaddle インストールPaddlePaddle PaddleDetectionリポジトリのクローン作成を必要とします。このエコシステムは強力ですが、標準的なPyTorch に慣れたユーザーにとっては敷居が高い場合があります。エクスポート処理ではPaddle推論エンジンが優先されることが多く、汎用的な展開には追加の変換ステップが必要になる可能性があります。
未来:YOLO26
YOLOv10 NMS概念YOLOv10 一方で、最近リリースされた YOLO26 はこれらの革新を洗練させ、さらに発展させています。
YOLO26はネイティブでエンドツーエンドNMSを実現し、後処理遅延なしの最速推論速度を保証します。MuSGDオプティマイザ(LLMトレーニングに着想を得たSGD ハイブリッド)を搭載し、安定した収束を保証します。さらに、分布焦点損失(DFL)を排除したことで、YOLO26は低電力エッジデバイス上でのエクスポートと実行が大幅に容易になりました。
速度と精度において最高の性能を求める開発者、特にProgLossとSTALを用いた小物体検出においては、YOLO26が推奨されるアップグレードパスです。
実際のユースケース
PP-YOLOE+を選択するタイミング
- 百度クラウド展開:インフラが既に百度クラウド上に構築されている場合、またはPaddle Servingを利用している場合、PP-YOLOE+はネイティブ最適化を提供します。
- 特定ハードウェア:特定のアジア市場向けAIチップは、PaddlePaddle モデルに対する専用サポートを備えています。
Ultralytics YOLOv10 YOLO26)を選択すべきタイミング
- エッジコンピューティング:YOLO26における CPU 最大43%高速化され、これらのモデルはRaspberry Pi、Jetson Nano、またはモバイル環境での展開に最適です。
- 複雑なタスク:検出機能に加え、Ultralytics は姿勢推定、インスタンスセグメンテーション、方向性オブジェクト検出(OBB)をサポートしており、単一のツールで多様な課題に取り組むことが可能です。
- ラピッドプロトタイピング:トレーニングと検証の容易さにより、チームは迅速に反復できる。これはアジャイル開発環境において極めて重要な要素である。
メモリ効率
Ultralytics YOLO 、メモリ使用量が少ないことで知られています。膨大なCUDA を消費するトランスフォーマー中心のアーキテクチャとは異なり、YOLO26のような効率的なYOLO 、コンシューマー向けGPUでもより大きなバッチサイズを可能にし、ハイエンドAIトレーニングへのアクセスを民主化します。
結論
PP-YOLOE+とYOLOv10 はいずれも高性能なモデルYOLOv10 。 PP-YOLOE+PaddlePaddle 有力な選択肢である一方、YOLOv10 NMS設計により効率性の限界をYOLOv10 。しかし、最も効率的な開発体験、幅広いハードウェアサポート、MuSGDオプティマイザやProgLossといった最先端機能を求める現代のコンピュータビジョンエンジニアにとって、Ultralytics 優れた選択肢として際立っている。
他の選択肢を探るには、以下を検討してみてください YOLOv8 またはトランスフォーマーベースの RT-DETR を検討してみてください。