PP-YOLOE+ 対YOLOv9: オブジェクト検出アーキテクチャの包括的比較
リアルタイム物体検出技術は急速に進化を続けており、研究者たちは精度、レイテンシ、パラメータ効率の限界を絶えず押し広げている。この進化の過程における二つの重要なマイルストーンが、PaddlePaddle 開発したPP-YOLOE+と、YOLOv7 YOLOv9。本比較では、これら二つの強力なモデルのアーキテクチャ革新、性能指標、および実環境での展開実態を探る。
モデルメタデータ
PP-YOLOE+
著者:PaddlePaddle
組織:Baidu
日付: 2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHub:PaddleDetection リポジトリ
ドキュメント:公式 PaddleDocs
YOLOv9
著者: Chien-Yao Wang と Hong-Yuan Mark Liao
所属機関: 台湾中央研究院 情報科学研究所
日付: 2024年2月21日
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:YOLOv9
ドキュメント:Ultralytics YOLOv9
パフォーマンス分析
これらのモデルを比較する際、開発者は通常、トレードオフを考察する。 mAP (平均精度)と推論速度のトレードオフを比較検討します。下表は、PP-YOLOE+が2022年時点で最先端のアンカーフリー検出器であった一方、YOLOv9 2024)はより新しいアーキテクチャ原則を活用し、優れたパラメータ効率を達成していることを示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
主なポイントは以下の通りです:
- パラメータ効率:YOLOv9tはPP-YOLOe+tの半数以下のパラメータ(200万対485万)で同等の精度を達成し、メモリ制約のあるエッジデバイスに極めて適している。
- 大規模モデルにおける精度:より大規模なモデルでは、YOLOv9eはPP-YOLOE+xをmAP 上回るmAP 55.6% 対 54.7%)一方で、大幅に少ないパラメータ数(57.3M 対 98.42M)で実現している。
- 速度: YOLOv9 NVIDIA GPU上で非常に競争力のある推論速度YOLOv9 、特に小型のバリエーションにおいて顕著である。
アーキテクチャの違い
PP-YOLOE+: 洗練されたアンカーフリー検出
PP-YOLOE+はPP-YOLOv2を進化させたモデルであり、アンカーフリーパラダイムを重視している。CSPResNetバックボーンと簡略化されたCSPPANネックを採用している。主な特徴は以下の通り:
- タスクアラインメント学習(TAL):分類スコアと局所化スコアの組み合わせに基づいて動的に正例サンプルを選択するラベル割り当て戦略。
- ET-Head:速度と精度を両立させる効率的なタスク適合型ヘッド
- 動的マッチング:静的アンカー割り当てと比較して、学習中の収束速度を向上させる。
YOLOv9: プログラマブル勾配情報
YOLOv9 、深層ネットワークがデータフローを処理する方法に根本的な変更YOLOv9 。これは、データが深層を通過する際に失われる「情報ボトルネック」問題に対処するものである。
- GELANアーキテクチャ:汎用効率的層集約ネットワークは、CSPNetとELANの長所を組み合わせ、パラメータ利用率を最大化する。
- PGI(プログラマブル勾配情報):この新規概念は補助的な可逆分岐を用いて主分岐向けの信頼性の高い勾配を生成し、深層特徴が入力画像に関する重要な情報を保持することを保証する。
- 補助的監視: セグメンテーションモデルで見られる手法と同様に、YOLOv9 学習中に補助ヘッドYOLOv9 、推論速度に影響を与えずに性能を向上させる(これらのヘッドはデプロイ時に削除されるため)。
勾配情報が重要な理由
非常に深いニューラルネットワークでは、特徴量が最終層に到達するまでに元の入力データが「忘れられる」ことがある。YOLOv9のPGIは、モデルが対象物に対する完全な理解を保持することを保証し、複雑なシーンにおける小さな対象物や遮蔽された対象物の検出に特に有効である。
エコシステムと使いやすさ
開発者にとって最も重要な違いは、エコシステムとワークフローにあります。
Ultralyticsの利点
YOLOv9 Ultralytics に完全にYOLOv9 。これは、同じシンプルなAPIを使用してモデルのトレーニング、検証、デプロイが可能であることを意味します。 YOLO11 およびYOLO26 で使用されるのと同じシンプルな API を使用して、モデルのトレーニング、検証、デプロイが可能です。
主な利点:
- 統一API:モデル重み付けファイルを変更するだけで、物体検出や姿勢推定などのタスクを切り替えられます。
- 自動化されたMLOps: Ultralytics とのシームレスな統合により、クラウドトレーニング、データセット管理、ワンクリックでのモデルデプロイメントを実現します。
- メモリ効率: Ultralytics ループUltralytics 高度に最適化されており、競合フレームワークよりも少ないVRAMで動作することが多い。これは膨大な計算リソースを必要とする多くのトランスフォーマーベースモデルに対する決定的な優位性である。
- エクスポートの多様性:ネイティブサポートによるエクスポート先 ONNX、 OpenVINO、CoreML、TensorRT へのネイティブエクスポートサポートにより、モデルをあらゆる環境で実行TensorRT 。
from ultralytics import YOLO
# Load a pretrained YOLOv9c model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to TensorRT for maximum GPU speed
model.export(format="engine")
PP-YOLOE+ ワークフロー
PP-YOLOE+PaddlePaddle に依存しています。強力ではありますが、多くの研究者が好むPyTorchワークフローとは異なる特定のエコシステムを採用する必要があります。設定にはしばしば PaddleDetection リポジトリと設定ファイルを手動で管理する必要があり、これは pip install ultralytics 経験。
ユースケースと推奨事項
PP-YOLOE+を継続すべきタイミング
- レガシー統合:本番環境が既に百度のPaddlePaddle 上で構築されている場合。
- 特定のハードウェア:Paddle Lite専用に最適化されたハードウェアにデプロイする場合。
Ultralytics YOLO を選択すべきタイミング
新規プロジェクトの大半において、 YOLOv9 またはより新しいYOLO26が推奨される選択肢です。
- 研究開発: YOLOv9 のPGIアーキテクチャは、勾配流を研究する研究者にとって豊富な実験の場YOLOv9 。
- 商用展開: Ultralytics 堅牢なエクスポート機能により、PyTorch からTensorRTを使用したC++本番アプリへの移行が容易になります。 TensorRT またはOpenVINO容易にします。
- エッジコンピューティング:優れたパラメータ効率(FLOPmAP )により、Ultralytics ドローンやスマートカメラなどのバッテリー駆動デバイスに最適です。
今後の展望: YOLO26の力
YOLOv9 優れたモデルYOLOv9 、この分野はさらに進歩を遂げ、 YOLO26の登場により、この分野はさらに進歩を遂げました。今日新たなプロジェクトを始める場合、YOLO26はPP-YOLO+とYOLOv9の両方に対していくつかの重要な利点を提供します。
YOLO26はコンピュータビジョンの効率性における最先端技術である:
- エンドツーエンドNMS:PP-YOLOE+やYOLOv9 後処理として非最大抑制(NMS)YOLOv9 必要とするYOLOv9 異なり、YOLO26はネイティブにNMSです。これにより遅延変動が低減され、デプロイメントパイプラインが大幅に簡素化されます。
- MuSGDオプティマイザー:LLMトレーニングにおける革新(Moonshot AIのKimi K2など)に着想を得て、YOLO26はより速い収束と安定したトレーニング実行のためにMuSGDオプティマイザーを採用しています。
- 強化された小物体検出: ProgLossとSTALを組み合わせたYOLO26は、多くのリアルタイム検出器にとって従来弱点であった小物体の検出に優れている。
- CPU :ディストリビューション焦点損失(DFL)の除去およびその他の最適化により、YOLO26は最大43%高速CPU を実現し、専用NPUを持たないサーバーレス環境やエッジデバイスにおける最良の選択肢となっています。
概要
PP-YOLOE+YOLOv9 、いずれも物体検出の歴史における画期的なYOLOv9 。PP-YOLOE+はアンカーフリー手法を洗練させ、YOLOv9 PGIを通じて深層学習による教師付き学習の概念YOLOv9 。しかし、精度・使いやすさ・将来を見据えた導入のバランスを追求する開発者にとって、Ultralytics ——特に YOLOv9 と革新的なYOLO26が牽引するUltralyticsエコシステムが最も堅牢なソリューションを提供します。
詳細を見る
他のアーキテクチャにも興味がありますか?以下の比較をご覧ください RT-DETR (トランスフォーマーベース) または YOLO11 の比較記事をご覧ください。ご自身のアプリケーションに最適な選択肢を見つけられます。