PP-YOLOE+とYOLOv6.0の比較:詳細な技術比較
最新の物体検出アーキテクチャをナビゲートするには、特定のフレームワークエコシステムに最適化されたモデルと、生の産業用スピードのために設計されたモデルのどちらかを選択する必要があります。この包括的な分析では、PaddlePaddle スイートの高精度アンカーフリー検出器であるPP-YOLOE+と、Meituanがリアルタイムの産業用アプリケーション向けに設計した速度中心のモデルであるYOLOv6.0を比較します。両者のアーキテクチャ、性能指標、理想的なユースケースを検証することで、開発者はどちらのモデルが展開上の制約に最も合致するかを判断することができます。
PP-YOLOE+:アンカー不要の高精度
PP-YOLOE+はPP-YOLO シリーズの進化版であり、バイドゥの研究者たちによって開発された。 PaddlePaddleシリーズの進化版である。2022年初頭にリリースされたPP-YOLOE+は、汎用コンピュータビジョンタスクに最先端の性能を提供しながら、トレーニングパイプラインを簡素化するアンカーフリー設計に焦点を当てています。
著者 PaddlePaddle Authors
Organization:Baidu
Date:2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
DocsPaddlePaddle
アーキテクチャと主要なイノベーション
PP-YOLOE+のアーキテクチャは、CSPRepResNetのバックボーン上に構築されており、残差ネットワークの特徴抽出機能とクロスステージパーシャル(CSP)接続の効率性を兼ね備えています。従来の検出器と大きく異なる点は、アンカー・フリー・ヘッドであり、あらかじめ定義されたアンカー・ボックスの必要性を排除している。このハイパーパラメータの削減により、モデル構成が単純化され、多様なデータセットにわたる汎化が改善される。
PP-YOLOE+はタスクアライメント学習(TAL)を採用し、分類タスクとローカライゼーションタスクのミスアライメントを解決します。予測の品質に基づいて動的にラベルを割り当てることで、TALは最高の信頼スコアが最も正確なバウンディングボックスに対応することを保証します。
長所と短所
長所:
- 高い精度:常に優れた mAPCOCOようなベンチマークで、特に大きなモデルバリエーション(PP-YOLOE+xなど)において優れたmAPスコアを達成している。
- トレーニングの簡素化:アンカーフリーのパラダイムは、アンカーサイズ決定のためのクラスタリング分析の複雑さを取り除く。
- エコシステム・シナジー: PaddlePaddle ディープラーニングフレームワークに既に慣れ親しんでいるユーザーに深い統合を提供。
弱点:
- 推論レイテンシー:一般的に、YOLOv6ようなハードウェアを意識したモデルに比べ、特にGPU ハードウェア上では推論速度が遅い。
- フレームワークへの依存: デプロイのためにモデルをPyTorch ONNX ような他のフレームワークに移植することは、フレームワークに依存しないネイティブなアーキテクチャに比べて摩擦が大きくなる可能性があります。
理想的なユースケース
PP-YOLOE+は、超低遅延よりも精度が優先される場合によく選ばれる。
- 詳細検査: 製造品質管理における微細な欠陥の検出。
- スマートリテール:棚のモニタリングと商品認識のための高忠実度リテール分析。
- 複雑な選別:視覚的に類似した材料を区別することで、リサイクル効率を向上させる。
YOLOv6.0:工業用スピードのために設計された
YOLOv6.0は、MeituanのビジョンAIチームによって、産業用アプリケーションの厳しい要求に対応するために導入された。推論速度と精度のトレードオフを優先し、YOLOv6 GPUとエッジデバイスのスループットを最大化するためにハードウェアを意識した設計原理を採用している。
著者Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization:Meituan
Date:2023-01-13
ArXiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
Docsultralytics
アーキテクチャと主な機能
YOLOv6.0は、RepVGGにインスパイアされた「効率的な再パラメータ化バックボーン」を特徴としており、豊富な特徴を学習するために学習時には複雑な構造を持ち、推論時には速度を上げるために単純化された構造を持つモデルを可能にする。このリパラメータ化技術は、リアルタイム推論機能の鍵となる。
また、このモデルは自己蒸留を利用しており、より大きな教師モデルがより小さな生徒モデルの学習をガイドすることで、実行時に計算コストを追加することなく精度を向上させている。さらに、YOLOv6 積極的なモデルの量子化をサポートしているため、計算リソースが限られたハードウェアでの展開に非常に効果的です。
モバイル最適化
YOLOv6 、モバイルCPU向けに最適化された「Lite」シリーズがあり、GPU アクセラレーションが利用できない場所でも速度を維持できるよう、明確なブロックを利用している。
長所と短所
長所:
- 卓越したスピード: YOLOv6.0nモデルは、T4 GPUで2ms以下のレイテンシーを実現。
- ハードウェアの最適化:アーキテクチャは TensorRTの最適化に適しており、GPU 使用率を最大化します。
- 効率的なスケーリング:計算コスト(FLOPs)に対する精度のバランスが良い。
弱点:
- 限られたタスク範囲: ポーズ推定やオリエンテッドバウンディングボックス(OBB)のような複雑なタスクをネイティブにサポートしていない。
- コミュニティサポート:効果的ではあるが、Ultralytics モデルと比較すると、サードパーティの統合やコミュニティのチュートリアルに関するエコシステムはあまり活発ではない。
理想的なユースケース
YOLOv6.0は、反応速度が重要な環境で優れている。
- ロボット工学:自律移動ロボット(AMR)のナビゲーションとインタラクションを可能にする。
- 交通分析:瞬時の車両カウントと分類を必要とするリアルタイム交通管理システム。
- 生産ライン高速ベルトコンベヤーモニタリングによるパッケージのセグメンテーションとソーティング。
パフォーマンス比較
PP-YOLOE+の精度重視とYOLOv66の速度重視という設計思想の相違は、性能指標にはっきりと表れています。PP-YOLOE+は一般的に、モデルの複雑さの上限においてより高いmAP スコアを要求するのに対し、YOLOv6 より小さく高速なモデルにおいて、生の推論速度で優位に立つ。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
注:メトリックの比較は、特定のハードウェアと使用されるエクスポートフォーマット(例えば、ONNX 対TensorRT)に大きく依存します。
このデータから、リソースに制約のあるエッジ・アプリケーションでは、YOLOv6.0nがFLOPsとレイテンシの点で最も参入障壁が低いことがわかる。逆に、最大限の検出能力が要求されるサーバーサイド・アプリケーションでは、PP-YOLOE+xが最高精度の上限を提供します。
Ultralytics 優位性YOLO11
PP-YOLOE+とYOLOv6 、それぞれのニッチで強力な能力を提供している、 Ultralytics YOLO11は、高精度と使いやすさのギャップを埋める総合的なソリューションを提供します。YOLO11 11は単なるモデルではなく、機械学習のライフサイクル全体を効率化するように設計された、整備されたエコシステムへの入口なのです。
Ultralytics選ぶ理由
- 比類のない多様性:主に検出器であるYOLOv6 異なり、YOLO11 インスタンスのセグメンテーション、ポーズ推定、OBB、分類をネイティブにサポートします。これにより、開発者は単一のAPIで多面的なコンピュータ・ビジョンの問題に取り組むことができます。
- 使いやすさ: Ultralytics Python パッケージは、複雑な定型コードを抽象化します。モデルのロード、推論の実行、結果の可視化は3行のコードで可能です。
- 効率とメモリー: Ultralytics モデルは効率的なトレーニングのために最適化されており、通常、以下のようなトランスフォーマーベースのアーキテクチャよりもGPU メモリが大幅に少なくて済みます。 RT-DETR.
- エコシステムのサポート:頻繁なアップデート、豊富なドキュメント、Ultralytics HUBのようなコード不要のトレーニングツールにより、ユーザーは業界とともに進化するプラットフォームから利益を得ることができます。
シンプルな配備
Ultralytics アクセシビリティを優先します。高度な推論をすぐに実行できます:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
このシンプルさは、次のようなフォーマットへの1行エクスポート機能によって、デプロイメントにも及んでいます。 ONNX, OpenVINOやCoreMLフォーマットへの1行エクスポート機能により、あなたのモデルがどのようなターゲットハードウェア上でも最適に動作することを保証します。
結論
PP-YOLOE+とYOLOv6.0のどちらを選択するかは、プロジェクトの具体的な制約に大きく依存します。PP-YOLOE+は、PaddlePaddle フレームワーク内で高精度を要求するシナリオのための強力な候補であり、一方、YOLOv6.0は、GPU 推論に大きく依存する産業環境に説得力のあるスピードの利点を提供します。
しかし、最先端のパフォーマンスと開発者のエクスペリエンスのバランスが取れた、多用途で将来性のあるソリューションを求めている開発者にとっては、Ultralyticsは非常に便利なソリューションです、 Ultralytics YOLO11をお勧めします。その広範なタスクサポート、活発なコミュニティ、最新のMLOpsワークフローへのシームレスな統合は、最先端のビジョンAIの標準となっている。
その他のモデル比較
より詳細な比較をご覧いただき、お客様のニーズに合ったモデルをお探しください: