コンテンツにスキップ

PP-YOLOE+ vs. YOLOv10:技術的比較

最適な物体検出モデルの選択は、あらゆるコンピュータビジョンプロジェクトにおいて、精度、速度、および計算リソースのバランスを取る上で非常に重要な決定事項です。このページでは、Baiduが開発したPP-YOLOE+と、Ultralyticsエコシステムに完全に統合された清華大学の最先端モデルであるYOLOv10との詳細な技術比較を提供します。お客様が情報に基づいた選択を行えるよう、アーキテクチャ、パフォーマンス指標、および理想的なユースケースについて分析します。

PP-YOLOE+:PaddlePaddleエコシステムにおける高精度

PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus) は、BaiduのPaddleDetectionフレームワークによる、アンカーフリーのシングルステージ物体検出モデルです。2022年に発表され、特にPaddlePaddle深層学習環境のユーザーにとって、効率を維持しながら高い精度を提供することに主な焦点が当てられています。

著者: PaddlePaddle Authors
組織: Baidu
日付: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
ドキュメント: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

アーキテクチャと主な機能

PP-YOLOE+は、パフォーマンスを向上させるために、いくつかの重要な変更を加えて標準的なYOLOアーキテクチャを強化しています。

  • Anchor-Free Design: 事前に定義されたアンカーボックスを排除することで、PP-YOLOE+は検出パイプラインを簡素化し、ハイパーパラメータ調整の複雑さを軽減します。このアプローチは、多くの最新のアンカーフリー検出器で一般的です。
  • 効率的なコンポーネント: ResNet バックボーンとPath Aggregation Network (PAN) ネックを活用して、効果的な特徴融合を実現します。これは、速度と精度のバランスを取るための実績のある組み合わせです。
  • Decoupled Head: このモデルでは、検出ヘッド内で分類タスクと回帰タスクを分離します。この手法は、タスク間の干渉を防ぐことで検出精度を向上させることが知られています。
  • Task Alignment Learning (TAL): 分類タスクとローカリゼーションタスクをより適切に調整するように設計された特殊な損失関数を利用しており、より正確な予測につながります。

長所と短所

PP-YOLOE+は、優れたパフォーマンスを発揮していますが、特定のトレードオフが伴います。

  • 長所: 特に大規模なバリアントでは、非常に高い精度を達成できます。アンカーフリー設計は効率的で、PaddlePaddleフレームワークにすでに投資しているユーザー向けに高度に最適化されています。
  • 弱点:主な欠点は、PaddlePaddleのエコシステムとの密接な結合です。これにより、PyTorchのようなより一般的なフレームワークを使用する開発者にとって、学習コストが高くなり、統合が困難になる可能性があります。さらに、コミュニティサポートと利用可能なリソースは、Ultralyticsのエコシステム内のモデルと比較して少ない場合があります。

ユースケース

PP-YOLOE+ は、高い精度が優先され、開発環境が PaddlePaddle に基づいているアプリケーションに最適です。

  • 産業品質検査製造プロセスにおける小さな欠陥の検出。
  • スマートリテール: 自動チェックアウトや在庫管理などのアプリケーションを強化します。
  • リサイクル自動化自動選別システムのために、さまざまな材料を識別します。

PP-YOLOE+の詳細について。

YOLOv10:リアルタイムエンドツーエンド効率

Ultralytics YOLOv10は、清華大学の研究者によって開発された、YOLOシリーズの最新進化版です。2024年5月にリリースされ、ポストプロセッシングのボトルネックを解消し、優れた効率のためにモデルを最適化することで、真のエンドツーエンドのリアルタイム物体検出を実現するための画期的なアーキテクチャの変更を導入しています。

著者: Ao Wang, Hui Chen, Lihao Liu, et al.
所属: 清華大学
日付: 2024-05-23
ArXiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
ドキュメント: https://docs.ultralytics.com/models/yolov10/

アーキテクチャと主な機能

YOLOv10の設計思想は、全体的な効率とパフォーマンスを中心に据えており、幅広いアプリケーションにとって傑出した選択肢となっています。

  • NMSフリー学習: YOLOv10の最も重要な革新は、学習中に一貫したデュアル割り当てを使用することです。これにより、ポストプロセス中のNon-Maximum Suppression (NMS)が不要になり、推論レイテンシが大幅に削減され、デプロイメントパイプラインが簡素化されます。
  • 全体的な効率と精度の設計: このモデルは、バックボーン、ネック、ヘッドの包括的な最適化を特徴としています。軽量な分類ヘッドや空間チャネル分離ダウンサンプリングなどの革新的な技術により、豊富な特徴情報を保持しながら、計算オーバーヘッドを削減します。
  • 優れた効率とスケーラビリティ: YOLOv10は、Nano(N)からExtra-large(X)まで、幅広いスケーラブルなモデルを提供します。これらのモデルは、より少ないパラメータと低い計算コスト(FLOPs)でより高い精度を提供することにより、競合製品を常に上回っています。
  • Ultralyticsエコシステムの利点: YOLOv10はUltralyticsエコシステムにシームレスに統合されています。これにより、シンプルなPython APICLIによる使いやすさ、広範なドキュメント、すぐに利用できる事前トレーニング済みの重みによる効率的なトレーニング、およびより低いメモリ要件を特徴とする、比類のないエクスペリエンスをユーザーに提供します。このモデルは、堅牢なコミュニティとUltralytics HUBによる活発な開発によって支えられています。

長所と短所

YOLOv10は、リアルタイムオブジェクト検出器の新しい標準を打ち立てます。

  • 長所: 最先端の速度と精度、真のエンドツーエンドNMSフリー設計、卓越した計算効率、および優れたスケーラビリティ。十分にメンテナンスされたUltralyticsエコシステムへの統合により、学習、デプロイ、およびメンテナンスが非常に簡単になります。
  • 弱点: 新しいモデルであるため、コミュニティとサードパーティツールは、YOLOv8のような長年確立されたモデルと比較して、まだ成長しています。

ユースケース

YOLOv10の効率性とエンドツーエンド設計により、速度とリソース制約が重要なアプリケーションに最適です。

  • リアルタイムアプリケーション: 自動運転車ロボティクス盗難防止のための高速監視システムなどの自律システムに最適です。
  • エッジ展開: 小型バリアント(YOLOv10n、YOLOv10s)は、Raspberry PiNVIDIA Jetsonのようなリソース制約のあるエッジデバイス向けに高度に最適化されています。
  • 高精度タスク: より大型のモデル(YOLOv10l、YOLOv10x)は、医療画像解析などの要求の厳しい分野で最高レベルの精度を提供します。

YOLOv10の詳細について。

性能分析:PP-YOLOE+ vs. YOLOv10

性能ベンチマークは、YOLOv10の最新アーキテクチャの利点を明確に示しています。PP-YOLOE+xがわずかな差で最高のmAPを達成していますが、YOLOv10は一貫して、すべてのモデルサイズにおいて速度、精度、効率のより良いバランスを提供します。

モデル サイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

例えば、YOLOv10mはPP-YOLOE+mよりも高速で、パラメータ数も大幅に少ない(15.4M対23.43M)にもかかわらず、より高いmAPを達成しています。同様に、YOLOv10lはPP-YOLOE+lよりもパラメータ数がほぼ半分で、精度が上回っています。最高レベルでも、YOLOv10xはPP-YOLOE+xよりもはるかに効率的で、はるかに低いレイテンシと計算量で同等の精度を提供します。

結論: どのモデルを選ぶべきか?

PP-YOLOE+は、PaddlePaddleフレームワークにコミットしているユーザーにとって強力なモデルですが、YOLOv10は、圧倒的多数の開発者および研究者にとって明確な推奨事項です。

YOLOv10は、優れた効率、革新的なNMSフリーアーキテクチャ、および最先端のパフォーマンスにより、汎用性が高く、将来性のある選択肢となっています。Ultralyticsエコシステムへのシームレスな統合により、参入障壁が取り除かれ、エッジデバイスから高性能クラウドサーバーまで、幅広い現実世界のアプリケーションに対応する、使いやすく、十分にサポートされた、非常に有能なソリューションが提供されます。

その他のモデルを見る

他の選択肢を検討されている場合は、Ultralyticsエコシステム内の他の最先端モデルをご検討ください。YOLOv10 vs. YOLOv9YOLOv10 vs. YOLOv8のような詳細な比較をご覧いただけます。最新の開発状況に関心のある方は、新しいUltralytics YOLO11をご確認ください。



📅 1年前に作成 ✏️ 1か月前に更新

コメント