モデルの比較:物体検出におけるYOLO11 PP-YOLOE+の比較
適切な物体検出モデルを選択することは、コンピュータビジョンプロジェクトにとって非常に重要です。Ultralytics YOLO11 PP-YOLOE+はどちらも最先端のモデルで、それぞれ異なるアプリケーションのニーズに応える独自の強みを備えています。このページでは、これらの強力なモデルのどちらを選択するか、十分な情報を得た上で決定するための詳細な技術比較を提供します。
Ultralytics YOLO11
Ultralytics YOLO11 11は、Ultralytics社が開発したYOLO シリーズの最新版です。リアルタイムの物体検出機能で知られるYOLO11 11は、前バージョンをベースに、スピードと精度の両方を向上させています。シングルステージ検出のパラダイムを維持し、精度を落とすことなく効率的な推論を優先しています。
アーキテクチャと主な特徴
YOLO11 、高速推論に最適化された合理的なアーキテクチャを特徴としている。ネットワーク・トポロジーとトレーニング技術の進歩を取り入れ、パラメータ数と性能のバランスを実現している。主なアーキテクチャの特徴は以下の通り:
- 効率的なバックボーン:高速な特徴抽出のために高効率なバックボーンネットワークを利用。
- アンカーフリー検出: YOLOv8同様に、アンカーボックスなしで動作し、検出プロセスを簡素化し、さまざまなオブジェクトのスケールに対する適応性を向上させる。
- スケーラブルなモデルサイズ:エッジデバイスから高性能サーバーまで、多様な計算リソースに対応する幅広いモデルサイズ(n、s、m、l、x)を提供。
パフォーマンス指標
YOLO11 速度と精度のバランスに優れており、リアルタイムアプリケーションに適している。驚異的な推論速度を維持しながら、COCOのようなデータセットで最先端の平均精度(mAP)を示しています。以下の比較表で詳しく説明されているように、異なるモデルサイズは速度と精度のトレードオフを提供します。
使用例と強み
YOLO11 11は、スピードと高精度の融合を必要とするアプリケーションに最適です:
- リアルタイムビデオ解析:セキュリティ・システム、交通監視、待ち行列管理などのアプリケーションで、YOLO11スピードと精度が威力を発揮します。
- エッジ展開:その効率性とコンパクトなサイズにより、YOLO11 Raspberry Piや NVIDIA Jetsonのようなエッジデバイスへの展開に最適です。
- 多彩なアプリケーション: 製造業における品質管理のためのAIから、小売業における盗難防止のためのコンピューター・ビジョンまで、YOLO11適応性の高さは、様々な領域における強力な選択肢となっている。
著者名と日付
- 著者グレン・ジョーチャー、ジン・チュウ
- 組織 Ultralytics
- 日付:2024-09-27
- GitHubリンク: Ultralytics YOLOv8 GitHubリポジトリ
- ドキュメントリンク Ultralytics YOLO11 ドキュメント
PP-YOLOE+
PP-YOLOE+(PracticalPaddlePaddle You Only Look One-level Efficient Plus)は、バイドゥがPaddleDetectionモデルズーの一部として開発した。PP-YOLOE+は、PaddleDetectionのモデル動物園の一部としてバイドゥによって開発された。PP-YOLOE+はPP-YOLOEの強化版であり、性能向上のためのアーキテクチャの改良が盛り込まれている。
アーキテクチャと主な特徴
PP-YOLOE+は、アンカーを使わない1段階の物体検出モデルです。オブジェクトの中心とバウンディングボックスのパラメータを直接予測することで、検出プロセスを簡素化します。主な特徴は以下の通りです:
- アンカーフリー設計:アンカーボックスの複雑さを回避し、モデル構築とトレーニングを簡素化。
- 効率的なアーキテクチャ:ResNetバックボーンを採用し、競争力のある精度を維持しながら計算オーバーヘッドを削減する最適化技術に重点を置いています。
- PaddlePaddle エコシステム統合: PaddlePaddle エコシステムの利点を活用し、PaddlePaddle フレームワーク内でのシームレスな統合と展開のために最適化されています。
パフォーマンス指標
PP-YOLOE+モデルは、精度と速度のバランスをとるために、さまざまな構成(t、s、m、l、x)を提供する。提供されたデータでは、詳細なCPU ONNX 速度メトリクスは容易に入手できないが、PP-YOLOE+ モデルは、競合する mAP と効率的なTensorRT 推論速度を示しており、精度と効率的な展開が重要なアプリケーションに適している。
使用例と強み
PP-YOLOE+は、特にPaddlePaddle エコシステムにおいて、高い精度と効率が最優先される用途に適している:
- 工業用検査:製造現場での高速品質検査に最適で、その精度と効率性の恩恵を受けています。
- エッジコンピューティング:最適化されたアーキテクチャにより、モバイル機器や組み込み機器に効率的に導入できる。
- ロボティクスダイナミックな環境で動作するロボットに、スピードと精度を活かしたリアルタイムの知覚を提供。
- 高スループット処理:大量の画像やビデオストリームで高速な物体検出を必要とするシナリオに適しています。
著者名と日付
- 著者紹介 PaddlePaddle 執筆者
- 組織百度
- 日付:2022-04-02
- ArXivリンク PP-YOLOE ArXiv論文
- GitHubリンク PaddleDetection GitHub リポジトリ
- ドキュメントリンク PP-YOLOE+ ドキュメンテーション
モデル比較表
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
結論
YOLO11 PP-YOLOE+はどちらも堅牢な物体検出モデルです。YOLO11 、Ultralytics エコシステムの中で、様々なタスクにおいてスピードと精度のバランスを効果的にとりながら、多用途でユーザーフレンドリーな体験を提供します。PP-YOLOE+は、特にPaddlePaddle フレームワーク内に統合されたユーザーや、産業用途でアンカーフリー設計を優先するユーザーにとって、精度と効率性に優れています。
他のモデルに興味のあるユーザーには、Ultralytics 以下のような最先端のモデルを提供している: