モデルの比較:物体検出におけるPP-YOLOE+とYOLO11 比較
物体検出用のコンピュータビジョンモデルを選択する際には、異なるアーキテクチャの長所と短所を理解することが不可欠です。このページでは、2つの最先端モデルであるPP-YOLOE+とUltralytics YOLO11詳細な技術比較をご紹介します。
Ultralytics YOLO11:最先端の効率性と多用途性
Ultralytics YOLO YOLO11、Ultralytics 社のGlenn Jocher氏とJing Qiu氏によって執筆され、2024-09-27にリリースされました。リアルタイムの物体検出用に設計されており、多様なアプリケーションにおいて速度と精度のバランスに優れています。YOLO11 、これまでのYOLO モデルをベースに、画像分類、インスタンスセグメンテーション、ポーズ推定などのタスクにわたって性能と汎用性を向上させるアーキテクチャの強化を導入しています。
アーキテクチャと主な特徴
YOLO11 、シングルステージ、アンカーなしの検出パラダイムを維持し、推論速度を優先している。主なアーキテクチャの特徴は以下の通り:
- 効率的なバックボーン:迅速な特徴抽出のための合理化されたバックボーン。
- スケーラビリティ: NVIDIA Jetsonのようなエッジデバイスからクラウドサーバーまで、さまざまな計算ニーズや展開環境に対応できるよう、複数のサイズ(n、s、m、l、x)をご用意しています。
- 汎用性: Ultralytics エコシステムの中で柔軟なソリューションを提供します。
パフォーマンス指標
YOLO11 、スピードと精度の強力なバランスを示し、リアルタイム・アプリケーションに適している。
- mAP:COCOのようなデータセットで最先端の平均精度(mAP)を達成。mAPおよびその他の評価指標の詳細については、YOLO Performance Metricsガイドを参照してください。
- 推論速度: ストリーミング・アプリケーションのビジョンAIに見られるようなリアルタイム処理のニーズに不可欠な、高速推論に最適化されています。
- モデルサイズ:コンパクトなモデルサイズを維持し、リソースに制約のあるデバイスへの展開を容易にします。
強みと弱み
強みだ:
- 多用途で正確:様々なビジョンタスクに対応し、高い精度とスピードを提供します。
- ユーザーフレンドリーなエコシステム: Ultralytics エコシステム内のシームレスな統合。 PythonおよびCLI 使用方法に関する包括的なドキュメントを提供します。
- スケーラブルな展開:複数のモデルサイズにより、異なるハードウェアへの適応性を保証します。
弱点がある:
- 計算需要:大規模なモデルは計算負荷が高く、最適なリアルタイム性能を実現するためには強力なハードウェアが必要となります。
- 新規ユーザーにとっての複雑さ:ユーザーフレンドリーではあるが、アーキテクチャの微調整やニュアンスの理解は、コンピュータビジョンの新規ユーザーにとって学習曲線となるかもしれない。
理想的な使用例
YOLO11 11は、高精度でリアルタイムの物体検出を必要とするアプリケーションに適している:
- リアルタイムビデオ解析: 待ち行列管理やセキュリティシステムなどのアプリケーションは、その速度と精度の恩恵を受ける。
- エッジAIの展開: Raspberry Piのようなプラットフォーム上のオンデバイス処理に効率的。
- 自律システム:自動運転アプリケーションにおけるビジョンAIで強調されているように、迅速で正確な知覚を必要とする自動運転車やロボット工学に最適。
PP-YOLOE+:精度重視で効率的
バイドゥのPaddlePaddle Authorsが開発し、2022-04-02にリリースされたPP-YOLOE+(PracticalYOLO with Evolved Enhancement)は、合理的な効率で高精度の物体検出を行うために設計されている。PP-YOLOEシリーズの強化版で、精度が最も重要な産業用途に焦点を当てている。PP-YOLOE+は推論速度を大幅に犠牲にすることなく精度を優先しており、PaddleDetectionモデルズーの一部である。
アーキテクチャと主な特徴
PP-YOLOE+はまた、アンカーを使わないアプローチを採用し、精度と効率を重視している。主な特徴は以下の通り:
- 高精度フォーカス:物体検出タスクでトップクラスの精度を達成するために、アーキテクチャを改良。
- 効率的な設計:精度と効率的な推論速度のバランスがとれており、要求の厳しいアプリケーションに適しています。
- PaddlePaddle 統合: PaddlePaddle ディープラーニングフレームワークを活用し、その最適化とエコシステムの恩恵を受ける。
パフォーマンス指標
PP-YOLOE+は、競争力のあるスピードを維持しながら、精度に優れている:
- 高いmAP: PP-YOLOE+のドキュメントに詳述されているように、COCOのようなベンチマークデータセットで高い精度を実証し、高い平均精度(mAP)を達成。
- 効率的な推論:精度と推論速度のバランスが良く、リアルタイム分析が必要な産業アプリケーションに適しています。
- モデルサイズさまざまな計算リソースに対応できるよう、さまざまなモデルサイズを用意しています。
強みと弱み
強みだ:
- 卓越した精度: 製造業の品質検査のような精密さが要求されるアプリケーションに不可欠な、高い検出精度を優先。
- 産業用フォーカス:信頼性が高く正確な物体検出を必要とする産業環境に適しています。
- PaddlePaddle エコシステム: PaddlePaddle フレームワークのエコシステムと最適化の恩恵。
弱点がある:
- エコシステムのロックイン:主にPaddlePaddle エコシステム内にある。 PyTorchUltralytics YOLO使用されているPyTorchのような他のフレームワークに深く組み込まれているユーザーにとっては考慮すべき点かもしれない。
- Ultralytics コンテキストでは汎用性が低い:能力は高いが、YOLO11 Ultralytics タスク汎用フレームワークにネイティブに統合されていない。
理想的な使用例
PP-YOLOE+は、精度が最優先される用途に最適です:
- 工業品質管理: 製造工程における正確な欠陥検出と品質保証を必要とするアプリケーション。
- 精密農業:正確な検出が意思決定に影響を与える作物モニタリングや収穫量推定のような作業。
- ヘルスケアイメージング医療画像診断における腫瘍検出など、検出精度が診断に不可欠な医療画像解析。
モデル比較表
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
結論
PP-YOLOE+とYOLO11 11はどちらも堅牢な物体検出モデルで、それぞれにユニークな利点があります。YOLO11 、Ultralytics エコシステムの中で、様々なビジョンタスクにおいて速度と精度のバランスを必要とするアプリケーションに理想的な、多用途で高性能なソリューションを提供します。PP-YOLOE+は精度と効率に優れており、特にPaddlePaddle フレームワーク内のユーザーや、産業環境で精度を優先するユーザーにとって有益です。
Ultralytics エコシステム内の他のモデルの調査に興味のあるユーザーは、こちらもご検討ください:
- YOLOv8YOLO シリーズの中でも汎用性が高く、使い勝手の良いモデル。
- YOLOv9- 精度と効率の進化で知られる。
- YOLO- パフォーマンスを最適化するためにニューラル・アーキテクチャ検索によって設計されたモデル。
- RT-DETR- リアルタイム・ディテクション・トランスフォーマー(Real-Time DEtection Transformer)。
- YOLOv7、YOLOv6、および YOLOv5YOLO ファミリーの旧バージョンで、それぞれが独自の性能特性と強みを持つ。