YOLOv5 PP-YOLOE+:リアルタイム物体検出器の技術的比較
物体検出に最適なアーキテクチャの選択は、コンピュータビジョンアプリケーションの効率性、精度、スケーラビリティに影響を与える重要な決定です。本ガイドでは、 YOLOv5(世界的に採用されているアクセシブルAIの標準)と、PaddlePaddle から進化を続けるアーキテクチャであるPP-YOLOE+の詳細な技術比較を提供します。
PP-YOLOE+は興味深いアンカーフリーの概念を導入しているが、 YOLOv5 は比類のないエコシステム、頑健性、速度と精度のバランスにより依然として支配的な存在です。将来を見据える開発者向けに、NMS推論で最先端性能を再定義するYOLO26についても触れます。
性能指標とベンチマーク
平均精度(mAP) と推論遅延のトレードオフがモデルの有用性を定義する。以下の表は、COCO YOLOv5 性能を比較したものである。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Ultralytics YOLOv5
グレン・ジョチャーと Ultralyticsによってリリースされた YOLOv5 は、高性能な物体検出を誰もが利用できるようにすることで、この分野に革命をもたらしました。 PyTorchにネイティブ実装され、「開始から完了まで」の使いやすさを最優先し、開発者がデータセットからデプロイまでを史上最速で実現できるようにしました。
アーキテクチャと設計
YOLOv5 、計算コストを最小化しながら勾配の流れを最大化するため、CSPDarknetバックボーン(Cross Stage Partial Network)YOLOv5 。アンカーベースの検出ヘッドを採用しており、事前定義されたアンカーボックスを用いて物体の位置を予測します。この手法は実戦で実証済みであり、航空写真から医療画像まで、多様なデータセットにおいて安定した収束を実現します。
主な利点
- 生産環境対応度: YOLOv5 世界中の数百万のアプリケーションにYOLOv5 、極めて高い安定性を保証します。
- 多様性: detect機能に加えて、インスタンスセグメンテーションと画像分類をネイティブでサポートしています。
- エクスポート機能:本モデルはONNX、TensorRT、CoreML、TFLite シームレスなエクスポートを提供し、多様なハードウェアターゲットTFLite
PP-YOLOE+の概要
PP-YOLOE+は、百度のPaddlePaddle が開発したPP-YOLOEの進化版です。2022年4月にリリースされ、アンカーフリー機構の改善と高性能計算環境向けのバックボーンアーキテクチャの洗練に焦点を当てています。
アーキテクチャと設計
PP-YOLOE+はアンカーフリーパラダイムを採用し、アンカーボックスのハイパーパラメータ調整を不要としています。CSPRepResStageバックボーンを利用し、残差接続と再パラメータ化技術(RepVGGスタイル)を組み合わせることで、特徴抽出能力を維持しつつ推論速度を向上させます。また、タスクアラインメント学習(TAL)を採用し、学習中の分類タスクと位置特定タスクの連携を強化します。
ユースケースの考慮事項
PP-YOLOE+COCO 高いmAP を達成する一方、PaddlePaddle 密接に連携しています。これにより、標準PyTorch TensorFlow 依存するインフラを持つチームには課題が生じ得ます。その主な強みは、デプロイの柔軟性やトレーニングの容易さよりも最高精度を優先するシナリオにあります。
詳細な技術比較
1. トレーニング方法論と使いやすさ
決定的な違いの一つはユーザー体験にある。 YOLOv5 は「ゼロからヒーローへ」というワークフローで有名です。Ultralytics 、データ拡張(モザイク、MixUp)やハイパーパラメータ進化といった複雑なタスクを自動化します。
- YOLOv5:直感的なコマンドラインインターフェース(CLI)Python を使用します。AutoAnchorによるアンカーボックスの計算を自動的に処理し、手動介入なしにモデルがカスタムデータセットに適応することを保証します。
- PP-YOLOE+:PaddleDetection構成システムに依存しています。強力ではありますが、多くの開発者にとって学習曲線が急峻な、特定の構成ファイルやPaddlePaddle に対する深い理解を必要とすることが多々あります。
2. 推論速度とデプロイメント
YOLOv5 CPU にYOLOv5 、ラズベリーパイやスマートフォンなどのデバイスにおけるエッジAIアプリケーションに最適な選択肢です。表に示す通り、YOLOv5n(Nano)モデルは驚異的な速度を達成しており、リアルタイム追跡に不可欠です。
PP-YOLOE+はTensorRTを用いたGPU に重点を置いています。サーバーグレードのハードウェア(T4GPUなど)では良好な性能を発揮しますが、高度に最適化されたUltralytics と比較すると、GPU に必要な軽量最適化が不足している場合が多いです。
3. メモリ効率
Ultralytics メモリ効率を重視して設計されています。YOLOv5トレーニングYOLOv5コンシューマー向けGPUでの実行に最適化されており、AIへのアクセスを民主化しています。一方、新しいトランスフォーマーベースや複雑なアーキテクチャ設計では、多くの場合CUDA が必要となり、参入障壁が高くなります。YOLOv5バランスの取れたアーキテクチャは、不要なパラメータの肥大化を避けつつ、特徴抽出の堅牢性を確保します。
現実世界のアプリケーション
- YOLOv5 は、専用サーバーを必要とせず遠隔地や店舗のエッジデバイス上で動作する能力から、アグリテック(例:作物病害検出)や小売分析の分野で広く採用されています。
- PP-YOLOE+は、制御された環境における産業用検査にしばしば適している。そこでは、わずかな精度向上のためにやや重い計算を処理できる強力なGPU 利用可能である。
ワークフローのヒント:Ultralytics
Ultralytics を使用すると、Ultralytics にアクセスできます。この統合インターフェースにより、データセットの管理、クラウド上でのトレーニング、ワンクリックでのあらゆる形式(ONNX、TFLite)へのデプロイが可能となり、生のフレームワークスクリプトを管理する場合と比較してMLOpsの負担を大幅に軽減します。
未来:YOLO26へのアップグレード
YOLOv5 伝説的なYOLOv5 、この分野はさらに進歩しています。最高の性能を求める開発者には、YOLO26をお勧めします。
YOLO26は エンドツーエンドNMS設計によりパラダイムシフトを実現します。非最大抑制(NMS)を排除することで、推論遅延と導入の複雑さを低減します。さらに以下の特長を備えています:
- MuSGDオプティマイザー:大規模言語モデル(LLM)レベルのトレーニング安定性を実現する、SGD ミューオンのハイブリッド手法。
- 最大43%高速CPU :エッジコンピューティング向けに最適化。
- ProgLoss + STAL: 小物体検出を改善する高度な損失関数。ドローンやIoTアプリケーションにおいて重要な領域。
アップグレードの容易さ
統一されたPython のおかげで、YOLOv5 から最新のUltralytics YOLOv5 移行は簡単です。
from ultralytics import YOLO
# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")
# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
結論
両アーキテクチャにはそれぞれ利点がある。PP-YOLOE+は GPUワークロードにおいてCOCO で強力な理論性能を提供する。しかし、 YOLOv5 は依然として、使いやすさ、デプロイの柔軟性、エッジ性能においてトップクラスです。
ほとんどの開発者や研究者にとって、Ultralytics 内に留まることは、長期的な保守性と最新のブレークスルーへのアクセスを保証します。信頼性の高いYOLOv5 を使い続けるかYOLOv5 最先端のYOLO26にアップグレードYOLOv5 に関わらず、 YOLO26にアップグレードする場合でも、実世界の成功のために設計された、コミュニティ主導の高度に最適化されたプラットフォームの恩恵を受けられます。
他の選択肢を検討するには、以下を参照してください YOLO11 や、 RT-DETR などの専用モデルを検討してください。