コンテンツにスキップ

PP-YOLOE+ vs. YOLOv8:技術的比較

最適な物体検出アーキテクチャを選択することは、ロバストなコンピュータビジョンアプリケーションの開発において極めて重要なステップです。この決定には、推論速度、検出精度、展開の柔軟性の間の複雑なトレードオフをナビゲートする必要があります。このガイドでは、BaiduPaddlePaddle エコシステムの高精度モデルであるPP-YOLOE+と、Ultralyticsエコシステムの高精度モデルであるPP-YOLOE+の詳細な技術比較を提供します。 Ultralytics YOLOv8多用途性、スピード、開発者に優しいエコシステムで世界的に有名なモデルです。

PP-YOLOE+:PaddlePaddle 精度

PP-YOLOE+は、百度のPaddleDetectionチームによって開発されたPP-YOLOEの進化版である。PP-YOLO +は、PaddlePaddle フレームワーク用に最適化されたYOLO ファミリーの重要なイテレーションである。これまでの最先端(SOTA)ベンチマークを改善するためにリリースされ、学習効率と推論精度のトレードオフを最適化することに重点を置いている。

技術的な詳細 著者PaddlePaddle 執筆者
組織百度
日付: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
ギットハブ:https:PaddlePaddle
ドキュメント: https:PaddlePaddle

PP-YOLOE+の詳細について。

アーキテクチャとコア機能

PP-YOLOE+は最新のアンカーフリーアーキテクチャを採用しており、特定のデータセットに最適なアンカーボックスの寸法を計算する必要がないため、学習プロセスが簡素化される。

  • バックボーン CSPRepResNetバックボーンを利用し、CSPNetの勾配フローの利点とRepVGGの再パラメータ化機能を組み合わせている。これにより、豊富な特徴を学習するための学習時には複雑な構造を持つが、推論時にはよりシンプルで高速な構造を持つモデルが可能となる。
  • ネックこのモデルは、さまざまな大きさの物体を検出するために重要な、異なるスケール間の特徴融合を強化するために、パス集約ネットワーク(PAN)ネックを採用している。
  • ヘッド:重要な革新は、効率的なタスクアライメントヘッド(ET-Head)です。この分離されたヘッドメカニズムは、タスクアライメント学習(TAL)を使用して、分類とローカライズの特徴を分離し、最高の信頼スコアが最も正確なバウンディングボックスに対応するようにします。

強みと限界

強み PP-YOLOE+は、COCO データセットのような標準的なベンチマークで高い性能を発揮するように設計されています。Varifocal LossとDistribution Focal Lossの実装により、クラスの不均衡やローカライゼーションの曖昧性を処理する優れた能力を備えている。

弱点: 多くの開発者にとっての主な制限は、PaddlePaddle フレームワークへの深い依存である。強力ではありますが、PaddlePaddle PyTorch標準ツールに依存する既存のMLOpsパイプラインへの統合を複雑にする可能性があります。さらに、PP-YOLOE+は主に検知に特化しており、より包括的なスイートに見られるネイティブのマルチタスク機能がありません。

Ultralytics YOLOv8:多用途性とパフォーマンスの基準

Ultralytics YOLOv8は、AIモデルの開発・導入方法におけるパラダイムシフトを象徴しています。Ultralytics設計されたYOLOv8は、単なるモデルとしてではなく、検出から複雑な空間分析に至るまで、幅広いコンピュータ・ビジョンのタスクを処理できる完全なフレームワークとして設計されています。

技術的な詳細 著者Glenn Jocher、Ayush Chaurasia、Jing Qiu
組織 Ultralytics
日付: 2023-01-10
GitHub:https:ultralytics
ドキュメント: https:yolov8

YOLOv8の詳細について。

建築とエコシステム

YOLOv8 、これまでのYOLO バージョンの遺産を基に、C3モジュールに代わって改良されたC2fバックボーンを搭載し、勾配フローと特徴抽出の効率を向上させている。

Ultralytics 優位性

YOLOv8 使いやすさに優れている。Ultralytics Python パッケージは、わずか数行のコードでトレーニング、検証、予測を可能にする。

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100)

このシンプルさは、整備されたエコシステムに支えられています。ユーザーは、クラウドトレーニングのためのUltralytics HUB、可視化のためのTensorBoard、ONNX、TensorRT、OpenVINO含む様々なエクスポートフォーマットなどのツールとのシームレスな統合から恩恵を受けることができます。これにより、モデルが単なる研究成果物ではなく、実世界への展開に対応できるようになります。

比較分析:指標とパフォーマンス

これらのモデルを評価する際には、トップラインの精度にとどまらず、効率を考慮することが極めて重要である。以下の表は、主要な測定基準の詳細な比較を示しています。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

スピードと効率

このデータは、YOLOv88の優れた効率性を浮き彫りにしている。その YOLOv8n(nano)モデルは、エッジAIアプリケーションで傑出しており、T4GPU最小のPP-YOLOE+tよりも大幅に高速な1.47msという驚異的な推論速度を達成しています。さらに、YOLOv8n 3.2Mパラメータと8.7B FLOPしか必要としないため、同モデルよりもはるかに軽量です。

正確さとリソース

PP-YOLOE+xは54.7というわずかに高いmAP 達成しているが、1億近いパラメータという多大なコストがかかっている。これに対して YOLOv8xは、約30%少ないパラメータ(68.2M)で53.9mAP 競争力のある結果を出しています。ほとんどの実用的なアプリケーションでは、YOLOv8 よりバランスの取れた性能プロファイルを提供し、膨大な計算オーバーヘッドなしにSOTA精度を実現します。

メモリ効率

Ultralytics YOLO モデルは、学習時と推論時のメモリフットプリントが少ないことで有名です。一部のトランスフォーマーベースのモデルや重いアーキテクチャとは異なり、YOLOv8 コンシューマーグレードのハードウェアで効率的に実行できるように最適化されているため、高価なクラウドコンピューティングリソースの必要性を低減します。

理想的な使用例と用途

これらのモデルのどちらを選択するかは、プロジェクトの具体的な制約に左右されることが多い。

YOLOv8選ぶとき

YOLOv8 、その汎用性と使いやすさから、大多数の開発者に推奨されている。

  • エッジ展開: YOLOv8nような軽量モデルは、Raspberry Pi、NVIDIA Jetson、モバイルデバイスへの展開に最適です。
  • マルチタスクパイプライン:プロジェクトが、セグメンテーションやポーズ推定と同時にオブジェクトトラッキングを必要とする場合(例:スポーツ分析)、YOLOv8 これら全ての機能を1つの統一されたライブラリで提供します。
  • 迅速なプロトタイピング: 事前に訓練された重みとシンプルなAPIを利用できるため、チームは数時間でコンセプトから概念実証に移行できる。
  • クロスプラットフォームのサポート:優れたサポート ONNX, OpenVINOおよびCoreML 優れたサポートにより、あなたのモデルはどこでも動作します。

PP-YOLOE+を検討する時期

PP-YOLOE+は、バイドゥのエコシステムに深く組み込まれているユーザーにとっては、依然として強力な候補である。

  • PaddlePaddle ワークフロー:すでにPaddlePaddle スイートを他のAIタスクに使用しているチームは、PP-YOLOE+が既存のインフラに自然にフィットすることに気づくだろう。
  • 理論上の最大精度:研究コンペティションや、mAP 端数や計算リソースが無制限であるシナリオでは、最大のPP-YOLOE+モデルは非常に有能である。

結論

PP-YOLOE+は、PaddlePaddle フレームワークの能力を印象的な精度数値で実証している、 Ultralytics YOLOv8は、より広範なコンピュータ・ビジョン・コミュニティにとって、より実用的で強力なソリューションとして際立っています。高速性、リソース効率、そしてセグメンテーションと ポーズ推定のネイティブサポートを含む豊富な機能の組み合わせは、最新のAI開発における優れた選択肢となっている。

活気あるオープンソースコミュニティ、広範なドキュメント、継続的なアップデートに支えられ、YOLOv8 、開発者が実世界の問題を効果的に解決するための将来性のあるツールを装備していることを保証します。

その他のモデルを見る

物体検出における最新の進歩に興味をお持ちの方は、以下の関連比較をご覧ください:

  • YOLO11 YOLOv8比較- 最新のYOLO11 v8アーキテクチャをどのように改良したかをご覧ください。
  • YOLOv8 vsRT-DETR- CNNベースのYOLO Transformerベースの検出を比較。
  • YOLOv10 PP-YOLOE+の比較- 新しいリアルタイムモデルとBaiduの提供するサービスの比較をご覧ください。

コメント