コンテンツにスキップ

PP-YOLOE+ 対YOLO: 包括的な技術比較

コンピュータビジョンの継続的な進化により、リアルタイム物体検出のための高度に専門化されたアーキテクチャが数多く生み出されている。産業および研究用途向けのモデルを評価する際、2022年に登場した2つの主要なフレームワークがしばしば議論の対象となる:百度のPP-YOLOE+とアリババグループYOLO。両モデルとも、新規のバックボーン、高度なラベル割り当て戦略、特化した特徴融合技術を導入することで、アンカーフリー検出の限界を押し広げた。

本ガイドでは、YOLO詳細な技術分析を提供し、そのアーキテクチャ、トレーニング手法、および導入時の強みを探ります。また、Ultralytics などの最新ソリューションとの比較も検討し、特定の導入制約に最適なツールを選択するお手伝いをします。

PP-YOLOE+: 高精度産業用物体検出

百度エコシステム内で開発されたPP-YOLOE+は、元のPP-YOLOEを反復的に改良したもので、PaddlePaddle 学習フレームワーク向けに高度に最適化されています。サーバーグレードのハードウェア上で精度と推論速度を最大化するように設計されており、産業用検査やスマート小売アプリケーションにおける有力な候補となっています。

アーキテクチャの革新

PP-YOLOE+は、従来のアンカーフリー検出器を改善するため、いくつかのアーキテクチャ上の強化を導入します:

  • CSPRepResNetバックボーン:このバックボーンはRepVGGスタイルのアーキテクチャとクロスステージ部分接続(CSP)を組み合わせた構造を採用し、特徴抽出能力と推論遅延の間に優れたバランスを実現している。
  • タスクアラインメント学習(TAL):PP-YOLOE+は、学習中に分類タスクと回帰タスクを整合させる高度な動的ラベル割り当て戦略を採用し、学習時と推論時の性能差を縮小する。
  • 効率的なタスク対応ヘッド(ET-head):空間分解能を損なうことなく特徴を高速処理するよう設計された合理化された検出ヘッドであり、高いmAP を維持する上で極めて有益である。

PP-YOLOE+の詳細:

PP-YOLOE+の詳細について。

YOLO: エッジにおけるニューラルアーキテクチャ探索

アリババDAMOアカデミーが開発YOLO 、従来とは明らかに異なるアプローチYOLO 。バックボーンを手動で設計する代わりに、研究チームはニューラルアーキテクチャ検索(NAS)を活用し、厳しい遅延制約に最適化された高効率なネットワークトポロジーを発見した。

主な機能とトレーニング・パイプライン

YOLO 、自動化とディスティレーションを多用した手法を通じて、低遅延と高精度をYOLO :

  • MAE-NASバックボーン:効率的なニューラルアーキテクチャ探索の自動化手法(Method of Automating Efficient Neural Architecture Search)を活用することで、YOLO パラメータと精度のトレードオフを最適化したバックボーンYOLO 。
  • 効率的なRepGFPN:再パラメータ化された汎用特徴ピラミッドネットワークにより、頑健なマルチスケール特徴融合を実現。これにより、単一フレーム内で大きく異なるサイズのdetect 可能となる。
  • ZeroHead Design:推論フェーズにおける計算オーバーヘッドを大幅に削減する、高度に簡素化された検出ヘッド。
  • 蒸留強化:小型モデルの性能向上を図るため、YOLO 教師モデルが生徒モデルを導く複雑な知識蒸留プロセスに大きくYOLO 。

DAMO-YOLOの詳細:

DAMO-YOLOの詳細

フレームワークのロックイン

PP-YOLOE+とYOLO はいずれも堅牢な理論的革新YOLO ものの、それぞれのフレームワーク(PaddlePaddle )に強く依存している。このため、これらのモデルを標準化されたクラウドまたはエッジ環境へ移植しようとする際に摩擦が生じる可能性がある。

パフォーマンス分析

これらのモデルを評価する際、レイテンシ、計算複雑度(FLOPs)、平均精度(mAP)のトレードオフが、その理想的な展開環境を決定する。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLO 、nanoおよびtinyスケールにおいてTensorRT 低減し、高スループットの動画ストリーム処理において高い競争力を発揮する。しかし、PP-YOLOE+はextralargeスケールにおいて驚異的なスケーラビリティを発揮する(xこのバリアントは、推論時間が二次的な懸念事項となる複雑な画像において、最上位クラスの精度を達成する。

Ultralytics :2022年以降のアーキテクチャを凌駕する進化

PP-YOLOE+YOLO 重要なYOLO 、現代の開発にはより高い汎用性、簡便なトレーニングパイプライン、低メモリ要件が求められる。Ultralytics は、従来のモデルで必要だった複雑な蒸留やフレームワーク固有の設定を大幅に凌駕する、摩擦のない体験を提供することでこれらのニーズに対応する。

今日の開発者が最高のパフォーマンスバランスを実現するために、Ultralytics 実環境での導入効率において画期的な飛躍をもたらします。

YOLO26が業界をリードする理由

2026年初頭にリリースされたYOLO26は、 YOLO11 の遺産を継承し、生産向けに特化した画期的な技術を導入しています:

  • エンドツーエンドNMS設計:YOLO26は非最大抑制(NMS)後処理を排除します。これにより、よりシンプルな展開ロジックと、一貫性があり予測性の高い推論レイテンシが実現されます。
  • MuSGDオプティマイザー:大規模言語モデル訓練技術に着想を得たYOLO26は、ハイブリッドMuSGDオプティマイザーを採用しています。これにより、極めて安定した訓練と迅速な収束が保証され、GPU 節約します。
  • 優れたCPU :分布焦点損失(DFL)の除去とネットワークグラフの最適化により、YOLO26は最大43%高速CPU を実現し、エッジAIデバイスにおける最良の選択肢となっています。
  • ProgLoss + STAL:これらの高度な損失関数は、ドローン運用やリモートセンシングにおいて極めて重要な小規模物体認識において顕著な改善をもたらす。
  • 比類なき汎用性:検出に特化したPP-YOLOE+とは異なり、YOLO26は姿勢推定インスタンスセグメンテーション画像分類、および向き付き境界ボックス(OBB)をシームレスにネイティブサポートします。

使いやすさとトレーニング効率

YOLO トレーニングには、重い教師-生徒蒸留パイプラインの管理が必要です。これに対し、Ultralytics トレーニングにはわずか数行のPythonのみで済み、CUDA アーキテクチャと比較してCUDA 最小限です。

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

YOLO26についてさらに詳しく

理想的な使用例と推奨事項

最適なコンピュータビジョンアーキテクチャの選択は、チームのエコシステム統合とデプロイメント目標に大きく依存します。

  • パイプライン全体が百度PaddlePaddle に深く組み込まれている場合は、PP-YOLOE+を選択してください。精度最大化が最優先課題となる高性能サーバーでの静的画像分析においては、依然として優れた選択肢です。
  • ニューラルアーキテクチャ検索アルゴリズムに関する特定の研究を行っている場合、またはTensorRT 厳しいTensorRT 目標を達成するために複雑な蒸留パイプラインを維持するエンジニアリングリソースがある場合には、YOLOを選択してください
  • ほぼすべての現代的な実稼働シナリオ Ultralytics を選択してくださいUltralytics 比類のないドキュメント、低メモリ要件、そして合理化されたAPIを提供します。自動化された品質管理システムを構築する場合でも、Raspberry Pi上でリアルタイム追跡を実行する場合でも、YOLO26NMSアーキテクチャは、箱から出してすぐに高速で安定した高精度な結果を保証します。

他の最先端ソリューションを検討中の開発者向けに、Ultralytics では広く採用されている YOLOv8 および堅牢な YOLO11に関する豊富なリソースを提供しており、あらゆるコンピュータービジョン課題に適したモデルを選択できるよう支援します。


コメント