コンテンツにスキップ

YOLOv6.0 対 PP-YOLOE+:産業用物体検出器の評価

リアルタイム物体検出のフレームワーク選定において、機械学習エンジニアは頻繁に多様な高性能アーキテクチャを評価する。産業アプリケーション分野で注目すべきモデルとしてYOLOv6. 0とPP-YOLOE+が挙げられる両モデルは精度と速度の限界を押し広げたが、それぞれが対象とするエコシステムと導入ハードウェアが若干異なる。

この技術比較では、各モデルのアーキテクチャ、性能指標、学習手法を詳細に検証するとともに、優れた汎用性と使いやすさをUltralytics 現代的な代替手法も紹介する。

YOLOv6.0: 高スループット産業用エンジン

MeituanのVision AI部門によって開発されたYOLOv6-3.0は、産業環境、特に強力なサーバーグレードGPUを活用する環境向けに大幅に最適化されています。

  • 著者:Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
  • 組織:美団(Meituan
  • 日付: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub:YOLOv6

アーキテクチャの革新

YOLOv6.YOLOv6、NVIDIA ハードウェアアクセラレータの活用を最大化するために特別に設計されたEfficientRepバックボーンを採用しています。 このアーキテクチャはネック部内に双方向連結(BiC)モジュールを導入し、マルチスケール特徴量の融合を大幅に改善します。さらにアンカー補助学習(AAT)戦略を組み込んでいます。このハイブリッド手法は、学習段階ではアンカーベースネットワークの強固な収束特性を享受しつつ、推論時にはアンカーを破棄することでアンカーフリー手法に典型的な高速性を維持します。

YOLOv6について詳しくはこちら

PP-YOLOE+:PaddlePaddle検出チャンピオン

PP-YOLOE+は、Baiduの研究者によってPaddlePaddleフレームワーク内で完全に開発されたPP-YOLOシリーズの進化形です。Paddleエコシステムがすでに確立されている環境で優れた性能を発揮します。

アーキテクチャの革新

PP-YOLOE+はアンカーフリー検出器であり、TAL(タスクアラインメント学習)と呼ばれる動的ラベル割り当て戦略を導入している。CSPRepResNetバックボーンを採用し、計算効率を維持しつつ意味的特徴を効率的に捕捉する。OpenVINO経由での展開向けに高度に最適化されており、PaddlePaddle 操作に慣れているユーザーであれば、エッジおよびサーバー展開における有力な選択肢となる。

PP-YOLOE+の詳細について。

フレームワークに関する考慮事項

PP-YOLOE+は優れた結果をもたらす一方で、PaddlePaddle への依存はPyTorchに慣れたエンジニアにとって学習曲線となるPaddlePaddle 。 Ultralytics のような統一されたフレームワークを活用することで、セットアップ時間を大幅に短縮できます。

パフォーマンス比較

これらのモデルを評価するには、平均精度(mAP)と推論速度のバランスを考慮する必要があります。以下の表は、COCO検証データセットにおけるそれらのパフォーマンスを強調しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

両モデルとも高い性能を発揮するが、YOLOv6.YOLOv6一般的に小規模TensorRT わずかな優位性を維持しており、高速自動レジや製造欠陥検出に極めて有効である。一方、PP-YOLOX+は最大精度を得るため、大規模なパラメータ数への拡張性に優れている。

Ultralytics :YOLO26のご紹介

YOLOv6.YOLOv6とYOLOv6高い性能を発揮しますが、コンピュータビジョンの急速な進化には、単なる処理速度だけでなく、卓越した使いやすさ、低メモリ要件、そして統一されたエコシステムを提供するアーキテクチャが求められます。ここで Ultralytics YOLO モデル、特に YOLO11 と最先端の YOLO26は、最先端技術を再定義している。

2026年1月にリリースされたYOLO26は、エッジファーストかつクラウド対応のビジョンAIにおける新たな基準を確立し、従来モデルに対して以下の大きな利点を提供します:

  • エンドツーエンドのNMSフリー設計: YOLOv10で築かれた基盤に基づいて、YOLO26は後処理中の非最大抑制(NMS)をネイティブに排除します。これにより、デプロイロジックが大幅に簡素化され、混雑したシーンでのレイテンシの変動が低減されます。
  • 最大43%高速なCPU推論: Distribution Focal Loss (DFL) を戦略的に削除することで、YOLO26 は CPU 性能を劇的に加速させ、IoTデバイスおよびモバイルアプリケーションにおいて、YOLOv6 や PP-YOLOE+ よりも遥かに優れています。
  • MuSGDオプティマイザ: 高度なLLMトレーニング技術(Moonshot AIのKimi K2など)に触発されたハイブリッドMuSGDオプティマイザは、驚くほど安定した効率的なトレーニングを実現し、従来のSGDやAdamWよりも高速に収束します。
  • ProgLoss + STAL: これらの高度な損失関数は、小さなオブジェクトの認識において著しい改善をもたらし、ドローン画像や航空監視にとって重要な要素となります。
  • タスク間の多様性: detectに重点を置いたYOLOv6-3.0とは異なり、YOLO26はインスタンスセグメンテーション姿勢推定分類、そしてOriented Bounding Box (obb) detectをすぐに利用できます。

合理化されたトレーニングエコシステム

PP-YOLOE+のデプロイにはPaddlePaddle環境の管理が必要であり、YOLOv6-3.0は研究に特化したスクリプトを操作する必要があります。対照的に、Ultralytics Platformは、シームレスなゼロからヒーローへの体験を提供します。

最先端のYOLO26モデルのトレーニングには、わずか数行のPythonで済みます:

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

このシンプルなAPIは、トランスフォーマーを多用するモデルと比較して学習時のメモリ使用量が少ないという利点と相まって RT-DETRといったトランスフォーマーを多用するモデルと比較して、トレーニング時のメモリ使用量が少ないという特徴と相まって、高性能AIの民主化を実現します。

理想的なユースケースと導入戦略

適切なモデルの選択が、デプロイメントパイプラインの成功を左右します。

YOLOv6.0の使用タイミング

  • 高速製造: 産業用カメラが専用のNVIDIA T4またはA100 GPUに直接供給され、5ms未満の一貫した推論が求められる環境。
  • サーバーサイドビデオ分析: 純粋なGPUスループットが主要なボトルネックとなる、複数の高密度ビデオストリームを処理します。

PP-YOLOE+の使用タイミング

  • Baidu/Paddleエコシステム: PaddlePaddle技術スタックに多額の投資をしている企業環境、またはBaiduのツールチェーンに最適化されたハードウェアに特化してデプロイしている企業環境。
  • 高精度静止画像: Extra-Large (PP-YOLOE+x) モデルの高いmAPが、エッジ展開速度よりも重要となるシナリオ。

Ultralytics YOLO26を選択すべきタイミング

  • エッジおよびIoTデバイス: NMSフリー設計とDFLの削除により、YOLO26はRaspberry Pi、NXP、またはモバイルCPUへのデプロイにおいて揺るぎない選択肢です。
  • マルチタスクアプリケーション: 統合されたAPIを使用して、同時物体track、姿勢推定、またはsegmentationを必要とするプロジェクト。
  • 迅速なプロトタイピングから本番環境へ: 合理化されたデータセットアノテーション、ハイパーパラメータチューニング、ワンクリックモデルデプロイのためにUltralytics Platformを活用するチーム向け。

detectモデルのより広い範囲を探求したい開発者向けに、YOLOXDAMO-YOLOのようなフレームワークも、Ultralyticsドキュメントで検討する価値のある独自のアーキテクチャアプローチを提供しています。


コメント