Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 対 YOLOv6-3.0#

リアルタイムコンピュータビジョンの分野は急速に拡大しており、多様なデプロイメントシナリオに最適化された高度に専門化されたアーキテクチャが生まれています。開発者は、高いスループットと信頼性の高い精度のバランスを必要とするアプリケーションを構築する際、頻繁にPP-YOLOE+YOLOv6-3.0を比較します。両モデルとも、産業用やエッジアプリケーション向けの推論速度の向上に注力し、リリース時に大幅なアーキテクチャの改善をもたらしました。

詳細なアーキテクチャの分析に入る前に、以下のチャートを確認して、これらのモデルの速度と精度のパフォーマンスが互いにどのように比較されるかを視覚化してください。

Link to this sectionPP-YOLOE+: アーキテクチャの強みと弱み#

PaddlePaddle Authorsによって開発されたPP-YOLOE+は、先行モデルをベースにしており、さまざまなスケールの要件にわたって堅牢なパフォーマンスを提供する著名なアンカーフリー検出器です。

Link to this sectionアーキテクチャのハイライト#

PP-YOLOE+は、オリジナルのPP-YOLOE設計に対していくつかの重要な機能強化を導入しました。計算コストと特徴抽出能力を効率的に両立させる強力なCSPRepResNetバックボーンを活用しています。さらに、高度な特徴ピラミッドネットワーク(FPN)とPath Aggregation Network (PAN) を組み合わせて、マルチスケールの特徴融合を確実にしています。その際立った特徴の1つは、物体検出における分類とローカリゼーションの調整を大幅に改善するET-head (Efficient Task-aligned head) です。

PP-YOLOE+は印象的な平均適合率(mAP)を達成しますが、PaddlePaddleエコシステムへの依存は、PyTorchネイティブのワークフローに慣れた研究者にとって学習コストが高い場合があります。これは、直接的なPaddle推論サポートを欠く異種混在型のエッジデバイスをターゲットにする際、モデルデプロイメントプロセスをわずかに複雑にする可能性があります。

デプロイメントの文脈

PP-YOLOE+はBaiduのテクノロジースタック内でのデプロイメントに高度に最適化されており、制作環境がPaddle推論ツールに大きく依存している場合には優れた選択肢となります。

PP-YOLOE+の詳細はこちら

Link to this sectionYOLOv6-3.0: 産業用スループット#

Meituan Vision AI DepartmentによってリリースされたYOLOv6-3.0は、GPUハードウェア上での膨大なスループットを優先し、産業用アプリケーション向けの次世代物体検出器として明示的に設計されました。

Link to this sectionアーキテクチャのハイライト#

YOLOv6-3.0 features an EfficientRep backbone specifically tailored to maximize hardware utilization, particularly on NVIDIA GPUs using TensorRT. The v3.0 update brought a Bi-directional Concatenation (BiC) module to the neck, enhancing spatial feature retention without severely bloating the parameter count. Additionally, it introduced an Anchor-Aided Training (AAT) strategy that fuses the benefits of anchor-based stability during model training while maintaining a fast, anchor-free architecture during real-time inference.

しかし、YOLOv6-3.0はサーバーグレードのGPUに高度に最適化されているため、CPUのみの制約の厳しいエッジデバイスにデプロイすると、レイテンシの改善が小さくなることがあります。この特化により、オフラインのビデオ分析のような環境では優れていますが、より小さくローカライズされたハードウェア上では動的に最適化されたモデルに遅れをとる可能性があります。

YOLOv6の詳細はこちら

Link to this section性能比較テーブル#

以下の表は、両アーキテクチャの異なるスケールのバリアントを直接比較した主要なパフォーマンス指標を示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Link to this sectionユースケースと推奨事項#

PP-YOLOE+とYOLOv6のどちらを選択するかは、特定のプロジェクトの要件、デプロイメントの制約、およびエコシステムの優先順位に依存します。

Link to this sectionPP-YOLOE+ を選ぶべき場面#

PP-YOLOE+ は以下の場合に強力な選択肢となります:

  • PaddlePaddle エコシステムへの統合: Baidu の PaddlePaddle フレームワークとツールを使用して構築された既存のインフラストラクチャを持つ組織。
  • Paddle Lite エッジデプロイメント: Paddle Lite または Paddle 推論エンジン専用に高度に最適化された推論カーネルを備えたハードウェアへのデプロイ。
  • 高精度サーバーサイド検出: フレームワークの依存関係が懸念事項とならない、強力な GPU サーバー上での最大の検出精度を優先するシナリオ。

Link to this sectionYOLOv6を選択すべき時#

YOLOv6が推奨されるケース:

  • 産業用ハードウェア対応の展開: モデルのハードウェア認識設計と効率的な再パラメータ化が、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
  • 高速なシングルステージ検出: 管理された環境でのリアルタイムビデオ処理において、GPU上の生の推論速度を優先するアプリケーション。
  • Meituanエコシステムの統合: すでにMeituanの技術スタックと展開インフラ内で作業しているチーム。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionUltralyticsの利点: レガシーモデルを超えて#

PP-YOLOE+とYOLOv6-3.0は目的を絞ったソリューションを提供しますが、最新のAI開発には汎用的でメモリ効率の良いワークフローが必要です。ここでUltralytics Platformは比類のない開発者体験を提供します。統一されたPython APIにより、従来の古い研究リポジトリに見られるような膨大な構成オーバーヘッドなしで、最先端のモデルをシームレスにトレーニング、検証、デプロイできます。

Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.

Link to this sectionYOLO26の紹介:新しい標準#

究極の最先端ビジョンモデルをデプロイしたい組織にとって、Ultralytics YOLO26(2026年1月リリース)はパフォーマンスの境界を再定義します。いくつかの重要な革新により、旧世代を大幅に上回ります。

  • End-to-End NMS-Free Design: Building on concepts from YOLOv10, YOLO26 completely eliminates Non-Maximum Suppression (NMS) post-processing. This natively end-to-end approach guarantees predictable, ultra-low latency inference, crucial for real-time safety systems.
  • 最大43%高速なCPU推論: アーキテクチャからDistribution Focal Loss (DFL) を削除することで、YOLO26はエッジコンピューティングや専用のGPUアクセラレーションを欠く環境向けに根本的に最適化されています。
  • MuSGDオプティマイザ: LLMのトレーニングの安定性をビジョンモデルに統合するこのハイブリッドオプティマイザ(Moonshot AIに着想を得た)は、高速な収束と非常に安定したカスタムトレーニングセッションを可能にします。
  • ProgLoss + STAL: これらの高度な損失関数設計は、空撮ドローン映像や混雑したシーン分析のようなアプリケーションに不可欠な、小さな物体の認識において顕著な改善を実現します。
パイプラインを将来にわたって保護する

今日、新しいプロジェクトを構築している場合は、古いアーキテクチャを回避し、YOLO26を採用することを強く推奨します。そのメモリ効率とNMSフリーの速度により、実運用へのデプロイが大幅に容易になります。

Link to this sectionシームレスな実装#

Ultralytics Pythonパッケージを使用して最先端のモデルをトレーニングおよびエクスポートするのは非常に簡単です。次の例は、最新のYOLO26モデルをトレーニングし、迅速なエッジデプロイのためにONNXにエクスポートする方法を示しています。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

古いワークフローに深く統合されているものの、現代的な安定性を求めているチームにとっては、Ultralytics YOLO11を検討することも素晴らしい移行のステップであり、完全なUltralyticsエコシステムに支えられた包括的なタスクの汎用性を提供します。

コントリビューター

コメント