Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs PP-YOLOE+#

適切なニューラルネットワークアーキテクチャを選択することは、現代のコンピュータビジョンプロジェクトにおいて不可欠です。開発者や研究者がリアルタイム物体検出モデルを評価する際、多くの場合、精度、推論速度、展開の容易さのバランスが重要な判断基準となります。この技術比較では、YOLOv5と**PP-YOLOE+**を取り上げ、そのアーキテクチャ、パフォーマンス指標、および学習方法を検討し、アプリケーションに最適なソリューションを選択するための手助けをします。

Link to this sectionアーキテクチャの理解#

両モデルともビジョンAIの領域に大きな影響を与えてきましたが、物体検出の課題へのアプローチにおいて、構造的な手法やフレームワークの依存関係が異なります。

Link to this sectionUltralytics YOLOv5:業界標準#

2020年中頃にリリースされたUltralytics YOLOv5は、最先端のビジョンモデルへのアクセシビリティを劇的に向上させました。YOLOファミリーで初のネイティブPyTorch実装となったことで、世界中のPython開発者やMLエンジニアにとっての参入障壁を大幅に下げました。

YOLOv5の詳細:

YOLOv5は改良されたCSPDarknetバックボーンを採用しており、軽量なパラメータ数を維持しながら豊かな特徴表現を効率的に捉えます。また、アンカーボックスの自動学習を導入し、トレーニング開始前にカスタムデータセットに最適なアンカー寸法を自動計算します。さらに、モザイクデータ拡張の統合により、小さな物体の検出能力と複雑な空間コンテキストへの汎化性能が大幅に強化されています。

YOLOv5の最大の強みの一つはその卓越した汎用性にあります。標準的な物体検出器とは異なり、YOLOv5ファミリーは単一のAPI内で画像分類インスタンスセグメンテーション、およびバウンディングボックス検出をシームレスにサポートします。その高度に最適化されたアーキテクチャにより、重いTransformerベースのネットワークと比較して、トレーニングおよび推論時のメモリ使用量を大幅に削減できます。

YOLOv5の詳細はこちら

Link to this sectionPP-YOLOE+: PaddlePaddleの対抗馬#

約2年後に登場したPP-YOLOE+は、それ以前のPP-YOLOシリーズの基盤の上に構築されています。Baiduのディープラーニングフレームワークの性能を示すために開発され、mAP(平均精度)を向上させるためにいくつかのアーキテクチャ上の改良が加えられています。

PP-YOLOE+の詳細:

PP-YOLOE+はアンカーフリーのパラダイムに依存し、CSPRepResNetバックボーンを利用します。また、強力なタスクアライメント学習技術と効率的なタスクアライメントヘッドを組み込み、精度を向上させています。PP-YOLOE+は印象的な精度スコアを達成していますが、主な弱点はPaddlePaddleフレームワークへの強い依存性にあります。これは、すでにPyTorchやTensorFlow環境に深く投資している研究チームや企業にとって、学習の難易度が高く、エコシステムの摩擦を生む原因となることがよくあります。

PP-YOLOE+の詳細はこちら

Link to this section性能とベンチマーク#

本番環境でこれらのモデルを評価する際は、精度、推論速度、およびパラメータフットプリントの間のトレードオフを理解することが極めて重要です。以下の表は、異なるサイズバリエーションにおける主要なパフォーマンス指標を概説しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

PP-YOLOE+は高い精度限界を達成しますが、YOLOv5は制限されたハードウェアにおいて一貫して優れたパラメータ効率と高速な推論性能を発揮します。メモリが限られているエッジ展開においては、YOLOv5nが比類のない速度と極めて小さなフットプリントを提供します。

メモリ効率

Ultralyticsモデルはトレーニング効率を重視して設計されています。RT-DETRのような大規模なVision Transformerと比較して、YOLOv5はCUDAメモリ消費が大幅に少なく、より大きなバッチサイズやコンシューマーグレードのハードウェアでのトレーニングを可能にします。

Link to this sectionUltralyticsの利点:エコシステムと使いやすさ#

機械学習アーキテクチャの真の価値は、単なる数値を超えて、開発者体験全体に広がります。Ultralytics Platformとその関連のオープンソースツールは、開発サイクルを劇的に加速させる、非常に洗練され適切に管理されたエコシステムを提供します。

  • 使いやすさ: Ultralyticsは複雑なボイラープレートコードを抽象化します。直感的なPython APIまたはCLIを通じて、モデルのトレーニング、検証、テストを行うことができます。
  • 展開の柔軟性: モデルのエクスポートは非常に簡単です。コマンドを一つ実行するだけで、トレーニング済みのYOLOv5の重みをONNXTensorRT、またはOpenVINOといった形式に変換でき、エッジ環境やクラウド環境全体で幅広い互換性を確保できます。
  • 活発なコミュニティ: 活気あるコミュニティにより、頻繁なアップデート、詳細なドキュメント、および一般的なコンピュータビジョンの課題に対する堅牢な解決策が保証されています。

対照的に、PP-YOLOE+はPaddleDetection特有の複雑な設定ファイルに大きく依存しており、これが迅速なプロトタイピングを遅らせ、最新のMLOpsパイプラインへの統合を複雑にする可能性があります。

Link to this section実践的な実装とコード例#

Ultralyticsを使い始めるのは驚くほど簡単です。以下は、事前学習済みのYOLOv5モデルを読み込み、カスタムデータセットでトレーニングし、結果をエクスポートする方法を示す、完全に実行可能な例です。

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Link to this sectionユースケースと推奨事項#

YOLOv5とPP-YOLOE+のどちらを選択するかは、特定のプロジェクト要件、展開の制約、およびエコシステムの優先事項によって決まります。

Link to this sectionYOLOv5を選択すべき場合#

YOLOv5は次の場合に強力な選択肢となります:

  • 実証済みの本番システム: YOLOv5の長期にわたる安定性の実績、広範なドキュメント、および膨大なコミュニティサポートが重視される既存のデプロイ環境。
  • リソースが制限されたトレーニング: GPUリソースが限られており、YOLOv5の効率的なトレーニングパイプラインと低いメモリ要件が有利に働く環境。
  • 広範なエクスポート形式のサポート: ONNXTensorRTCoreMLTFLiteを含む多くのフォーマット全体でのデプロイが必要なプロジェクト。

Link to this sectionPP-YOLOE+ を選ぶべき場面#

PP-YOLOE+ は以下の場合に推奨されます:

  • PaddlePaddle エコシステムへの統合: Baidu の PaddlePaddle フレームワークとツールを使用して構築された既存のインフラストラクチャを持つ組織。
  • Paddle Lite エッジデプロイメント: Paddle Lite または Paddle 推論エンジン専用に高度に最適化された推論カーネルを備えたハードウェアへのデプロイ。
  • 高精度サーバーサイド検出: フレームワークの依存関係が懸念事項とならない、強力な GPU サーバー上での最大の検出精度を優先するシナリオ。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section検討すべき代替の最先端モデル#

YOLOv5は堅牢で実績のある標準ですが、コンピュータビジョンの分野は急速に進化しています。新規プロジェクトを開始するチームには、当社の新しいアーキテクチャを検討することを強く推奨します。

Link to this sectionUltralytics YOLO26#

2026年1月にリリースされたYOLO26は、当社の研究の頂点を示すものです。精度と速度の両面で大幅な改善を実現しました。主な革新は以下の通りです。

  • エンドツーエンドのNMSフリー設計: YOLOv10のコンセプトを基に、YOLO26はNMS(非最大値抑制)のポストプロセッシングをネイティブに排除し、レイテンシを削減して展開ロジックを簡素化しました。
  • DFLの除去: Distribution Focal Lossを排除することで、YOLO26はCPU推論を最大43%高速化し、低電力のエッジデバイスに対して非常に強力な性能を発揮します。
  • MuSGDオプティマイザー: 高度なLLMトレーニング技術に触発されたこのSGDとMuonのハイブリッド手法により、非常に安定したトレーニングとより迅速な収束が保証されます。
  • ProgLoss + STAL: これらの高度な損失関数は小物体認識において顕著な改善をもたらし、ドローン画像やスマート農業において極めて重要です。

さらに、優れたパフォーマンスを提供し、レガシーシステムとYOLO26の最先端機能の間の極めて信頼性の高いブリッジとなるYOLO11も検討に値します。

Link to this section実際のユースケース#

YOLOv5とPP-YOLOE+のどちらを選択するかは、最終的には展開環境とプロジェクトの制約に依存します。

YOLOv5の理想的なアプリケーション: YOLOv5はリソース要件が最小限であり、非常に使いやすいため、エッジAIにおける第一の選択肢です。リアルタイムロボティクス、モバイルアプリケーション統合、およびマルチカメラ交通監視システムなど、限られたハードウェア上で高いフレームレートを要求されるアプリケーションで優れた性能を発揮します。同一フレームワーク内で姿勢推定指向性バウンディングボックス (OBB)のタスクを同時に処理できるため、高い適応性を備えています。

PP-YOLOE+の理想的なアプリケーション: PP-YOLOE+は、リアルタイム処理の制約よりも静止画像における絶対的な最高精度が優先されるシナリオに最適です。BaiduおよびPaddlePaddleのエコシステムに深く投資された既存の技術スタックを持つ、特にアジアの製造セクター内の産業検査パイプラインなどでニッチな用途が見出されています。

要約すると、PP-YOLOE+は高い精度ベンチマークを提供しますが、UltralyticsのYOLOモデルは、パフォーマンスのバランス、シームレスな展開、そしてコンセプトから本番環境までコンピュータビジョンプロジェクトを成功に導く開発者フレンドリーな設計という比類のない組み合わせを提供します。

コントリビューター

コメント