Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 対 YOLOv7#

コンピュータビジョンのパイプラインを構築する際、適切な物体検出モデルを選択することは不可欠です。2022年に登場したPP-YOLOE+とYOLOv7という2つの重要なアーキテクチャは、リアルタイム物体検出において強力な進歩をもたらしました。本テクニカル比較では、読者がアプリケーション開発において十分な情報に基づいた決定を下せるよう、両モデルのアーキテクチャ、トレーニング手法、および実世界でのパフォーマンスを詳細に検証します。

Link to this sectionモデルの概要#

PP-YOLOE+とYOLOv7はどちらも精度と速度の限界に挑むべく設計されましたが、それぞれ異なる開発エコシステムと設計哲学に基づいています。

Link to this sectionPP-YOLOE+#

PP-YOLOE+はBaiduのPaddlePaddle開発チームによって開発され、元のPP-YOLOv2をベースに構築されています。これは、PaddlePaddleエコシステム向けに最適化された、効率的かつ高精度な物体検出器を提供するために導入されました。

PP-YOLOE+の詳細はこちら

Link to this sectionYOLOv7#

YOLOv7はChien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liaoによって開発されました。リリースの際、リアルタイム物体検出器として新たな最先端ベンチマークを打ち立てるために「学習可能なbag-of-freebies」が導入されました。

YOLOv7の詳細はこちら

Link to this sectionアーキテクチャの革新#

Link to this sectionPP-YOLOE+ のアーキテクチャ#

PP-YOLOE+はアンカーフリーのパラダイムに大きく依存しており、カスタムデータセットに対してアンカーボックスを調整する必要がないため、デプロイプロセスが簡素化されています。強力なRepResNetバックボーンと、マルチスケールの特徴融合を効率化するCSPNetスタイルのPAN(Path Aggregation Network)が組み込まれています。さらに、トレーニング中に分類タスクと位置特定タスクを動的に調整するTask Alignment Learning (TAL) コンセプトを活用しており、さまざまなコンピュータビジョンのタスクにおいて高い精度を確保しています。

Link to this sectionYOLOv7のアーキテクチャ#

YOLOv7は、Extended Efficient Layer Aggregation Network (E-ELAN) を導入することで異なるアプローチをとりました。このアーキテクチャにより、ネットワークは元の勾配パスを破壊することなく多様な特徴を学習でき、収束性の向上が実現しました。また、YOLOv7はモデルのリパラメータ化、具体的には「計画されたリパラメータ化畳み込み」を多用しており、推論中に畳み込み層を統合することで、精度を犠牲にすることなく実行速度を向上させています。このため、YOLOv7はマルチオブジェクトトラッキングや複雑なセキュリティ警報システムなどのタスクにおいて非常に強力です。

エコシステムの違い

PP-YOLOE+はBaiduのPaddlePaddleフレームワークと密接に統合されていますが、YOLOv7はPyTorchで構築されています。PyTorchは歴史的にコミュニティが大きく、ONNXTensorRTのようなデプロイメントパイプラインとの互換性に優れています。

Link to this sectionパフォーマンス分析#

速度、パラメータ数、精度(mAP)のバランスを考慮する場合、特定のバリエーションやターゲットハードウェアによって優劣が入れ替わります。以下は、両モデルの指標を総合的に比較したものです。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

PP-YOLOE+xモデルはわずかに高いmAPを達成していますが、YOLOv7の各バリエーションはパラメータ数に対する精度の比率において非常に優れています。YOLOv7のアーキテクチャは、TensorRTの最適化により非常に低いレイテンシを実現できるため、生のGPU処理において依然として人気があります。

Link to this sectionUltralyticsの利点#

これらのモデルをトレーニングしてデプロイする場合、どのフレームワークを選択するかもモデルそのものと同じくらい重要です。Ultralyticsを活用することで、機械学習のライフサイクル全体を簡素化する高度に統一されたPython APIにより、効率化されたユーザー体験を提供します。

  • メンテナンスされたエコシステム: Ultralytics YOLOモデルは、継続的に更新されるエコシステム、充実したドキュメント、そして活発なコミュニティの恩恵を受けています。
  • メモリ要件: Ultralyticsはデータ読み込みとトレーニング体制を大幅に最適化しています。Ultralytics YOLOモデルのトレーニングは、Transformerベースの巨大なアーキテクチャと比較して一般的に必要なCUDAメモリがはるかに少なく、開発者はコンシューマーグレードのハードウェアでより大きなバッチサイズを利用できます。
  • トレーニングの効率: 強力なデータ拡張戦略と組み込みのハイパーパラメータチューニングを活用することで、Ultralyticsは学習済みのウェイトを利用してモデルを迅速に収束させます。

Link to this sectionシンプルなAPI実装#

Ultralyticsを使用したYOLOv7モデルのトレーニングは、複雑なトレーニングスクリプトを完全に抽象化し、わずか数行のコードで実行可能です。

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

Link to this section新しい標準: YOLO26の紹介#

PP-YOLOE+とYOLOv7は物体検出における重要なマイルストーンですが、AIの情勢は急速に進化しています。新しいコンピュータビジョンプロジェクトには、Ultralytics YOLO26を強く推奨します。2026年1月にリリースされたYOLO26は、エッジファーストのビジョンAIにおける飛躍的な進歩を象徴しています。

YOLO26が旧アーキテクチャを凌駕する理由:

  • エンドツーエンドのNMS不要設計: YOLO26はネイティブなエンドツーエンド設計です。Non-Maximum Suppression (NMS) の後処理を廃止することで、YOLOv10で初めて登場したような予測可能かつ決定論的な推論レイテンシを保証します。
  • DFLの削除: Distribution Focal Lossを削除したことで、エクスポートプロセスが簡素化され、低電力エッジデバイスとの互換性が大幅に向上しました。
  • 最大43%高速なCPU推論: 専用GPUを持たないシナリオ(スマートシティのIoTセンサーなど)において、YOLO26はCPU上で直接効率的に実行できるよう高度に最適化されています。
  • MuSGDオプティマイザー: 高度なLLMトレーニング技術(Moonshot AIのKimi K2など)に触発されたYOLO26は、SGDとMuonのハイブリッドを使用して、極めて安定したトレーニングと高速な収束を実現します。
  • ProgLoss + STAL: これらの改善された損失関数は、ドローンによる航空写真や製造欠陥検出などのユースケースにおいて不可欠な、小さな物体の検出精度を大幅に向上させます。

YOLO26の詳細はこちら

Link to this section理想的なユースケースとデプロイシナリオ#

Link to this sectionPP-YOLOE+の使用時期#

PP-YOLOE+は、BaiduやPaddlePaddleのエコシステムに深く関わっている場合に真価を発揮します。デプロイ先がPaddleモデル専用のハードウェアを活用する場合(アジアの特定の製造パイプラインなど)、PP-YOLOE+は優れた精度とシームレスな統合を提供します。特に産業用製造自動化において極めて有効です。

Link to this sectionYOLOv7を使用する場合#

YOLOv7は、汎用的な高性能推論、特にTensorRTを利用したNVIDIAハードウェアへのデプロイにおいて依然として優れた選択肢です。PyTorchエコシステムへの統合により、学術研究や、リアルタイムの群衆管理や複雑な姿勢推定タスクなど、ネットワークの構造的整合性が最優先されるカスタム商用パイプラインにおいて非常に汎用性が高くなっています。

Link to this section検討すべきその他のモデル#

お客様の正確なニーズに応じて、これらのアーキテクチャを、広範な本番環境向けの柔軟性を備えたYOLO11や、従来の畳み込みネットワークよりもビジョントランスフォーマーの利点を必要とするプロジェクト向けのRT-DETRと比較検討することも可能です。

Link to this section結論#

PP-YOLOE+とYOLOv7の両者は、リアルタイム物体検出の世界に大幅な改善をもたらしました。PP-YOLOE+はPaddlePaddleを中心とした環境で優れた性能を発揮する一方、YOLOv7はPyTorchおよびUltralyticsエコシステムを通じて驚異的な柔軟性とパフォーマンスを提供します。

しかし、コンピュータビジョンソリューションが進化し続ける中で、最新のツールを活用することは不可欠です。Ultralytics Platformと、YOLO26のような次世代アーキテクチャを採用することで、開発者はアプリケーションの速度、精度、使いやすさを最先端に維持できます。

コントリビューター

コメント