Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 と PP-YOLOE+ の比較#

本番環境のパイプラインに向けた最先端のコンピュータビジョンモデルを評価する際、開発者は多くの場合、異なるアーキテクチャの利点を比較検討します。物体検出の分野で注目されている2つのモデルが、YOLOv7PP-YOLOE+ です。本ガイドでは、次のコンピュータビジョンプロジェクトで情報に基づいた意思決定ができるよう、両モデルのアーキテクチャ、パフォーマンス指標、および理想的なデプロイシナリオについて技術的な詳細を比較します。

Link to this sectionアーキテクチャの革新#

両モデルの構造的な根本的な違いを理解することは、トレーニングおよび推論中の挙動を予測する上で不可欠です。

Link to this sectionYOLOv7 アーキテクチャのハイライト#

YOLOv7 は、推論コストを大幅に増加させることなく精度を向上させるよう設計された、いくつかの主要な進歩を導入しました。

  • Extended Efficient Layer Aggregation Networks (E-ELAN): このアーキテクチャは、最短および最長の勾配パスを制御します。これにより、ネットワークはより多様な特徴を学習できるようになり、元の勾配パスを破壊することなく、全体的な学習能力が向上します。
  • モデルスケーリング戦略: YOLOv7 は複合モデルスケーリングを採用しており、深さと幅を同時に調整しながらレイヤーを結合することで、異なるサイズ間でも最適なアーキテクチャ構造を維持します。
  • Trainable Bag-of-Freebies: 著者らは、アイデンティティ接続を持たない再パラメータ化畳み込み手法 (RepConv) を統合しました。これにより、モデルの予測能力を損なうことなく、推論速度が大幅に向上します。

YOLOv7 詳細:
著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
組織: Academia Sinica, Institute of Information Science (台湾)
日付: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696

YOLOv7の詳細はこちら

Link to this sectionPP-YOLOE+ アーキテクチャのハイライト#

Baidu の PaddlePaddle エコシステム内で開発された PP-YOLOE+ は、前身である PP-YOLOv2 をベースにしており、アンカーフリー手法と強化された特徴表現に重点を置いています。

  • アンカーフリー設計: アンカーベースのアプローチとは異なり、この設計は予測ヘッドを簡素化し、ハイパーパラメータの数を減らすことで、カスタムデータセット向けのモデル調整を容易にします。
  • CSPRepResNet バックボーン: このバックボーンには、残差接続と Cross Stage Partial ネットワークが組み込まれており、計算効率を維持しながら特徴抽出能力を向上させています。
  • Task Alignment Learning (TAL): PP-YOLOE+ は ET-head (Efficient Task-aligned head) を活用して分類タスクと位置特定タスクの調整を改善し、ワンステージ検出器における一般的なボトルネックに対処しています。

PP-YOLOE+ 詳細:
著者: PaddlePaddle Authors
組織: Baidu
日付: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250

PP-YOLOE+の詳細はこちら

Link to this sectionパフォーマンス指標とベンチマーク#

適切なモデルの選択は、多くの場合、ハードウェアの特定の制約とレイテンシ要件に基づいて決まります。以下の表は、精度 (mAP)、速度、およびモデルの複雑さのトレードオフを示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this section結果の分析#

  • 高精度シナリオ: YOLOv7x は優れたパフォーマンスを発揮し、複雑な検出タスクにおいて競合力のある高い mAP を達成します。PP-YOLOE+x は mAP でわずかに上回りますが、パラメータ数と FLOPs が大幅に増加します。
  • 効率と速度: PP-YOLOE+ の小型バリアント (t および s) は、TensorRT において非常に高速な推論速度を提供し、ハードウェア制約が厳しいエッジ環境へのデプロイに非常に適しています。
  • スイートスポット: YOLOv7l は優れたバランスを提供し、T4 GPU 上で 7ms 未満の推論時間を維持しながら 51% 以上の mAP を実現します。標準的なリアルタイムサーバーアプリケーションにとって堅牢な選択肢となります。
本番環境への最適化

これらのモデルをデプロイする際、TensorRTONNX といったエクスポート形式を活用することで、ネイティブな PyTorch 推論と比較してレイテンシを大幅に削減できます。

Link to this sectionUltralyticsの利点#

YOLOv7 と PP-YOLOE+ はどちらも強力なベンチマークパフォーマンスを提供しますが、プロジェクトを成功させるには、開発体験とエコシステムのサポートも同様に重要です。

Link to this section効率的なユーザー体験#

Ultralytics モデルは、統合された Python API を通じて使いやすさを優先しています。PaddlePaddle エコシステムとその特定の構成ファイルを扱う必要がある PP-YOLOE+ とは異なり、Ultralytics を使用するとトレーニングからデプロイまでシームレスに移行できます。

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

Link to this sectionリソース効率#

Ultralytics YOLO モデルの主な強みは、トレーニングと推論の両方においてメモリ要件が低いことです。この効率性により、研究者や開発者は民生用ハードウェアでより大きなバッチサイズを使用できるため、より重いモデルや RT-DETR のような複雑な Transformer アーキテクチャと比較してトレーニングプロセスを加速できます。

Link to this sectionエコシステムと汎用性#

Ultralytics エコシステムは非常によくメンテナンスされており、頻繁なアップデート、広範なドキュメント、および標準的な検出以外の多様なタスクに対するネイティブなサポートを備えています。Ultralytics を使用すれば、単一のフレームワークで インスタンスセグメンテーション姿勢推定分類、および OBB (Oriented Bounding Boxes) をサポートし、競合モデルにはない比類のない汎用性を提供します。

Link to this sectionVision AI の未来: YOLO26#

コンピュータビジョンの急速な進化に伴い、速度と効率の基準を再定義する新しいアーキテクチャが登場しました。2026年1月にリリースされた Ultralytics YOLO26 は、この進化の頂点に立つものであり、すべての新規プロジェクトに強く推奨される選択肢です。

YOLO26の主な革新:

  • エンドツーエンドの NMS フリー設計: YOLO26 は、Non-Maximum Suppression (NMS) の後処理を排除しました。このネイティブなエンドツーエンドアプローチにより、デプロイロジックが劇的に簡素化され、可変的なレイテンシが低減されます。これは YOLOv10 で初めて導入された画期的な機能です。
  • 前例のないエッジパフォーマンス: Distribution Focal Loss (DFL) を削除することで、YOLO26 は最大 43% 高速な CPU 推論を実現し、前世代と比較して IoT やエッジデバイスにとって優れた選択肢となります。
  • 高度なトレーニングダイナミクス: Moonshot AI の Kimi K2 といった LLM の革新に触発された MuSGD Optimizer の統合により、より安定したトレーニングと高速な収束が保証されます。
  • 優れた小物体検出: 特に ProgLoss + STAL といった強化された損失関数により、小さな物体の認識における従来の弱点が解消されました。これは 航空画像 のようなアプリケーションにおいて不可欠です。

Link to this section実際のアプリケーション#

これらのアーキテクチャの選択は、多くの場合、特定のデプロイ環境に依存します。

Link to this sectionPP-YOLOE+ を選ぶべき場面#

  • PaddlePaddle 統合: インフラストラクチャがすでに Baidu の PaddlePaddle エコシステムに深く統合されている場合、PP-YOLOE+ はネイティブに適しています。
  • アジアにおける産業検査: ハードウェアおよびソフトウェアスタックが Baidu のツール用に事前構成されているアジアの製造拠点などでよく利用されています。

Link to this sectionYOLOv7を選択すべき時#

  • GPU アクセラレーションシステム: ビデオ分析 のような高いスループットを必要とするタスクにおいて、サーバーグレードの GPU 上で非常に優れたパフォーマンスを発揮します。
  • ロボティクス統合: ロボティクスにおけるコンピュータビジョンの統合 に最適で、動的な環境での迅速な意思決定を可能にします。
  • 学術研究: 広くサポートされており、PyTorch ベースの研究において信頼できるベースラインとして頻繁に使用されています。

While older models hold historical significance, transitioning to modern architectures like YOLO26 or YOLO11 via the Ultralytics Platform ensures access to the latest optimizations, the simplest training workflows, and the broadest multi-task support available today.

コメント