Link to this sectionPP-YOLOE+ 対 EfficientDet#

適切なアーキテクチャの選択は、堅牢なコンピュータビジョンアプリケーションを構築する上で極めて重要なステップです。本技術ガイドでは、広く知られている2つの物体検出モデルであるPP-YOLOE+とEfficientDetのトレードオフについて検討します。それぞれのアーキテクチャを分解し、パフォーマンス指標を分析し、最適なデプロイメントシナリオを探ります。

両モデルともこの分野に多大な貢献をしてきましたが、Ultralytics YOLO26のような現代的な代替モデルがいかに優れたメモリ効率、高速な推論、そして極めて効率化された開発者体験を提供できるかについても論じます。

Link to this sectionアーキテクチャの概要: PP-YOLOE+#

PP-YOLOE+は、オリジナルのPP-YOLOを進化させたバージョンであり、PaddlePaddleエコシステム内におけるサーバーサイドGPUでのパフォーマンスを最適化するために構築されました。ベースラインのアーキテクチャに対して、アンカーフリーのパラダイムに焦点を当てた複数の機能強化が導入されています。

著者: PaddlePaddle 著者陣
組織: Baidu
日付: 2022-04-02
Arxiv: 2203.16250
ドキュメント: PaddleDetection README

PP-YOLOE+の詳細はこちら

PP-YOLOE+は、CSPRepResNetバックボーン、Efficient Task-aligned head (ET-head)を特徴とし、分類にはVarifocal lossを、バウンディングボックス回帰にはDistribution focal lossを多用しています。アンカーフリー検出器設計への移行は、後処理パイプラインの簡素化に寄与し、リリース当時は非常に競争力の高いモデルでした。

統合のメリット

すでにBaiduのPaddlePaddleフレームワークに深く投資しているチームにとって、PP-YOLOE+はインスタンスセグメンテーションのようなタスクにおいて導入しやすいことが多いですが、新しいツールで見られるような広範なマルチフレームワーク対応は不足しています。

Link to this sectionアーキテクチャの概要: EfficientDet#

EfficientDetは物体検出に対して根本的に異なるアプローチをとっており、ニューラルアーキテクチャ探索と複合スケーリングの原則に強く依存しています。

著者: Mingxing Tan, Ruoming Pang, and Quoc V. Le
組織: Google
日付: 2019-11-20
Arxiv: 1911.09070
ドキュメント: Brain AutoML README

EfficientDetについて詳しく知る

EfficientDetの礎はBi-directional Feature Pyramid Network (BiFPN)です。従来のFPNとは異なり、BiFPNは入力特徴量の重要度を学習するための学習可能な重みを導入することで、簡単かつ高速なマルチスケール特徴融合を可能にします。さらにEfficientNet バックボーンと組み合わせることで、EfficientDetはネットワークの幅、深さ、解像度を同時に体系的にスケールアップします。

理論上はFLOPsの観点から非常に効率的ですが、EfficientDetモデルは、その複雑なメモリアクセスパターンにより、エッジデバイス上では理論的な効率性を実環境の速度に変換することに苦労する場合があります。これは、YOLOベースのモデルの低いメモリ要件とは対照的です。

Link to this sectionパフォーマンス分析とベンチマーク#

以下の表は、COCOのような標準データセットにおける主要な指標を比較したものです。平均精度 (mAP)と推論速度を比較することで、パレートフロンティアが明確になります。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

ご覧の通り、ハイエンドGPUではPP-YOLOE+の方が一般的にmAPで良好なスケーリングを見せる一方、EfficientDetはパラメータ数の最小化を図っています。しかし、どちらも最新のエッジAIに必要な現代的なリアルタイム性能には及びません。

Link to this sectionユースケースと推奨事項#

PP-YOLOE+とEfficientDetのどちらを選択するかは、プロジェクト固有の要件、デプロイメントの制約、およびエコシステムの優先順位に依存します。

Link to this sectionPP-YOLOE+ を選ぶべき場面#

PP-YOLOE+ は以下の場合に強力な選択肢となります：

PaddlePaddle エコシステムへの統合: Baidu の PaddlePaddle フレームワークとツールを使用して構築された既存のインフラストラクチャを持つ組織。
Paddle Lite エッジデプロイメント: Paddle Lite または Paddle 推論エンジン専用に高度に最適化された推論カーネルを備えたハードウェアへのデプロイ。
高精度サーバーサイド検出: フレームワークの依存関係が懸念事項とならない、強力な GPU サーバー上での最大の検出精度を優先するシナリオ。

Link to this sectionEfficientDetを選択すべき場合#

EfficientDetは以下の場合に推奨されます：

Google CloudおよびTPUパイプライン： Google Cloud Vision APIやTPUインフラストラクチャと深く統合されたシステムであり、EfficientDetのネイティブ最適化が活かせる環境。
複合スケーリング研究： ネットワークの深さ、幅、解像度のスケーリングバランスが与える影響を調査することに焦点を当てた学術的なベンチマーク。
TFLite経由のモバイルデプロイ: Androidまたは組み込みLinuxデバイス向けにTensorFlow Liteのエクスポートを特に必要とするプロジェクト。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

NMSフリーのエッジ展開： Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
CPUのみの環境： GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
小さな物体の検出： aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section現代的な代替手段: Ultralytics YOLO26#

PP-YOLOE+とEfficientDetは歴史的な重要なマイルストーンですが、最先端の精度、低いメモリ消費、そして合理的なユーザー体験を求める開発者は、Ultralytics YOLO26に注目すべきです。

YOLO26は物体検出において大幅な飛躍を遂げており、いくつかの重要なイノベーションを導入しています。

エンドツーエンドのNMSフリー設計: YOLOv10のブレイクスルーを基盤として、YOLO26は推論中にNon-Maximum Suppression (NMS)をネイティブで排除します。これによりレイテンシが大幅に低下し、複雑な後処理のボトルネックが解消されます。
MuSGDオプティマイザ: LLM学習の革新に触発され、YOLO26はハイブリッドなSGDおよびMuonオプティマイザを活用しています。これにより、学習の安定性が劇的に向上し、収束時間が短縮されます。
究極の速度: YOLO26は、YOLO11のような旧世代と比較して最大43%高速なCPU推論を実現しており、バッテリー駆動デバイスやCPUのみのエッジデバイスにとって絶対的な最良の選択肢となります。
高度な損失関数: ProgLossとSTALの統合により、小物体認識が大幅に向上しており、これはドローン解析やロボティクスのようなタスクに不可欠です。

マルチタスクの汎用性

検出のみに焦点を当てたEfficientDetとは異なり、YOLO26は姿勢推定、画像分類、指向性バウンディングボックス (OBB)を、すべて同じ十分にメンテナンスされたエコシステム内でネイティブに処理します。

Link to this section使いやすさとエコシステム統合#

EfficientDetのようなレガシーモデルの最大の欠点の1つは、トレーニングパイプラインと自動機械学習セットアップの複雑さです。対照的に、Ultralytics Platformは比類のない開発者体験を提供します。

Ultralyticsを使用したモデルのデプロイは数行のコードで完了し、古いフレームワークで必要とされる冗長な構成とは対照的です。

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

他の選択肢を探している場合、RT-DETRやレガシーなYOLOv8のようなアーキテクチャもUltralyticsエコシステム内で利用可能であり、シームレスな切り替えやテストが可能です。

Link to this section結論#

PP-YOLOE+はPaddleエコシステム内の特定のサーバー展開において依然として強力な選択肢であり、EfficientDetも自動アーキテクチャ設計の興味深い研究対象であり続けています。しかし、リアルタイム推論、デプロイの容易さ、最小限のメモリ要件が求められる現代のアプリケーションにとって、Ultralytics YOLO26は最も説得力のあるパフォーマンスバランスを提供します。そのネイティブなNMSフリー設計と超高速なCPUパフォーマンスは、AIインフラストラクチャを将来にわたって保証するための決定的な選択肢となります。

貢献者

GLglenn-jocher¹⁵

作成日 2025年1月27日更新日 3 週間前