EfficientDet vs.YOLOv10:リアルタイム物体検出の進化
コンピュータビジョンの風景は、GoogleicientDet発表YOLOv10 Google YOLOv10 劇的に変化した。開発者や研究者にとって、複雑な複合スケーリングから合理化されたエンドツーエンドアーキテクチャへの軌跡を理解することは、適切なツールを選択する上で極めて重要である。本分析では、EfficientDetの従来型精度とYOLOv10の低遅延イノベーションを比較する。 YOLOv10の低遅延革新性を比較するとともに、Ultralytics のような現代的ソリューションが実稼働環境における新たな基準をいかに確立しているかを明らかにする。
効率的検出:複合スケーリングの遺産
Google チームによって発表されたEfficientDetは、ニューラルネットワークの効率化における重要なマイルストーンとなった。これは単一の次元を調整するのではなく、ネットワークバックボーンの解像度、深さ、幅を均一にスケーリングする「複合スケーリング」の概念を導入した。
EfficientDet 技術詳細:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019-11-20
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:google/automl
EfficientDetの中核をなすのは双方向特徴ピラミッドネットワーク(BiFPN)である。 従来のFPNが異なるスケールの特徴量を単純に合計するのに対し、BiFPNは複雑な重み付けによる特徴融合を可能とし、モデルが異なる入力特徴の重要性を学習できるようにします。このアーキテクチャはCOCO 最先端の平均精度(mAP)を達成しましたが、BiFPN層の複雑な相互接続により計算オーバーヘッドが大幅に増加し、特にエッジデバイス上での推論速度が現代的なアーキテクチャに比べて低下します。
YOLOv10: エンドツーエンドの革命
清華大学の研究者らが開発したYOLOv10、従来のYOLO における主要なボトルネックである非最大抑制(NMS)に対処する。トレーニング中に一貫した二重割り当て戦略を採用することで、YOLOv10 各オブジェクトに対して単一の最適境界ボックスを予測することをYOLOv10 、事実上NMSのエンドツーエンド検出器となる。
YOLOv10 詳細:
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織:清華大学
- 日付: 2024-05-23
- Arxiv:YOLOv10: リアルタイムエンド・トゥ・エンドオブジェクトdetect
- GitHub:THU-MIG/yolov10
このアーキテクチャの変更により、推論レイテンシが大幅に低減されます。また本モデルは、大規模カーネル畳み込みと部分自己注意機構を活用し、従来モデルに見られたパラメータの肥大化なしに性能を向上させる、効率性と精度を両立させた包括的な設計を採用しています。
性能比較:速度 vs. 精度
これら2世代のモデルの性能差は顕著であり、特に推論速度において顕著である。EfficientDet-d7は高い精度を実現するが、その代償として大幅な遅延(100ミリ秒以上)を伴う。一方、YOLOv10 、1桁ミリ秒台で同等またはそれ以上の精度を達成している。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
アーキテクチャ分析
- 後処理:EfficientDetは重複するボックスをNMS 大きく依存している。密集したシーンでは、この後処理ステップがCPU となり、GPU に関係なく総レイテンシを増加させる。YOLOv10 NMS設計はこのステップを完全に排除する。
- メモリ使用量:EfficientDet、特にd7のような高倍率スケーリングでは、BiFPN構造のためVRAMを大量に消費します。YOLOv10 メモリ使用量の低減にYOLOv10 、エッジAIアプリケーションに適しています。
- 最適化:EfficientDetはTensorFlow 基盤として構築されておりTensorFlow ONNX 形式へのエクスポートは複雑になる場合がありますTensorFlow TensorRT へのエクスポートは、最新のYOLOのネイティブPyTorchPyTorch と比較して複雑になる場合があります。
Ultralyticsエコシステムの利点
YOLOv10 印象的なアーキテクチャの進歩YOLOv10 、Ultralytics 活用することでその有用性がさらに高まります。開発者は学術リポジトリの断片化にしばしば苦労します。Ultralytics 、モデルを単一の、よく管理されたPython の下で統合することでこの問題をUltralytics 。
Ultralytics を選ぶのか?
- 使いやすさ:たった1行のコードYOLOv8、YOLOv10、YOLO11、YOLO26を切り替えられます。
- トレーニング効率:事前調整済みハイパーパラメータと自動バッチサイズ処理により、リソース使用の最適化を実現します。
- デプロイ準備完了:ワンクリックTFLite、CoreML、OpenVINO、ONNXへエクスポート。
- Ultralytics : Ultralytics を通じて、データセットのシームレスな管理、クラウド上でのトレーニング、モデルのデプロイを実現します。
コード例
Ultralytics での推論実行は、Python的な手法で直感的に設計Ultralytics 。以下にYOLOv10 読み込みと予測実行の手順を示します:
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Run inference on an image from the internet
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
生産推奨:YOLO26へのアップグレード
EfficientDetは重要な歴史的ベンチマークとして機能し、YOLOv10 NMSパラダイムYOLOv10 一方で、 Ultralytics モデルは、実運用におけるこの進化の頂点を体現している。
2026年1月にリリースされたYOLO26は、YOLOv10 NMS成果を基盤YOLOv10 実世界での頑健性を高めるために改良を加えています。特徴として、分布焦点損失(DFL)の除去によりモデルグラフが簡素化され、エクスポートが容易になり、低電力エッジデバイスとの互換性が向上しています。
さらに、YOLO26はMuSGDオプティマイザを採用しています。SGD ューオン(LLMトレーニングの革新に着想を得た)のハイブリッド手法であり、より速い収束と安定したトレーニングを保証します。ProgLossやSTAL(形状認識タスクアラインメント損失)といった最適化により、YOLO26は優れた小物体検出能力を提供し、 CPU 前世代比最大43%高速化を実現しています。
実際のユースケース
適切なモデルの選択は、特定の制約条件によって異なります:
- EfficientDet:複合スケーリングやBiFPNアーキテクチャの研究が必要な学術研究に最適です。また、移行コストが新モデルの性能向上効果を上回るレガシーシステムでも採用されています。
- YOLOv10 YOLOv26: 理想的な選択肢 リアルタイムアプリケーション.
- ロボティクス: NMS設計によりレイテンシのジッタが低減され、これはナビゲーションと障害物回避において極めて重要である。
- トラフィック監視:高いスループットにより、単一GPU 上でオブジェクト追跡 GPU 複数のビデオストリームを処理可能。
- モバイルアプリ:パラメータ数が少なくメモリ使用量が低いため、これらのモデルはiOS Android への展開に最適です。
速度、精度、導入の容易さの最適なバランスを求める開発者にとって、Ultralytics または YOLO11 への移行が推奨される道筋です。