YOLOv10 . EfficientDet: 物体検出効率の進化
コンピュータビジョンの分野は、バランス、特に推論速度と検出精度のトレードオフの追求によって定義されてきた。本比較では、この歴史における二つの重要なマイルストーンを探る: YOLOv10——清華大学による学術的NMSを導入した手法——と、Google先駆的アーキテクチャであるEfficientDet——スケーラブルな効率性を推進した手法——である。
EfficientDetが2019年に複合スケーリング手法でベンチマークを確立した一方、YOLOv10 2024年)は後処理のボトルネックを完全に排除するパラダイムシフトを体現している。本ガイドでは両者のアーキテクチャ、性能指標、現代のエッジAIアプリケーションへの適性を分析する。
YOLOv10: エンドツーエンドのリアルタイム検出器
2024年5月にリリースされたYOLOv10 、YOLO の長年の課題であった非最大抑制(NMS)へのYOLOv10 。この後処理ステップを排除することで、YOLOv10 レイテンシをYOLOv10 削減し、デプロイメントパイプラインを簡素化した。
YOLOv10 :
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織:清華大学
- 日付: 2024-05-23
- Arxiv:リアルタイムエンドツーエンド物体detect
- GitHub:THU-MIG/yolov10
主要なアーキテクチャ革新
YOLOv10 決定的な特徴YOLOv10 一貫した二重割り当て YOLOv10 。学習時には、豊富な監督信号を得るための一対多ヘッドと、最適な一意の予測を学習するための一対一ヘッドを採用する。これにより、推論時に重複NMS 必要とせずに、正確なバウンディングボックスを予測できる。
さらに、YOLOv10 包括的な効率性と精度の設計 YOLOv10 、バックボーンとネックコンポーネントを最適化することで計算上の冗長性を削減します。これにより、従来モデルよりも高速であるだけでなく、パラメータ効率にも優れたモデルが実現されました。
効率的な検出: スケーラブルかつ堅牢
Google 2019年末に開発したEfficientDetは、異なる哲学である複合スケーリングを用いて効率性の限界を押し広げることを目的として設計された。ネットワークの解像度、深さ、幅を体系的にスケーリングすることで、幅広いリソース制約下において優れた性能を達成する。
EfficientDetの詳細:
- 著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
- 組織:Google Research
- 日付: 2019-11-20
- Arxiv:EfficientDet: スケーラブルで効率的な物体detect
- GitHub:google/automl
BiFPNの優位性
EfficientDetは、EfficientNetバックボーンと重み付き双方向特徴ピラミッドネットワーク(BiFPN)を組み合わせたアーキテクチャを採用する。標準的なFPNが特徴量を区別なく加算するのとは異なり、BiFPNは入力特徴量に重みを割り当てることで、ネットワークが異なる入力スケールの重要性を学習できるようにする。高い精度を実現する一方で、このアーキテクチャは複雑なクロススケール接続を伴い、不規則なメモリアクセスパターンに最適化されていないハードウェアでは計算コストが高くなる可能性がある。
技術的パフォーマンス比較
以下の表は指標の直接比較を示しています。特にYOLOv10 NMS 除去のYOLOv10 ことから、推論速度に顕著な差があることに留意してください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
詳細な分析
- レイテンシ対精度:YOLOv10xはTensorRT わずか12.2msで、優れたmAP 平均精度)54.4%を達成。一方、EfficientDet-d7は同等の53.7%mAP を達成mAP 約128msを要し、10倍以上遅い。これはリアルタイム最適化における世代を超えた飛躍を浮き彫りにしている。
- エッジデプロイメント: YOLOv10 NMS設計は、 モデルデプロイメントにおける画期的な変化YOLOv10 。NMS NPU(ニューラルプロセッシングユニット)や組み込みチップ上で高速化が困難なNMS 。これを排除することでモデル全体を単一のグラフとして実行可能となり、OpenVINOなどのツールとの互換性が劇的に向上します。 OpenVINO やTensorRTなどのツールとの互換性が大幅に向上します。
- トレーニング効率:EfficientDetはTensorFlow 複雑なAutoML探索戦略に依存しています。Ultralytics YOLO (YOLOv10 新世代のYOLO26を含む)PyTorch 基盤としPyTorch ハイパーパラメータを自動処理する最適化されたトレーニングパイプラインを備えています。これにより収束が高速化され、メモリ要件が低減されます。
Ultralyticsエコシステムの利点
モデル選択は、アーキテクチャだけでなくワークフローが重要です。Ultralytics 開発者にシームレスな体験を提供します。
- 使いやすさ: Ultralytics Python 、たった3行のコードでモデルの読み込み、トレーニング、デプロイが可能です。一方、EfficientDetの実装には複雑な依存関係管理やレガシーなTensorFlow が必要となることがよくあります。
- 汎用性:EfficientDetは主に物体検出器ですが、Ultralytics インスタンスセグメンテーション、姿勢推定、OBB(Oriented Bounding Box)検出を含む包括的なタスク群をサポートしています。
- 整備されたエコシステム: Ultralytics 頻繁なアップデートUltralytics 、最新のハードウェアおよびソフトウェアライブラリとの互換性を確保します。Ultralytics 統合により、データセット管理とクラウドトレーニングが容易に行えます。
効率化されたトレーニング
Ultralytics 複雑なデータ拡張と学習率スケジューリングを自動的にUltralytics 。最先端の結果を得るために、アンカーや損失重みを手動で調整する必要はありません。
コード例:Ultralyticsを使用したトレーニング
以下のコードは、Ultralytics を使用してモデルをトレーニングすることがいかに簡単かを示しています。これはYOLOv10、YOLO11、および推奨されるYOLO26でも同様に動作します。
from ultralytics import YOLO
# Load the latest recommended model (YOLO26)
model = YOLO("yolo26n.pt")
# Train on a custom dataset
# Ultralytics automatically handles device selection (CPU/GPU)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")
YOLO26をお勧めする理由
YOLOv10 NMS概念YOLOv10 一方で、Ultralytics これを洗練させ完成させた。2026年1月にリリースされたYOLO26は、エッジAIおよび生産システムにおける現在の最先端技術である。
YOLO26はYOLOv10 が先駆けたエンドツーエンドのNMSを採用YOLOv10 いくつかの重要な革新によってこれを強化している:
- MuSGDオプティマイザー:LLMトレーニング(特にMoonshot AIのKimi K2)に着想を得て、YOLO26はSGD オプティマイザーのハイブリッドを採用しています。これにより、従来世代に比べて格段に安定したトレーニングダイナミクスと高速な収束が実現されています。
- DFL除去:分布焦点損失(DFL)を除去することで、YOLO26は出力層構造を簡素化します。CoreML ONNX 形式へのエクスポートがONNX ンになり、低電力エッジデバイスとの互換性が向上します。
- 性能:YOLO26は、従来のバージョンと比較して最大43%高速CPU を実現し、標準的なノートパソコンやラズベリーパイ環境など、専用GPUを搭載していないデバイスに最適な選択肢です。
- タスク特異的利点: ProgLossや STAL といった特化損失関数を含み、小型物体認識において顕著な改善をもたらす。これは従来の検出器に共通する弱点であった。
ユースケースの推奨事項
Ultralytics YOLO26を選択すべきタイミング(推奨)
- リアルタイムアプリケーション:自律走行車、交通監視、スポーツ分析など、低遅延が極めて重要な分野。
- エッジデプロイメント: CPU とバッテリー寿命が制限される携帯電話、ドローン、またはIoTデバイス上で動作する。
- マルチタスク要件:プロジェクトで標準的なバウンディングボックスに加え、セグメンテーション、姿勢推定、または回転したオブジェクト(OBB)の検出が必要な場合。
EfficientDetを検討すべき時
- レガシー研究:2019-2020年頃の学術論文を再現する場合、特にEfficientDetアーキテクチャをベンチマーク対象としているものに限る。
- ハードウェア制約(特定):レガシーハードウェアアクセラレータがBiFPN構造に厳密に最適化されており、現代的なRep-VGGやTransformerベースのブロックに適応できない稀なケースにおいて。
結論
EfficientDetは効率の拡張において画期的な成果でしたが、この分野はさらに進歩を遂げています。 YOLOv10NMS検出が可能であることを実証し、YOLO26はそれを実用レベルで完成させました。速度、精度、使いやすさの最適なバランスを求める開発者にとって、Ultralytics 決定的な選択肢です。その合理化されたアーキテクチャと強力なUltralytics を組み合わせることで、これまで以上に迅速にコンセプトからデプロイメントまで進めることが可能になります。
モデルアーキテクチャに関する詳細情報については、YOLOv8 YOLOv10YOLOv8 比較記事をご覧ください。またはUltralytics で今すぐトレーニングを開始しましょう。