YOLOv8 vs. EfficientDet:技術比較
適切な物体検出モデルの選択には、精度、速度、および計算コストのトレードオフが伴います。このページでは、速度と汎用性で知られる最先端モデルであるUltralytics YOLOv8と、卓越したパラメータ効率のために設計されたGoogleのモデルファミリーであるEfficientDetという、2つの影響力のあるアーキテクチャの詳細な技術的比較を提供します。どちらも強力ですが、異なる設計哲学から生まれており、異なるアプリケーションに適しています。
Ultralytics YOLOv8:汎用性と性能
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8は、最先端のシングルステージ物体検出器であり、従来のYOLOバージョンの成功を基盤としています。主要なアーキテクチャの改善を導入することにより、非常に汎用性が高く強力なフレームワークとしての地位を確立しました。これには、新しいCSPDarknetバックボーン、特徴融合を強化するC2fネック、およびアンカーフリーのデカップルドヘッドが含まれます。この設計は、性能を向上させるだけでなく、幅広いコンピュータビジョンタスクにわたって柔軟性を提供します。
YOLOv8の長所
- パフォーマンスのバランス: YOLOv8は、推論速度と精度の間で優れたトレードオフを実現しており、エッジデバイスから強力なクラウドサーバーまで、多様な現実世界のデプロイメントに適しています。
- 多様性: YOLOv8の主な利点は、単一の統合フレームワーク内で複数のビジョンタスクをネイティブにサポートしていることです。これには、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および傾斜バウンディングボックス(OBB)が含まれます。
- 使いやすさ: このモデルは、ユーザーエクスペリエンスを優先する、十分にメンテナンスされたエコシステムの一部です。広範なドキュメントと多数のチュートリアルによってサポートされている、効率化されたPython APIとシンプルなCLIを提供します。
- Training Efficiency: YOLOv8 は効率的なトレーニングプロセスを特徴とし、すぐに利用できる事前学習済みウェイトを提供し、カスタムモデルの開発を簡素化します。一般的に、より複雑なアーキテクチャと比較して、トレーニングに必要な CUDA メモリが少なくなっています。
- 充実したエコシステム: 継続的な開発、強力なオープンソースコミュニティ、頻繁なアップデート、エンドツーエンドのMLOpsワークフローのためのUltralytics HUBのようなツールとのシームレスな統合が利用できます。
YOLOv8 の弱点
- YOLOv8xのような大型モデルは、トレーニングとデプロイメントに多大な計算リソースを必要とします。
- 極めてリソース制約の厳しいハードウェアへの実装には、量子化などのさらなる最適化が必要になる場合があります。
YOLOv8の理想的なユースケース
YOLOv8は、高度なロボティクス、インテリジェントなセキュリティシステム、およびスマートシティインフラストラクチャなど、高い精度とリアルタイムパフォーマンスを必要とするアプリケーションに最適です。その汎用性により、単純な物体検出を超えて他のビジョンタスクを含むように拡張できるプロジェクトにも最適です。
EfficientDet:スケーラビリティと効率
著者: Mingxing Tan、Ruoming Pang、Quoc V. Le
組織: Google
日付: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
ドキュメント: https://github.com/google/automl/tree/master/efficientdet#readme
EfficientDetは、Google Brainチームによって導入されたオブジェクト検出モデルのファミリーです。その主な革新は、効率とスケーラビリティに重点を置いていることです。このアーキテクチャは、EfficientNetバックボーン、効果的なマルチスケール特徴融合のための新しいBi-directional Feature Pyramid Network(BiFPN)、および複合スケーリング方法を使用しています。この方法では、バックボーン、特徴ネットワーク、および予測ヘッドの深度、幅、および解像度を均一にスケーリングし、モデルをさまざまなリソース制約に合わせて調整できます。
EfficientDetの長所
- 高い効率性: EfficientDetは、パラメータ数とFLOPsを最小限に抑えつつ、精度を最大化するように設計されており、当時最も計算効率の高いアーキテクチャの1つです。
- スケーラビリティ: 複合スケーリングアプローチにより、モバイルデバイスから大規模クラウドサーバーまで、利用可能な計算リソースに基づいて選択できるモデルファミリー(D0からD7)を提供します。
- 精度: より大型のEfficientDetモデルは、COCOデータセットのような標準的なベンチマークで競争力のある精度を達成しています。
EfficientDet の弱点
- 推論速度: EfficientDetはFLOPsの点では効率的ですが、特にGPU上では、並列処理に高度に最適化されたYOLOv8のようなアーキテクチャと比較すると、必ずしも最速の実際の推論速度につながるとは限りません。
- 汎用性の制限: EfficientDetは主に物体検出モデルであり、Ultralyticsフレームワークにあるセグメンテーションやポーズ推定のような他のタスクに対する組み込みサポートがありません。
- エコシステムとメンテナンス: 公式リポジトリは、Ultralyticsエコシステムほど新機能や統合が活発にメンテナンスされていません。そのため、開発者が採用およびデプロイするのがより難しい場合があります。
EfficientDetの理想的なユースケース
EfficientDetは、パラメータ数と理論的な計算コスト(FLOPs)が最も重要な制約となるシナリオに最適です。モデルサイズが厳密に制限されている特定のエッジAIデバイスや、計算コストの最小化が優先されるクラウド環境でのアプリケーションに最適です。
性能の直接対決:速度、精度、効率
YOLOv8とEfficientDetを比較すると、それぞれ異なる目標に向けて最適化されていることが明らかです。YOLOv8は、実際の推論速度と精度の優れたバランスを優先し、EfficientDetはモデルパラメータとFLOPsの最小化に重点を置いています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
表から、以下を観察できます。
- 精度 vs. パラメータ数: YOLOv8モデルは、同程度またはそれ以上のパラメータ数を持つEfficientDetモデルよりも、一貫して高いmAPスコアを達成しています。例えば、YOLOv8s(11.2Mパラメータ)は44.9 mAPを達成し、EfficientDet-d2(8.1Mパラメータ)の43.0 mAPを上回っています。
- 推論速度: YOLOv8は、特にTensorRT最適化を施したGPUにおいて、推論速度で大きな優位性を示しています。YOLOv8xモデルは、パラメータ数が多いにもかかわらず、T4 GPU上で比較対象となるEfficientDet-d7モデルより8倍以上高速です。また、YOLOv8はCPU推論速度も大幅に向上しています。
- 効率性のトレードオフ: EfficientDetモデルはFLOPsが低いものの、それが直接的に高速な推論につながるわけではありません。YOLOv8のアーキテクチャは、最新のハードウェアアクセラレーションに適しており、実際のシナリオでの遅延が少なくなります。
Ultralytics YOLOモデルを選ぶ理由
EfficientDetはその時代において画期的なモデルでしたが、YOLOv8や最新のYOLO11のような新しいUltralytics YOLOモデルは、現代の開発者や研究者にとって大きな利点を提供します。
- 優れた性能: Ultralyticsのモデルは、速度と精度のバランスが優れており、リアルタイム推論に不可欠です。
- 最新のアーキテクチャ: アンカーフリー検出や高度な特徴融合ネットワークなど、深層学習における最新の進歩を取り入れています。
- Comprehensive Ecosystem: Ultralyticsのエコシステムは、トレーニングからデプロイメントまでシームレスな体験を提供し、広範なサポート、ドキュメント、および統合が利用可能です。
- マルチタスク機能: 1つのフレームワーク内で検出、セグメンテーションなどを処理できるため、開発時間が節約され、複雑さが軽減されます。
結論
EfficientDetは、特にモデルのスケーリングと効率に対する革新的なアプローチにおいて、注目に値するアーキテクチャであり続けています。パラメータ数とFLOPsの最小化が最優先事項であるアプリケーションにとって、これは確実な選択肢です。
しかし、最新のコンピュータビジョンアプリケーションの圧倒的多数にとって、YOLOv8 は、より魅力的な選択肢となります。優れた速度、より高い精度、比類のない汎用性を提供します。ユーザーフレンドリーで活発にメンテナンスされている Ultralytics エコシステムと組み合わせることで、YOLOv8 は開発者が高性能な AI ソリューションをより迅速かつ効果的に構築およびデプロイできるようにします。最も高度で使いやすいソリューションをお探しの方には、Ultralytics モデルが推奨される選択肢です。
その他のモデル比較
さらに検討を深めるには、YOLOv8、EfficientDet、およびその他の関連モデルを含むこれらの比較をご検討ください。
- YOLOv8 vs. YOLOv7
- EfficientDet vs. YOLOv7
- YOLOv8 vs. YOLOv5
- EfficientDet vs. YOLOv5
- RT-DETR vs. YOLOv8
- RT-DETR vs. EfficientDet
- YOLOv10やYOLO11のような最新モデルをご覧ください。