YOLOv6-3.0 vs YOLOv8:詳細な技術比較
適切な物体検出モデルの選択は、あらゆるコンピュータビジョンプロジェクトのパフォーマンス、効率、スケーラビリティに直接影響を与える重要な決定です。このページでは、Meituanが開発したYOLOv6-3.0と、Ultralyticsの最先端モデルであるUltralytics YOLOv8との包括的な技術比較を提供します。アーキテクチャの違い、パフォーマンス指標、理想的なユースケースを掘り下げ、ニーズに最適なフレームワークを選択するためにお役立てください。どちらのモデルも強力ですが、YOLOv8は、その優れた汎用性、使いやすさ、堅牢で適切にメンテナンスされたエコシステムで際立っています。
YOLOv6-3.0
著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
所属: Meituan
日付: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
ドキュメント: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0は、産業用アプリケーションに重点を置いて設計された物体検出フレームワークです。その開発では、推論速度と検出精度の効果的なバランスを実現することを優先しており、パフォーマンスが重要な実際の展開シナリオにとって実行可能なオプションとなっています。
アーキテクチャと主な機能
YOLOv6-3.0は、効率を向上させることを目的としたいくつかのアーキテクチャの革新を導入しました。効率的な再パラメータ化バックボーンと簡素化されたネック(Rep-PAN)を備えたハードウェアを意識したネットワーク設計を特徴としています。トレーニングプロセスには、推論コストを追加せずにパフォーマンスを向上させるための自己蒸留が組み込まれています。このフレームワークは、モバイルおよびCPUベースのデプロイメント用に最適化されたYOLOv6Liteなどの特殊なモデルも提供します。
長所
- 高速なGPU推論速度: YOLOv6-3.0モデルは、GPU上で優れた推論速度を発揮します。特にTensorRTで最適化した場合、専用のGPUハードウェアを用いたリアルタイムアプリケーションに適しています。
- 量子化サポート: このフレームワークは、リソースに制約のあるハードウェアにモデルを展開するのに役立つモデル量子化に対する優れたサポートとチュートリアルを提供します。
- 産業用への注力: このモデルは産業用途向けに特別に設計されており、速度が最優先されるシナリオで優れた性能を発揮します。
弱点
- 汎用性の制限:YOLOv6は主に物体検出器です。YOLOv8で標準となっているインスタンスセグメンテーション、姿勢推定、画像分類のような他のコンピュータビジョンタスクに対する組み込みサポートがありません。
- 高いリソース使用率: 同等の精度レベルの場合、YOLOv6 モデルは YOLOv8 相当のモデルよりもパラメータが多く、FLOPs が高いことが多く、計算要件の増加につながる可能性があります。
- エコシステムとメンテナンス: オープンソースですが、YOLOv6を取り巻くエコシステムはUltralyticsプラットフォームほど包括的または活発にメンテナンスされていません。これにより、アップデートが遅くなり、統合が少なくなり、コミュニティサポートが少なくなる可能性があります。
Ultralytics YOLOv8
著者: Glenn Jocher, Ayush Chaurasia, Jing Qiu
所属: Ultralytics
日付: 2023-01-10
Arxiv: None
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8は、これまでのYOLOバージョンの成功を基に構築された、最先端のモデルです。高速、高精度、そして使いやすいように設計されており、幅広いコンピュータビジョンタスクに対応できる包括的なプラットフォームを提供します。そのアーキテクチャと開発者向けの優れたエコシステムにより、ほとんどのアプリケーションにとって推奨される選択肢となっています。
アーキテクチャと主な機能
YOLOv8は、新しいバックボーン、新しいアンカーフリーの検出ヘッド、および新しい損失関数を含む、アーキテクチャの大幅な改善を導入しています。これにより、より正確であるだけでなく、パラメータと計算負荷の点でより効率的なモデルが実現します。アンカーフリー検出器として、YOLOv8は出力層を簡素化し、汎化性能を向上させます。
長所
- 優れたパフォーマンスバランス: YOLOv8は、速度と精度の並外れたトレードオフを実現します。下の表に示すように、YOLOv6と比較して、より少ないパラメータとFLOPでより高いmAPスコアを提供することが多く、非常に効率的です。
- 比類なき汎用性: YOLOv8は、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および物体追跡をすぐにサポートするマルチタスクフレームワークです。この汎用性により、開発者は複数のアプリケーションに単一の整合性のあるフレームワークを使用できます。
- 使いやすさ: Ultralyticsエコシステムは、効率化されたユーザーエクスペリエンスのために設計されています。シンプルなPython APIとCLI、充実したドキュメント、およびすぐに利用できる事前学習済みの重みにより、YOLOv8の利用開始は非常に簡単です。
- 優れたエコシステム: YOLOv8は、Ultralyticsによる活発な開発によって支えられており、頻繁なアップデート、GitHubやDiscordを介した強力なコミュニティサポート、およびノーコードでのトレーニングとデプロイメントのためのUltralytics HUBのようなツールとのシームレスな統合が保証されています。
- 学習効率: このモデルは、効率的な学習プロセスのために設計されています。特にTransformerベースのモデルと比較して、他のアーキテクチャよりも必要なメモリが少なく、最適化されたデータ拡張戦略の恩恵を受けます。
弱点
- 小物体検出: ほとんどのシングルステージ検出器と同様に、YOLOv8は、特化したTwo-Stage検出器と比較して、極めて小さい物体や密集した物体の検出で課題が生じることがあります。
パフォーマンス比較
次の表は、COCO val2017データセットでのさまざまなYOLOv8およびYOLOv6-3.0モデルのパフォーマンス指標を比較しています。各列で最高のパフォーマンスを示す値は太字で強調表示されています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
パフォーマンスデータから、いくつかの重要な洞察が得られます。
- 精度 vs. 効率性: YOLOv8モデルは、一貫して同程度またはわずかに優れたmAPスコアを、より少ないパラメータとFLOPsで達成しています。例えば、YOLOv8mはYOLOv6-3.0mよりも高いmAP(50.2 vs. 50.0)を達成しながら、パラメータを約26%、FLOPsを約8%削減しています。
- CPU vs. GPU速度: YOLOv6-3.0は、TensorRTを搭載したNVIDIA T4 GPUで非常に競争力のある推論速度を示しています。ただし、YOLOv8はONNXで優れたCPUパフォーマンスを発揮し、専用GPUのない、より広範なエッジデバイスおよびクラウドインスタンスへのデプロイメントにとって重要な利点となります。
- 全体的な価値: YOLOv8は、より魅力的なパッケージを提供します。そのアーキテクチャ効率は、特定のレベルの精度に対して、より低いリソース要件に変換され、これは実用的なアプリケーションにとって大きな利点です。
結論と推奨事項
YOLOv6-3.0 は産業用アプリケーション向けに優れた GPU 速度を備えた有能なオブジェクト検出器ですが、Ultralytics YOLOv8 はほとんどのユーザーとプロジェクトにとって優れた選択肢です。
YOLOv8の主な利点である、マルチタスクの汎用性、速度と精度の卓越したバランス、より低いリソース要件、およびユーザーフレンドリーなエコシステムにより、より強力で柔軟なツールとなっています。AIの限界を押し広げる研究者であれ、堅牢な現実世界のソリューションを構築する開発者であれ、YOLOv8はより包括的で効率的、かつ将来性のあるプラットフォームを提供します。
その他のモデルについて
さらに詳しく知りたい方のために、Ultralytics は幅広いモデルを提供しています。YOLOv8をYOLOv5やYOLOv7のような前身モデルと比較したり、YOLOv10やYOLO11のような最新の最先端モデルを検討したりできます。さらに、RT-DETRのような他のアーキテクチャとの比較も、Ultralytics のドキュメントでご覧いただけます。