コンテンツにスキップ

YOLOv10 .YOLOv6.0:次世代リアルタイム物体検出対決

コンピュータビジョンの急速に進化する環境において、適切な物体検出モデルを選択することは成功の鍵となる。二つの主要なアーキテクチャ、 YOLOv10YOLOv6、速度と精度のバランスにおいて大きな進歩を遂げています。本詳細比較では、両モデルのアーキテクチャ革新点、性能指標、最適なユースケースを検証し、導入ニーズに最適なモデル選択を支援します。

両モデルとも産業および研究用途向けに堅牢なソリューションを提供しますが、Ultralytics これらのアーキテクチャを容易にトレーニング、検証、展開できる統合プラットフォームを提供します。スマートシティインフラの構築であれ、製造ラインの最適化であれ、これらのモデルの微妙な差異を理解することが重要です。

性能指標の比較

以下の表は、様々なモデルスケールにおけるYOLOv10 YOLOv6.YOLOv6の性能を比較したものです。両モデルともCOCO で評価され、標準ハードウェア上での平均精度(mAP)と推論遅延に焦点を当てています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10:エンドツーエンドの革新者

YOLOv10清華大学の研究者によって発表されたYOLOv10は、YOLO パラダイムシフトを体現する。その最大の特徴は、一貫した二重割り当て戦略によって実現された後処理段階における非最大抑制(NMS)の排除である。この設計により真のエンドツーエンド学習と展開が可能となり、実世界アプリケーションにおける遅延変動を大幅に低減する。

主要なアーキテクチャ機能

  • NMS:豊富な教師データのための1対多と効率的な推論のための1対1という二重ラベル割り当てを活用することで、YOLOv10 NMSの計算上のボトルネックをYOLOv10 。
  • ホリスティック効率設計:本アーキテクチャは軽量分類ヘッドと空間チャネル分離型ダウンサンプリングを採用し、パラメータ数とFLOPsの両方を最適化している。
  • ランクガイド型ブロック設計:冗長性を低減するため、YOLOv10 ネットワークの段階に応じて複雑性を適応させるランクガイド型ブロック設計YOLOv10 。

著者:Ao Wang, Hui Chen, Lihao Liu, et al.
所属機関:清華大学
日付:2024年5月23日
リンク:arXiv|GitHub|Docs

YOLOv10について詳しくはこちら

YOLOv6.0:産業用ヘビー級

美团が開発したYOLOv6.YOLOv6、専用ハードウェア(GPUなど)での処理速度が最優先される産業用アプリケーションシナリオに重点を置いています。本バージョンでは「リローディング」アップデートを導入し、ネットワークを改良することで精度と量子化性能を向上させています。

主要なアーキテクチャ機能

  • 双方向連結(BiC):異なるスケールの特徴をより良く融合することで局所化精度を向上させる、首部における新規モジュール。
  • アンカー補助学習(AAT):この手法により、モデルは推論時にアンカーフリーのアーキテクチャを維持しつつ、アンカーベースの最適化安定性の恩恵を受けられる。
  • 量子化対応:本アーキテクチャはINT8への量子化時に精度劣化を最小化するよう特別に設計されており、TensorRTを利用するエッジデバイスに最適です。

著者:Chuyi Li, Lulu Li, Yifei Geng, et al.
組織:Meituan
日付:2023年1月13日
リンク:arXiv|GitHub|Docs

YOLOv6について詳しくはこちら

比較分析

1. レイテンシと効率性

YOLOv10 、パラメータ効率とFLOPsの観点で、YOLOv10 YOLOv6を上回る性能を発揮する。例えば、YOLOv10sモデルは、YOLOv6.YOLOv6と比較して、大幅に少ないパラメータ数(720万対1850万)でmAP 46.3%対45.0%)を達成している。YOLOv10 削除は、特に後処理オーバーヘッドが大きいCPUにおいて、より低く予測可能なレイテンシYOLOv10 。一方、YOLOv6.GPU 高度に最適化されており、T4 GPUでの高バッチシナリオではしばしば純粋な速度面で優位性を示す。

2. 導入と使いやすさ

両モデルUltralytics によってサポートされており、開発者が統一API経由でアクセスできることを保証します。ただし、YOLOv10ネイティブなエンドツーエンド特性により、 ONNX やCoreMLといった形式へのエクスポートパイプラインを簡素化します。これはモデルグラフに複雑なNMS を追加する必要がないためです。

デプロイのヒント

ラズベリーNVIDIA などのエッジデバイスに展開する場合、YOLOv10パラメータ数がNMS設計のため、従来のアーキテクチャと比較してメモリ消費量が少なく、起動時間が短縮される傾向があります。

3. トレーニング方法論

YOLOv6.YOLOv6自己蒸留やアンカー補助学習といった技術で性能を向上させるが、これにより学習時間とメモリ使用量が増加する可能性がある。YOLOv10 一貫性のある二重割り当てYOLOv10 、損失計算を効率化し収束を促進する。この技術を活用するユーザーは Ultralytics Platform これらの内部的な複雑さを気にせずに両方のモデルをトレーニングできるのは、抽象化された model.train() インターフェースが必要です。

Ultralyticsの利点

Ultralytics 内のモデルを選択することで、「ゼロからヒーローへ」の体験が保証されます。ドキュメントやメンテナンスが不十分なスタンドアロンリポジトリとは異なり、Ultralytics 以下の利点があります:

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

YOLO26による将来を見据えた対策

YOLOv10 YOLOv6.YOLOv6優れた選択肢ですが、この分野は進化を続けています。絶対的な最先端技術を求める開発者には、 YOLO26YOLOv10 NMS画期的な成果を基盤YOLOv10 2026年型ハードウェア向けに重要な機能強化を導入しています。

YOLO26にアップグレードする理由

  • エンドツーエンドネイティブ: YOLOv10と同様に、YOLO26はNMSであり、最もシンプルなデプロイメントパイプラインを保証します。
  • MuSGDオプティマイザ:LLMトレーニングに着想を得たこのハイブリッドオプティマイザは、安定した収束を保証し、広範なハイパーパラメータ調整の必要性を低減します。
  • エッジファースト設計:ディストリビューション焦点損失(DFL)の削除と最適化されたブロックにより、YOLO26 CPU 最大43%高速化し、モバイルおよびIoTアプリケーションにおける優れた選択肢となっています。
  • タスク特異性:YOLO26は先行モデルとは異なり、ProgLossやSTALといった特化損失関数を搭載し、小型物体検出を強化するとともに、OBBおよびPoseタスクへのネイティブサポートを提供します。

YOLO26についてさらに詳しく

結論

YOLOv10 パラメータ効率とシンプルなエンドツーエンドのデプロイメントパイプラインを優先するユーザーに推奨される選択肢です。少ないFLOPで高い精度を実現する能力により、様々なハードウェア上でのリアルタイムアプリケーションに最適です。

YOLOv6.YOLOv6、専用のGPU 備えた産業環境において依然として有力な選択肢であり、TensorRT 向けの特化最適化を最大限に活用できる。

究極の性能、多様なタスク(セグメンテーション、姿勢推定、OBB)への対応力、将来を見据えたサポートを求める方々に、YOLO26 Ultralytics確固たる推奨として提示する選択肢です。

参考資料


コメント