YOLOv6.0 vsYOLO:技術対決
リアルタイム物体検出の分野は、速度と精度の最適なバランスをめぐる急速な進化と競争によって特徴づけられる。 この分野における二つの重要な貢献は、美团(Meituan)が開発したYOLOv6.YOLOv6、YOLO。本比較では、両モデルのアーキテクチャ革新、性能ベンチマーク、理想的な導入シナリオを探るとともに、Ultralytics コンピュータービジョンの限界をいかに押し広げ続けているかを明らかにする。
性能ベンチマーク
両モデルともリアルタイム産業アプリケーションを対象としているが、異なる最適化戦略によって結果を達成している。COCO データセットにおける両モデルの性能を詳細に示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv6-3.0の概要
2023年初頭に美団(Meituan)がYOLOv6、従来のアーキテクチャを「全面的に刷新」したものである。GPUなどの専用ハードウェアへの展開を最適化したエンジニアリングモデルに重点を置いており、産業用自動化分野で高い評価を得ている。
主な特徴:
- 双方向連結(BiC):計算コストを大幅に増加させることなく局所化精度を向上させる、首部における改良された特徴融合手法。
- アンカー補助学習(AAT):収束を安定化させ最終精度を向上させるため、アンカーベースとアンカーフリーのパラダイムを組み合わせたハイブリッド学習戦略。
- 分離型ヘッド:分類と回帰タスクを分離する手法であり、現代の検出器における標準的な手法である。これにより、より精密な境界ボックスの微調整が可能となる。
- 量子化対応設計:本アーキテクチャは、RepOptimizerやチャネル単位のディスティレーションといった技術を用いてINT8へ量子化した際の精度低下を最小限に抑えるよう特別に設計されています。
DAMO-YOLO の概要
アリババグループが開発し、2022年末にリリースYOLO、特にニューラルアーキテクチャ検索(NAS)を通じて、速度と精度のトレードオフの限界を押し広げることを目的とした複数の新規技術を導入している。
主な特徴:
- MAE-NASバックボーン:最大エントロピー原理に基づくニューラルアーキテクチャ検索(NAS)によって発見されたバックボーンを利用し、高い情報伝達と効率性を保証する。
- 効率的なRepGFPN:標準的なPANetを汎用特徴ピラミッドネットワーク(GFPN)に置き換えたヘビーネック設計であり、より優れたマルチスケール特徴融合を提供する。
- ZeroHead:「重い」分離型ヘッドに通常伴う計算オーバーヘッドを削減するために設計された、極めて軽量な検出ヘッド。
- AlignedOTA:トレーニング中に分類と回帰タスクをより効果的に整合させる、更新されたラベル割り当て戦略。
比較分析
アーキテクチャと設計思想
主な相違点は設計の起源にある。YOLOv6.YOLOv6「導入の容易さ」を強く重視して手作業で設計されており、NVIDIA TensorRT ターゲットとしている。標準的な畳み込みとRepVGGスタイルのブロックを採用しているため、実稼働環境において高い予測可能性を実現している。
対照的に、YOLO最適な構造を見つけるために自動化探索(NAS)に大きく依存している。これにより理論上の効率(FLOPs)は優れているものの、NAS由来のバックボーンに見られる複雑な分岐構造は、YOLOv6単純明快な設計と比較して、特定のハードウェアコンパイラ向けに最適化するのが困難な場合がある。
エッジデバイス上でのパフォーマンス
エッジAIを伴うタスクにおいて エッジAIを伴うタスクにおいて、両モデルとも競争力のある「Tiny」または「Nano」バリエーションを提供します。YOLOv6極めて軽量(パラメータ数470万)であり、厳しく制約されたデバイスに適しています。YOLO若干大きいものの、多くの場合、より高い精度(42.0mAP)を即座に提供し、より細かい詳細を必要とするアプリケーションでは、追加の計算コストを正当化する可能性があります。
学習方法論
YOLOv6 自己蒸留を YOLOv6 、より大規模な教師モデルが学習中に生徒モデルを導く。これは高性能の鍵となるが、学習パイプラインの複雑さを増す。YOLO 蒸留強化モジュYOLO 、学習過程で困難なサンプルをより効果的に処理するため、AlignedOTAラベル割り当てを特に重視している。
デプロイメントに関する考慮事項
本番環境へのデプロイ時には、以下の点を考慮してください YOLOv6TensorRT介したINT8量子化に対する初期設定でのサポートが優れていることが多く、NVIDIA Orinなどの互換ハードウェアでは推論速度を倍増させることが可能です。
Ultralyticsの利点
YOLOv6 優れたYOLOv6 、Ultralytics 、使いやすさ、保守性、実運用環境への対応力を重視する開発者にとって明確な優位性を提供します。
シームレスな開発者体験
Ultralytics 、以下を含む YOLO11 や最先端のYOLO26を含むUltralyticsモデルは、統一されたフレームワーク上に構築されています。これにより、シンプルで一貫性のあるAPIを使用してモデルのトレーニング、検証、デプロイが可能となります。
from ultralytics import YOLO
# Load a model (switch freely between versions)
model = YOLO("yolo26n.pt")
# Train on your custom dataset
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
model.export(format="onnx")
タスクを横断する汎用性
多くの専門リポジトリとは異なり、Ultralytics 単純な検出を超えた幅広いコンピュータビジョンタスクをサポートします。これにはインスタンスセグメンテーション、姿勢推定、分類、および方向付き境界ボックス(OBB)検出が含まれます。この汎用性により、チームはAIツールを単一のワークフローに統合できます。
プラットフォーム統合
The Ultralytics は、データセット管理、自動アノテーション、ワンクリッククラウドトレーニングのためのツールを提供することで、ライフサイクルをさらに簡素化します。この統合されたアプローチにより、複雑なローカル環境の構築や分散したデータセットの管理に伴う摩擦が解消されます。
未来: Ultralytics YOLO26
パフォーマンスとアーキテクチャの革新において究極のものを求める開発者にとって、YOLO26は新たな基準を打ち立てます。
- エンドツーエンドNMS: 非最大抑制(NMS)を排除することで、YOLO26はデプロイメントパイプラインを簡素化し、レイテンシのばらつきを低減します。これはリアルタイム安全システムにとって極めて重要な機能です。
- CPU :分布焦点損失(DFL)の廃止とエッジ環境制約への最適化により、YOLO26は従来世代と比較して最大43%CPU を実現。これにより、専用GPUを持たないデバイスにおいて優れた選択肢となる。
- 高度なトレーニング安定性:LLMトレーニング技術に着想を得たMuSGDオプティマイザーの採用により、ビジョンモデルトレーニングに前例のない安定性をもたらし、より速い収束と優れた汎化性能を保証します。
- タスク特化型の性能向上:精密な姿勢推定のための残差対数尤度推定(RLE)であれ、OBBのための特化型角度損失関数であれ、YOLO26は複雑なユースケース向けに的を絞った改善を提供します。
概要
- 主要なデプロイ先NVIDIA (例:T4、A100)であり、産業用検査や動画解析向けに成熟した量子化サポートが必要な場合は、 YOLOv6.0を選択してください。
- NASベースのアーキテクチャに関心があり、研究や特定のシナリオにおいてRepGFPNがより優れた特徴融合を提供する状況で、高効率なバックボーンが必要な場合はYOLOを選択してください。
- 速度、精度、開発者体験の総合的なバランスに優 Ultralytics を選択してください。NMS設計、トレーニング時の低メモリ要件、そして広範なエコシステムサポートにより、迅速なプロトタイプから本番環境のエンタープライズソリューションへの拡張に最適な選択肢となります。
参考資料
Ultralytics で、さらに多くの比較とモデルを探索してください:
- YOLOv8 vs. YOLOv6
- RT-DETR - リアルタイム検出トランスフォーマー
- YOLOv10 - リアルタイムエンドツーエンド物体検出。
- COCO - オブジェクト検出の標準的なベンチマーク。