YOLOv6-3.0とYOLO-YOLO:物体検出の技術比較
最適な物体検出モデルを選択することは、コンピュータビジョンプロジェクトにおいて非常に重要な決定です。このページでは、YOLOv6-3.0と YOLO-YOLOの詳細な技術比較を行います。YOLOv6-3.0と DAMO-YOLOは、物体検出タスクにおける効率と精度が高く評価されている2つの著名なモデルです。このページでは、YOLOv6-3.0とDAMO-YOLOのアーキテクチャのニュアンス、性能ベンチマーク、様々なアプリケーションへの適合性を探求し、選択の指針を示します。
YOLOv6-3.0の概要
MeituanのYOLOv6-3.0は産業用途に焦点を当て、高効率と精度のバランスをとっている。2023-01-13に発表された論文(YOLOv6 v3.0: A Full-Scale Reloading)で詳述されているYOLOv6のバージョン3.0は、性能と堅牢性を高めるためにアーキテクチャを改良している。ハードウェアを意識した設計になっており、多様なプラットフォームで効率的に動作する。
アーキテクチャと主な特徴
MeituanのChuyi Li氏、Lulu Li氏、Yifei Geng氏、Hongliang Jiang氏、Meng Cheng氏、Bo Zhang氏、Zaidan Ke氏、Xiaoming Xu氏、Xiangxiang Chu氏が執筆したYOLOv6-3.0は、スピードと効率のための合理化されたアーキテクチャに重点を置いている。主な特徴は以下の通り:
- 効率的な再パラメータ化バックボーン:より高速な推論を可能に。
- ハイブリッドブロック:精度と計算効率のバランスをとる。
- 最適化されたトレーニング戦略:モデルの収束と全体的なパフォーマンスを向上させます。
パフォーマンスと使用例
YOLOv6-3.0は、スピードと精度の融合を必要とする産業シーンに特に適しています。最適化された設計により、次のような用途に効果的です:
- 産業オートメーション:製造業における品質管理とプロセス監視
- スマートリテール:在庫管理と自動レジシステム。
- エッジ展開:スマートカメラのようなリソースが限られたデバイス上のアプリケーション。
強みだ:
- 産業用フォーカス:実際の産業展開の課題に合わせて調整。
- バランスの取れたパフォーマンス:スピードと精度の強力なトレードオフ。
- ハードウェアの最適化:さまざまなハードウェアプラットフォームで効率的なパフォーマンスを実現。
弱点がある:
- 精度のトレードオフ:いくつかの特殊なモデルと比較して、絶対的な最高精度を達成するよりもスピードと効率を優先する場合がある。
- コミュニティの規模:以下のような、より広く採用されているモデルに比べて、コミュニティが小さく、リソースが少ない可能性がある。 YOLOv8.
DAMO-YOLO 概要
アリババ・グループによって開発され、2022-11-23の論文(DAMO-YOLO: Rethinking Bounding Box Regression with Decoupled Evolution)で詳述されたDAMO-YOLO、効率性とスケーラビリティの両方に重点を置き、高性能のために設計されている。Xianzhe Xu氏、Yiqi Jiang氏、Weihua Chen氏、Yilun Huang氏、Yuan Zhang氏、Xiuyu Sun氏によって作成されたYOLO -YOLOは、分類と回帰のタスクを分離するために非結合型ヘッド構造を採用し、その速度を向上させている。
アーキテクチャと主な特徴
DAMO-YOLO スケーラビリティと高精度を目指して設計されている。その主要なアーキテクチャは以下の通りである:
- 分離されたヘッド構造:分類と回帰を分離し、スピードを向上。
- NASベースのバックボーン:パフォーマンスを最適化するためにニューラル・アーキテクチャ・サーチを活用。
- AlignedOTAラベル割り当て:トレーニングの精度を向上させます。
パフォーマンスと使用例
DAMO-YOLO 、高精度が要求されるアプリケーションに最適で、スケーラブルなモデルサイズにより、様々なリソース制約に適応します。以下の点で優れています:
- 高精度のシナリオ:自律走行と高度なセキュリティシステム。
- リソースに制約のある環境モデルバリエーションが少ないため、エッジデバイスへの展開が可能。
- 工業検査:精度が最優先される品質管理。
強みだ:
- 高精度:正確な検出のための印象的なmAPスコアを達成。
- スケーラビリティ:さまざまな計算ニーズに対応するため、さまざまなモデルサイズを提供。
- 効率的な推論:高速推論に最適化されており、リアルタイムタスクに適している。
弱点がある:
- 複雑さ:分離ヘッドや高度なテクニックは、アーキテクチャをより複雑にする可能性がある。
- Ultralytics内のドキュメント: Ultralytics モデルであるため、Ultralytics エコシステム内の直接的なドキュメントは限られています。
モデル比較表
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
ダモ・ヨロト | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
ダモヨロズ | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
ダモ・ヨロム | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
ダモヨロル | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
注:速度ベンチマークは、ハードウェア、ソフトウェア構成、および使用する特定の最適化技術によって異なる場合があります。CPU ONNX 速度はこの表では使用できません。
結論
YOLOv6-3.0とYOLO -YOLOはどちらも堅牢な物体検出モデルであり、それぞれにユニークな利点がある。YOLOv6-3.0は、異なるハードウェア間でのスピードと効率的なパフォーマンスのバランスを必要とする産業用アプリケーションに優れています。YOLO -YOLOは、高精度とスケーラビリティを優先するシナリオ向けに調整されており、多様な計算リソースに対応します。
Ultralytics エコシステム内のユーザーには、次のようなモデルがあります。 Ultralytics YOLOv8や最先端の YOLO11のようなモデルは、包括的なドキュメントとコミュニティ・サポートとともに最先端のパフォーマンスを提供します。YOLORT-DETRについては、Ultralytics YOLO Docsをご参照ください。