YOLOv6.0 vsYOLOv9:高性能物体検出における進歩
物体検出アーキテクチャの進化は、推論速度と検出精度の最適なバランスを絶えず追求する過程で特徴づけられてきた。本比較では、美团(Meituan)が開発した堅牢な産業用グレードモデルYOLOv6.YOLOv6とYOLOv9を比較検討する。後者は勾配情報管理における革新的な概念を導入した研究向けアーキテクチャである。両モデルのアーキテクチャ、性能指標、最適なユースケースを分析することで、開発者は自身のコンピュータビジョンパイプラインに最適な判断を下すことが可能となる。
性能指標の比較
以下の表は主要な性能指標の直接比較を示しています。 YOLOv9 高度な特徴量集約技術を活用することで、同等のモデルサイズにおいて一般的に高い精度(mAP)を提供します。一方、YOLOv6.0は GPU競争力を維持しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv6.0: 産業用精度
YOLOv6特にバージョン3.0は、NVIDIA T4のようなGPUをハードウェア展開に用いることが多い産業用途を明確に念頭に置いて設計されました。量子化とTensorRT 積極的な最適化により、展開の容易さを重視しています。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織:Meituan
- 日付: 2023-01-13
- Arxiv:YOLOv6 v3.0: 全面的なリローディング
- GitHub:meituan/YOLOv6
アーキテクチャと強み
YOLOv6、構造的再パラメータ化を利用するEfficientRepと呼ばれるRepVGGスタイルのバックボーンを採用している。学習時にはマルチブランチブロックを用いて複雑な特徴を学習するが、推論時にはこれらが単一の$3\times3$畳み込みに収束する。このアーキテクチャはGPU に極めて友好的で、メモリスループットを最大化し、レイテンシを低減する。
主要な機能は以下の通りです。
- 双方向融合:異なるスケール間での特徴伝播を強化し、様々なサイズの物体の検出精度を向上させる。
- アンカー補助訓練(AAT):収束を安定化させるため、訓練中にアンカーベースとアンカーフリーのパラダイムの利点を組み合わせる。
- 量子化対応性:INT8への量子化時に精度損失を最小化するよう特別に設計されており、製造自動化におけるエッジAIデバイスにとって重要な要件です。
YOLOv9: 情報ボトルネックへの対処
YOLOv9 深層学習の効率向上に向け、「情報ボトルネック」問題(データが深層ネットワークを通過する際に失われる現象)に対処する理論的アプローチを採用。学習プロセス全体を通じて重要な勾配情報を保持するメカニズムを導入する。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024-02-21
- Arxiv:YOLOv9: Programmable Gradient Informationを使用して学びたいものを学習
- GitHub:WongKinYiu/yolov9
アーキテクチャと強み
YOLOv9 の中核となる革新は、主に以下の2つの構成要素YOLOv9 :
- GELAN(Generalized Efficient Layer Aggregation Network):CSPNetとELANの強みを組み合わせ、パラメータ効率と計算速度を最大化する新たなアーキテクチャ。これにより、従来のモデルと比較して少ないパラメータでより頑健な特徴を学習可能となる。 YOLOv8と比較して、より少ないパラメータでより頑健な特徴を学習できるようにする。
- PGI(プログラマブル勾配情報):ネットワークの深層が学習中に信頼性の高い勾配情報を受け取ることを保証する補助的な監視フレームワーク。医療画像解析など高精度が求められるタスクにおいて特に有益である。
YOLOv9 パラメータ効率の面で優れた性能YOLOv9 、多くの競合モデルよりも少ないmAP より高いmAP を達成するため、研究やモデル重量サイズが制約となるシナリオにおいて優れた選択肢となる。
技術比較とユースケース
YOLOv6.YOLOv6とYOLOv9 の選択は、YOLOv9 、具体的なハードウェアターゲットとアプリケーションの性質によって決まります。
YOLOv6-3.0を選択するタイミング
YOLOv6.GPU環境で優れた性能を発揮します。そのRepVGGバックボーンは並列処理向けに最適化されており、TensorRT、NVIDIA Orinなどのデバイス上で高速に動作します。以下に理想的な用途を示します:
- 高速製造:スループットが重要な組立ラインにおける品質管理システム。
- ビデオ分析: スマートシティ導入における複数ビデオストリームの同時処理
- レガシー統合:RepVGGスタイルのアーキテクチャ向けに既に最適化されたシステム。
YOLOv9を選択すべき時
YOLOv9 精度が重要なアプリケーションや研究YOLOv9 。その先進的なアーキテクチャは、多くの先行モデルよりも微細なディテールを良好に保持します。以下の用途に適しています:
- 学術研究:特徴量集約と勾配流の研究における強固な基盤。
- 小物体検出:PGIフレームワークは、深層で失われがちな小物体の情報を保持するのに役立ち、航空画像に有用である。
- パラメータ制約デバイス:ストレージ容量が限られている場合、YOLOv9の高い精度対パラメータ比が有利である。
デプロイの柔軟性
両モデルにはそれぞれ強みがあるものの、デプロイのための変換作業の複雑さは異なる。YOLOv6再パラメータ化ステップYOLOv6エクスポート時に慎重な処理を必要とする一方、YOLOv9補助ブランチは推論時に削除されるため、最終的なモデル構造が簡素化される。
Ultralyticsエコシステムの利点
YOLOv6 YOLOv9 は重要なマイルストーンYOLOv9 一方、 Ultralytics エコシステムは、機械学習ライフサイクル全体を簡素化する統合プラットフォームを提供します。YOLOv6、YOLOv9、あるいは最先端のYOLO26のいずれを使用する場合でも、Ultralytics 一貫した強力な体験Ultralytics 。
なぜUltralUltralyticsで開発するのか?
- 使いやすさ: Ultralytics Python 複雑なトレーニングループを数行のコードに抽象化します。モデル名の文字列を変更するだけでアーキテクチャを切り替えられます。例えば、
yolov6n.pt宛先yolo26n.pt. - よく管理されたエコシステム:公開後に活動停止状態になることが多い研究リポジトリとは異なり、Ultralytics 積極的にメンテナンスされています。これにより、PyTorchの最新バージョンとの互換性が保証されます。 PyTorch、CUDA、および ONNXとの互換性が保証されます。
- 汎用性: Ultralytics 幅広いコンピュータビジョンタスクUltralytics 。YOLOv9 YOLOv6 YOLOv9 物体検出に焦点を当てる一方、Ultralytics インスタンスセグメンテーション、姿勢推定、および方向性物体検出(OBB)への機能をUltralytics 。
- トレーニング効率: Ultralytics パイプラインはメモリ効率を最適化しており、メモリを大量に消費するトランスフォーマーハイブリッドモデルと比較して、開発者がコンシューマー向けGPUでより大規模なモデルをトレーニングすることを可能にします。
コード例:シームレスなトレーニング
Ultralytics モデルのいずれかをトレーニングする手順は同一であるため、チームの学習曲線を軽減します。
from ultralytics import YOLO
# Load a model: Switch between 'yolov6n.pt', 'yolov9c.pt', or 'yolo26n.pt'
model = YOLO("yolo26n.pt")
# Train on a dataset (e.g., COCO8)
# The system handles data augmentation, logging, and checkpointing automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
YOLO26へのアップグレード:次世代へ
パフォーマンス、効率性、導入の容易さにおいて究極を求める開発者にとって、YOLO26 YOLO 頂点を代表します。2026年1月にリリースされた本モデルは、YOLOv6、YOLOv9、そして YOLOv10 の知見を基盤に構築され、優れた体験を提供します。
YOLO26の主な利点
- エンドツーエンドNMS設計: YOLOv6 YOLOv9ノンマキシマムサプレッション(NMS)後処理を必要とするのとは異なり、YOLO26はネイティブにエンドツーエンドです。これにより遅延変動が排除され、特にエッジデバイス上でのデプロイメントパイプラインが簡素化されます。
- MuSGDオプティマイザー:LLMトレーニングの革新に着想を得たMuSGDオプティマイザー(SGD ミューオンのハイブリッド)は、トレーニングを安定化させ収束を加速し、カスタムモデルのトレーニングに必要な時間と計算リソースを削減します。
- エッジ最適化パフォーマンス:ディストリビューション焦点損失(DFL)の削除とアーキテクチャ改良により、YOLO26は前世代と比較して最大43%高速CPU を実現します。これにより、ラズベリーパイやスマートフォンなどのCPU環境において最適な選択肢となります。
- 高度な損失関数: ProgLossとSTALの統合により、小物体認識と境界ボックス精度が大幅に向上し、YOLO に共通する弱点を解決する。
- タスク特化型習得:YOLO26は単なる検出用ではなく、セグメンテーションタスク向けのセマンティックセグメンテーション損失や、高精度姿勢推定のための残差対数尤度推定(RLE)といった特化的な改良を備えている。
結論
YOLOv6.YOLOv9 、それぞれ特定の分野で明確な優位性をYOLOv9 YOLOv6 GPUYOLOv6 、YOLOv9 高精度YOLOv9 。しかし、あらゆるハードウェアタイプにおいて速度、精度、導入の簡便性のバランスを保ち、将来を見据えたソリューションを求める場合、Ultralytics 現代のコンピュータビジョン開発における推奨選択肢として際立っています。