コンテンツにスキップ

YOLOv6.0 vs.YOLOv9:現代の物体検出技術への深い考察

リアルタイム物体検出の技術は、高精度化・低遅延化・ハードウェア効率化の要求に後押しされ、進化を続けている。本総合比較では、産業用スループット向けに開発されたYOLOv6.0とYOLOv9を比較検討する。

両モデルとも独自のアーキテクチャ革新を提供していますが、パフォーマンスと導入の簡便性の究極のバランスを求める開発者は、しばしば現代的なエコシステムへ移行します。新規プロジェクトを開始する方にとって、ネイティブでエンドツーエンドUltralytics 推奨される標準です。これは最先端の精度を提供すると同時に、大幅に合理化された開発者体験を実現します。

YOLOv6.0: 産業用スループット最適化

美団のビジョンAI部門が開発したYOLOv6.YOLOv6、産業用途、特にGPU における最大スループットを実現するために高度に最適化されている。

  • 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
  • 組織:Meituan
  • 日付: 2023年1月13日
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

アーキテクチャの革新

YOLOv6特徴融合とハードウェア効率を向上させるため、いくつかの重要な改良を導入した。このアーキテクチャはネック部分に双方向連結(BiC)モジュールを組み込み、より正確な位置特定信号を提供する。またアンカー補助学習(AAT)戦略を採用している。この手法はアンカーベース学習の豊富なガイダンスとアンカーフリーパラダイムの推論速度を組み合わせ、デプロイメント速度を低下させることなく優れた性能を実現する。

このバックボーンはEfficientRep設計に基づいており、GPU ハードウェア親和性を徹底的に最適化されています。これにより、大量のバッチ処理が標準となる産業製造シナリオにおいて高い能力を発揮します。

長所と短所

YOLOv6主な強みは、NVIDIA 高いフレームレートを実現することであり、高密度な動画理解ストリームに適している。しかし、特定のハードウェア最適化への依存度が高いため、CPUのエッジデバイスでは最適とは言えないレイテンシが生じる可能性がある。さらに、統一性の高いフレームワークと比較すると、そのトレーニングパイプラインの設定は複雑になり得る。

YOLOv6について詳しくはこちら

YOLOv9: プログラマブル勾配情報

1年後にリリースされた、 YOLOv9 は、深層ニューラルネットワークに内在する情報ボトルネック問題の解決に焦点を当て、CNNアーキテクチャの理論的限界を押し広げた。

アーキテクチャの革新

YOLOv9主な貢献はプログラマブル勾配情報(PGI)であり、これにより重要なデータが複数のネットワーク層を通過する際に保持され、より信頼性の高い重み更新が可能となる。PGIに加え、本モデルは汎用効率的層集約ネットワーク(GELAN)を備える。GELANはパラメータ効率を最大化し、YOLOv9 多くの先行モデルよりも少ない計算FLOPで優れた精度YOLOv9 可能にしている。

長所と短所

YOLOv9 COCOベンチマークデータセットにおいて卓越した平均精度(mAP)を YOLOv9 、純粋な精度を優先する研究者に好まれる。YOLOv6と同様、後処理には依然として従来の非最大抑制(NMS)に依存している。これにより遅延が生じ、TensorRT ONNX フォーマットを用いたエッジデバイスへの移植時には、モデル展開パイプラインが複雑化する。

YOLOv9について詳しくはこちら

パフォーマンス比較

これらのモデルを比較する際には、精度、パラメータ数、推論速度のバランスを検討することが不可欠である。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Ultralytics :YOLO26のご紹介

YOLOv6.YOLOv9 堅牢なアーキテクチャYOLOv9 、実稼働環境では、適切に維持されたエコシステム、低メモリ要件、そして卓越した使いやすさが求められます。ここで活躍Ultralytics YOLO11 や最先端のYOLO26といったモデルが真価を発揮します。

2026年初頭にリリースされたYOLO26は、従来のボトルネックを解消することで、デプロイ効率を根本的に再定義します。

ネイティブエンドツーエンド設計

YOLO26はエンドツーエンドNMS設計を採用し、非最大抑制(NMS)の後処理を完全に不要としています。これにより推論遅延のばらつきが大幅に低減され、エッジデプロイメントのロジックが簡素化されます。

YOLO26の主要なイノベーション

  1. MuSGDオプティマイザ:LLMトレーニング(Moonshot AIのKimi K2など)に着想を得たYOLO26は、SGD ミューオンのハイブリッド手法を採用。これにより、コンピュータービジョンタスクにおいて比類のないトレーニング安定性と高速収束を実現します。
  2. 最大43%高速CPU : YOLOv6 GPU 異なり、YOLO26はエッジデバイス向けに大幅に最適化されています。分布焦点損失(DFL)の削除によりヘッドが簡素化され、低電力CPUやエッジコンピューティングハードウェアとの高い互換性を実現しています。
  3. ProgLoss + STAL:高度な損失関数が小型物体検出を劇的に改善し、これは航空画像とロボティクスにおいて極めて重要である。
  4. 比類なき汎用性: YOLOv6 純粋な検出エンジンYOLOv6 一方、YOLOv6はインスタンスセグメンテーション、分類、姿勢推定、および方向付き境界ボックス(OBB)検出をシームレスに処理します。

YOLO26についてさらに詳しく

Ultralyticsによるシームレスなトレーニング

最先端モデルのトレーニングに複雑なbash は必要ありません。Ultralytics Python 、自動データロード、最小限CUDA 使用量、組み込みの追跡機能により、効率的な体験を提供します。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX with a single command
model.export(format="onnx")

理想的なユースケース

適切なアーキテクチャの選択は、完全にターゲットとなるデプロイ環境によって決まります:

  • YOLOv6.YOLOv6以下に使用する:サーバーグレードGPU(例:A100)が豊富に利用可能で、バッチ処理によりスループットが最大化される工場自動化および欠陥検出。
  • YOLOv9 :学術研究や、COCO などの標準化されたmAP 絶対的な最高mAP を追求することが主目的COCO 競技会。
  • YOLO26の用途:ほぼすべての現代的な商用アプリケーション。NMSアーキテクチャ、低メモリ消費、CPU により、セキュリティ警報システム、スマート小売、組み込みデバイス上でのリアルタイム物体追跡に最適です。

Ultralytics を活用することで、開発者は簡単に YOLOv8、YOLO11、YOLO26を簡単に試すことができ、特定の現実世界の課題に最適なパフォーマンスバランスを見つけることができます。


コメント