Link to this sectionYOLOv6-3.0 と YOLOv9 の比較#

リアルタイム物体検出の分野は、より高い精度、より低いレイテンシ、そして優れたハードウェア活用への要求に突き動かされ、進化を続けています。本比較では、この分野における2つの重要なマイルストーンを検証します。産業用途のスループットを目的として開発された YOLOv6-3.0 と、ディープラーニングの情報ボトルネックを克服するための新しいアーキテクチャを導入した YOLOv9 です。

どちらのモデルも独自のアーキテクチャ革新を提供していますが、パフォーマンスとデプロイのシンプルさの究極のバランスを求める開発者は、最新のエコシステムへ移行する傾向があります。新規プロジェクトを開始する場合、ネイティブでエンドツーエンドな Ultralytics YOLO26 が推奨される標準であり、最先端の精度を提供しながら、開発者体験を大幅に合理化します。

Link to this sectionYOLOv6-3.0: 産業用スループットの最適化#

MeituanのVision AI部門によって開発された YOLOv6-3.0 は、特にGPUハードウェア上での産業アプリケーションにおける最大スループットを追求して高度にエンジニアリングされています。

著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
組織: Meituan
日付: 2023年1月13日
Arxiv: 2301.05586
GitHub: meituan/YOLOv6

Link to this sectionアーキテクチャの革新#

YOLOv6-3.0 は、特徴融合とハードウェア効率を向上させるためにいくつかの重要な修正を導入しました。アーキテクチャのネック部分には、より正確な位置情報信号を提供する Bi-directional Concatenation (BiC) モジュールが組み込まれています。また、Anchor-Aided Training (AAT) 戦略も採用しています。このアプローチは、アンカーベース学習の豊富なガイダンスと、アンカーフリーパラダイムの推論速度を組み合わせたもので、デプロイ速度を落とすことなく、より優れたパフォーマンスを実現します。

バックボーンは EfficientRep 設計に基づいており、GPU推論においてハードウェアに優しいよう綿密に最適化されています。これにより、大規模なバッチ処理が標準である産業製造シナリオにおいて非常に高い能力を発揮します。

Link to this section強みと弱み#

YOLOv6-3.0 の主な強みは、NVIDIA T4 のようなGPU上での高いフレームレートにあり、高密度のビデオ理解ストリームに適しています。しかし、特定のハードウェア最適化に大きく依存しているため、CPUのみのエッジデバイスではレイテンシが最適にならない場合があります。さらに、より統合されたフレームワークと比較すると、学習パイプラインのセットアップが複雑になる可能性があります。

YOLOv6の詳細はこちら

Link to this sectionYOLOv9: プログラマブル勾配情報#

1年後にリリースされた YOLOv9 は、深層ニューラルネットワークに固有の情報ボトルネック問題の解決に焦点を当て、CNNアーキテクチャの理論的限界を押し広げています。

著者: Chien-Yao Wang および Hong-Yuan Mark Liao
組織: 中央研究院情報科学研究所
日付: 2024年2月21日
Arxiv: 2402.13616
GitHub: WongKinYiu/yolov9

Link to this sectionアーキテクチャの革新#

YOLOv9 の主な貢献は、Programmable Gradient Information (PGI) です。これは、重要なデータがネットワーク層を通過する際も確実に保持されるようにし、より信頼性の高い重みの更新を可能にします。PGI に加え、このモデルは Generalized Efficient Layer Aggregation Network (GELAN) を特徴としています。GELAN はパラメータ効率を最大化し、YOLOv9 が多くの前身モデルよりも少ない計算FLOPsで優れた精度を達成できるようにします。

Link to this section強みと弱み#

YOLOv9 は COCO のようなベンチマークデータセットで傑出した mean Average Precision (mAP) を達成しており、生の精度を優先する研究者に好まれています。しかし、YOLOv6 と同様に、ポストプロセッシングのために従来の Non-Maximum Suppression (NMS) に依存しています。これにより、特に ONNX や TensorRT などのフォーマットを使用してエッジデバイスへ移植する場合、レイテンシが増加し、モデルデプロイパイプラインが複雑になります。

YOLOv9の詳細はこちら

Link to this sectionパフォーマンスの比較#

これらのモデルを比較する際には、精度、パラメータ数、推論速度のバランスを考慮することが不可欠です。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Link to this sectionUltralyticsの優位性：YOLO26の紹介#

YOLOv6-3.0 と YOLOv9 は堅牢なアーキテクチャを提供しますが、本番環境では、十分にメンテナンスされたエコシステム、低いメモリ要件、そして優れた使いやすさが求められます。ここで Ultralytics Platform や YOLO11、そして最先端の YOLO26 といったモデルが真価を発揮します。

2026年初頭にリリースされた YOLO26 は、レガシーなボトルネックを排除することで、デプロイ効率を根本的に再定義します。

ネイティブなエンドツーエンド設計

YOLO26 は End-to-End NMS-Free Design を特徴としており、Non-Maximum Suppression のポストプロセッシングを完全に不要にしました。これにより、推論レイテンシの変動が大幅に低減され、エッジデプロイのロジックが簡素化されます。

Link to this sectionYOLO26の主な革新点#

MuSGD オプティマイザ: LLM学習（Moonshot AIの Kimi K2 など）に触発された YOLO26 は、SGD と Muon のハイブリッドを使用しています。これにより、コンピュータビジョンタスクに比類のない学習の安定性と高速な収束をもたらします。
最大43%高速なCPU推論: GPUを重視する YOLOv6 とは異なり、YOLO26 はエッジデバイス向けに高度に最適化されています。Distribution Focal Loss (DFL) の削除によりヘッドが簡素化され、低電力CPUやエッジコンピューティングハードウェアとの高い互換性を実現しています。
ProgLoss + STAL: 高度な損失関数が小さな物体の検出を劇的に向上させます。これは航空画像やロボティクスにおいて極めて重要です。
比類のない汎用性: YOLOv6 は純粋な検出エンジンですが、YOLO26 はインスタンスセグメンテーション、分類、姿勢推定、および Oriented Bounding Box (OBB) 検出をシームレスに処理します。

YOLO26の詳細はこちら

Link to this sectionUltralytics によるシームレスな学習#

最先端モデルの学習に複雑な bash スクリプトは必要ありません。Ultralytics Python API は、自動データローディング、最小限の CUDA メモリ使用量、そして組み込みのトラッキング機能を備えた合理化された体験を提供します。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX with a single command
model.export(format="onnx")

Link to this section理想的なユースケース#

最適なアーキテクチャの選択は、ターゲットとなるデプロイ環境に完全に依存します。

YOLOv6-3.0 を使用すべきケース: サーバーグレードのGPU（A100など）が十分にあり、バッチ処理でスループットを最大化する工場自動化や欠陥検出。
YOLOv9 を使用すべきケース: COCO などの標準化されたデータセットで絶対的な最高 mAP を追求することが主目的となる学術研究やコンテスト。
YOLO26 を使用すべきケース: ほとんどの現代的な商用アプリケーション。NMSフリーのアーキテクチャ、低いメモリフットプリント、高速なCPU推論により、セキュリティ警報システム、スマートリテール、および組み込みデバイス上でのリアルタイム物体トラッキングに最適です。

包括的な Ultralytics エコシステムを活用することで、開発者は YOLOv8、YOLO11、YOLO26 を簡単に試用し、それぞれの現実世界の課題に対するパフォーマンスの最適なバランスを見つけることができます。

貢献者

GLglenn-jocher¹³

作成日 2025年1月27日更新日 3 週間前

Link to this sectionYOLOv6-3.0 と YOLOv9 の比較#

Link to this sectionYOLOv6-3.0: 産業用スループットの最適化#

Link to this sectionアーキテクチャの革新#

Link to this section強みと弱み#

Link to this sectionYOLOv9: プログラマブル勾配情報#

Link to this sectionアーキテクチャの革新#

Link to this section強みと弱み#

Link to this sectionパフォーマンスの比較#

Link to this sectionUltralyticsの優位性：YOLO26の紹介#

Link to this sectionYOLO26の主な革新点#

Link to this sectionUltralytics によるシームレスな学習#

Link to this section理想的なユースケース#

コメント