YOLOv9 YOLOv6.0:包括的な技術比較
リアルタイム物体検出技術の進化は、推論速度・精度・計算効率の微妙なバランスを最適化するニューラルネットワークアーキテクチャの継続的な革新によって推進されてきた。開発者や研究者がコンピュータビジョンフレームワークの複雑な状況に対応する中、主要なアーキテクチャを比較することは、目的に適したツールを選択するために不可欠である。
この技術ガイドでは、2つの高性能モデルを詳細に比較します: YOLOv9(深層学習の情報保持能力で知られる)と、産業用途に特化したモデルであるYOLOv6.0を詳細に比較します。
YOLOv9 :特徴量保持の最大化
2024年初頭に登場YOLOv9 、深層ニューラルネットワークにおける最も根強い課題の一つ、すなわち順伝播過程における情報損失YOLOv9 。勾配の信頼性を確保し、特徴マップが重要なデータを保持することを保証することで、理論上の精度の限界を押し広げている。
- 著者: Chien-Yao Wang and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2024年2月21日
- リンク:Arxiv論文,GitHubリポジトリ
アーキテクチャと方法論
YOLOv9 、汎用効率的層集約ネットワーク(GELAN)と共に、プログラマブル勾配情報(PGI)の概念YOLOv9 。PGIは補助的教師情報を提供することで情報ボトルネックに対処し、推論オーバーヘッドを追加することなく、メインネットワークが堅牢で信頼性の高い特徴を学習することを保証する。 一方、GELANはパラメータ利用率を最適化し、計算コストを管理可能な範囲に抑えつつ、モデルが最先端の平均精度(mAP)を達成することを可能にします。これにより、特徴の忠実度が極めて重要な医療画像解析や極小物体検出において、優れた選択肢となります。
YOLOv6.0 概要:産業規模向けに構築
美団(Meituan)が開発YOLOv6(v3.0とも呼ばれる)YOLOv6、重工業用途向けに一から設計された。2023年初頭にリリースされ、展開効率を重視し、エッジハードウェアで優れた性能を発揮する量子化対応モデル群を提供する。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織: Meituan
- 日付: 2023年1月13日
- リンク:Arxiv論文,GitHubリポジトリ
アーキテクチャと方法論
YOLOv6.YOLOv6、RepOptimizerとAnchor-Aided Training(AAT)戦略によって独自性を発揮します。 本モデルはRepVGGに着想を得たハードウェア対応型ニューラルネットワーク設計を採用しており、層の融合により推論時にGPU上で極めて高速に動作します。3.0アップデートでは双方向連結(BiC)モジュールを導入し、局所化精度を向上させることでアーキテクチャをさらに洗練させました。TensorRTなどのデプロイ形式向けに高度に最適化されているため TensorRT や OpenVINOなどのデプロイ形式向けに高度に最適化されているため、YOLOv6.YOLOv6物流、製造自動化、高スループットサーバー環境などで頻繁に採用されています。
パフォーマンス比較
標準的なCOCO でこれらのモデルを評価すると、精度と生の推論速度の間に明確なトレードオフが観察される。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
テクニカル分析
T4ハードウェア上ではYOLOv6純粋な速度で首位(1.17ms)を占める一方、YOLOv9tはパラメータ数を半分以下(200万 vs 470万)に抑え、FLOPsも大幅に削減しながら、わずかにmAP 38.3%)を達成している。 複雑で高精度が求められる要件においては、大規模なYOLOv9eがmAP55.6%まで押し上げ、深層ネットワークにおけるPGIアーキテクチャの威力を示している。
YOLO26でプロジェクトの将来性を確保
新しいコンピュータビジョンプロジェクトを開始する場合、 YOLO26の利用を強く推奨します。2026年にリリースされた本技術は、後処理の遅延を完全に排除するネイティブのエンドツーエンドNMS設計を特徴とし、最大43%高速CPU を実現します。
Ultralyticsエコシステムの利点
どのモデルのアーキテクチャ哲学に魅力を感じるかに関わらず、Ultralytics Python を通じてネイティブに実装することで、優れた開発者体験が得られます。
使いやすさとトレーニング効率
従来、複雑な深層学習モデルのトレーニングには膨大な定型コードが必要でした。Ultralytics はこうした複雑さを抽象化します。欠陥検出 YOLOv9 微調整であれ、モバイルYOLOv6 エクスポートであれ、ワークフローは驚くほど一貫しています。
さらに、Ultralytics 、一般的に、かさばるトランスフォーマーベースのモデルと比較して、トレーニング中のCUDA 要件が低いという特徴があります。これにより、開発者はコンシューマー向けGPUでより大きなバッチサイズを使用できるようになり、トレーニング効率が大幅に向上します。
from ultralytics import YOLO
# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")
# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Export to ONNX or TensorRT seamlessly
model.export(format="engine", half=True)
あらゆる視覚タスクにおいて比類なき汎用性
YOLOv6.YOLOv6高速なバウンディングボックス生成に高度に最適化されていますが、現代のコンピュータビジョンプロジェクトではマルチタスクアプローチが求められることが多くなっています。Ultralytics はその極めて高い汎用性で高く評価されています。 Ultralytics YOLOv8 や新世代のYOLO26といったツールを用いれば、単一のフレームワークで物体検出、インスタンスセグメンテーション、画像分類、姿勢推定、方向付きバウンディングボックス(OBB)をシームレスに処理できます。
YOLO26のご紹介:新たな基準
パフォーマンスと導入の容易さの両方を最大化したい組織にとって、YOLO26は速度と精度の究極の融合を実現します。
YOLO11の成功を基盤として YOLO11を基盤として、YOLO26はいくつかのパラダイムシフトをもたらす機能を導入しています:
- MuSGDオプティマイザー:Moonshot AIのKimi K2のような大規模言語モデル(LLM)のトレーニング技術に着想を得たこのハイブリッドオプティマイザーは、驚異的な安定性を備えたトレーニングと高速な収束を保証します。
- DFL除去:分布焦点損失を除去することで、YOLO26は出力グラフを簡素化し、低電力エッジコンピューティングチップとの互換性を大幅に向上させます。
- ProgLoss + STAL:これらの高度な損失関数は、ドローン運用やIoTアプリケーションにおいて極めて重要な小規模物体認識において顕著な改善をもたらす。
- タスク特化型改良点:YOLO26には、セグメンテーション向けのネイティブマルチスケールプロトタイピング、骨格追跡向けの残差対数尤度推定(RLE)、およびOBB検出におけるエッジケースを解決するための専用角度損失アルゴリズムが含まれる。
理想的な導入シナリオ
適切なアーキテクチャの選択は、最終的には生産上の制約に帰着する。
工業製造分野で確立されたパイプラインを有し、量子化に大きく依存し、かつ絶対的なサブミリ秒単位のハードウェアレイテンシが要求される場面で専用推論アクセラレータを活用する場合、YOLOv6.YOLOv6を選択してください。
選択 YOLOv9 複雑な医療診断や長距離監視など、微妙なピクセルレベルの特徴を逃すことが許されない場面では、YOLOv9を選択してください。
しかしながら、最先端の精度と簡素化されたNMS展開を両立させる完璧にバランスの取れたアプローチを求めるなら、Ultralytics 現代のコンピュータビジョンエンジニアリングにおける決定的な推奨選択肢である。その活発な開発サイクル、包括的なドキュメント、そして活発なコミュニティサポートにより、研究者にも開発者にも欠かせないツールとなっている。