コンテンツにスキップ

YOLO11 .YOLOv6.0:高性能物体検出の深層分析

コンピュータビジョンの急速に進化する環境において、アプリケーションに適したモデルを選択することは極めて重要です。本比較では、二つの主要なアーキテクチャを検証します: Ultralytics YOLO11(YOLO 改良版)と、美团(Meituan)が提供する強力な産業向けYOLOv6。両者のアーキテクチャ、性能指標、使いやすさを分析することで、開発者が特定の導入ニーズに即した情報に基づいた判断を下せるよう支援することを目的としています。

概要

両モデルとも最先端の機能を提供しますが、それぞれが重視する優先順位が若干異なります。 YOLO11 は汎用性の高い万能モデルとして設計されており、使いやすさ、トレーニング効率、幅広いタスク対応(検出、セグメンテーション、姿勢推定、OBB、分類)に優れています。広範Ultralytics を活用しているため、効率的な「ゼロからヒーローへ」の体験を必要とする開発者にとって最適な選択肢です。

一方、YOLOv6.YOLOv6専用ハードウェア上での産業用スループットに極めて特化している。TensorRTを用いたGPUでのレイテンシ低減を重視しており、その代償として柔軟性や設定の容易さが犠牲になることが多い。

効率性の究極を追求する方々へ、YOLO26(2026年1月リリース)はエンドツーエンドNMS設計と大幅なCPU により、限界をさらに押し広げます。

モデルの概要

Ultralytics YOLO11

YOLO11 前世代の成功をYOLO11 、リアルタイム処理速度を維持しながら精度を向上させる洗練されたアーキテクチャ改良を導入しています。エッジデバイスからクラウドサーバーまで、幅広いハードウェア環境で効率的に動作するよう設計されています。

  • 著者: Glenn Jocher、Jing Qiu
  • 組織:Ultralytics
  • 日付: 2024-09-27
  • GitHub:ultralytics/ultralytics
  • 主な特徴:単一のAPIで複数のビジョンタスクをサポートする統一フレームワーク。

YOLO11の詳細について。

YOLOv6-3.0

YOLOv6.YOLOv6(通称「全面的な再構築」)YOLOv6、専用GPUが標準装備される産業用途に重点を置いている。ネック部分に双方向連結(BiC)を導入し、収束性向上のためにアンカー補助学習(AAT)を活用する。

  • 著者: Chuyi Li、Lulu Li、他
  • 組織: Meituan
  • 日付: 2023-01-13
  • GitHub:meituan/YOLOv6
  • 主な特徴: TensorRTを使用して主にGPU を最適化。

YOLOv6について詳しくはこちら

パフォーマンス比較

性能を比較する際には、mAP 平均精度)と推論速度のトレードオフを検討することが不可欠である。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

パフォーマンス分析

YOLO11 優れたパラメータ効率を示している。例えば、YOLO11n YOLOv6.YOLOv6(37.5)よりもmAP 39.5)を達成しながら、パラメータ数(260万対470万)とFLOPsをほぼ半分に抑えている。YOLO11 軽量化され、メモリ使用量の削減と制約のあるエッジデバイスへの適応性向上につながる。

アーキテクチャのハイライト

YOLO11: 効率性と適応性

YOLO11 改良されたC3k2ブロック(クロスステージ部分ネットワークの変種)と改良されたSPPFモYOLO11 。このアーキテクチャは、計算オーバーヘッドを最小化しつつ特徴抽出効率を最大化するように設計されている。

  • トレーニング効率: Ultralytics 収束が速いことで知られています。YOLO11 、従来のアーキテクチャやトランスフォーマーを多用するモデルと比較して、CUDA 要件が低く抑えられ、コンシューマー向けGPUでトレーニングYOLO11 。
  • メモリフットプリント:最適化されたアーキテクチャにより、学習時と推論時の両方でメモリフットプリントが小さくなり、より大きなバッチサイズとより複雑なデータ拡張パイプラインが可能になります。

YOLOv6.0: 産業用スループット

YOLOv6.YOLOv6、再パラメータ化をサポートするハードウェア向けに高度に最適化されたRepVGGスタイルのバックボーン(EfficientRep)を採用している。

  • 再パラメータ化:学習時には、より良い勾配流れのためにモデルはマルチブランチ構造を使用します。推論時には、これらは単一の3x3畳み込み層に融合されます。この「Rep」戦略は GPU レイテンシには優れるが、エクスポート時の管理が煩雑になり、トレーニング時のファイルサイズが増大する。
  • 量子化:美団(Meituan)は、TensorRT性能を最大化するため、ポストトレーニング量子化(PTQ)および量子化対応トレーニング(QAT)パイプラインを強く重視している。

エコシステムと使いやすさ

これら二つのモデルにおける最も重要な差別化要因は、それらを取り巻くエコシステムにある。

Ultralyticsの利点

Ultralytics 、統一された合理的なユーザー体験をUltralytics 。 ultralytics Python 、ユーザーはあらゆる段階を簡素化する、よく管理されたエコシステムにアクセスできます。 機械学習 ライフサイクル

  • 合理化されたAPI:トレーニング、検証、予測、エクスポートはすべて、数行のPython またはシンプルなCLI で処理できます。
  • Ultralytics :ユーザーUltralytics 上のウェブインターフェースを通じて、データセットの管理、画像の注釈付け、モデルのトレーニングを行えます。これにより、複雑なローカル環境のセットアップが不要になります。
  • 汎用性: YOLOv6主に物体検出器であるのとは異なり、YOLO11 複数のタスクをYOLO11 サポートしている:

YOLOv6.0 体験

YOLOv6 堅牢な研究リポジトリとしてYOLOv6 。強力である一方、多くの場合手動での設定が求められます。ユーザーは通常、リポジトリのクローン作成、依存関係の手動管理、複雑な設定ファイルの操作が必要となります。検出以外のタスク(セグメンテーションなど)への対応は存在しますが、Ultralytics と比較すると、統一されたワークフローへの統合度は低くなっています。

コード例:トレーニングとエクスポート

以下の比較は、Ultralytics の簡便さを示しています。

YOLO11の使用

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
# The dataset is automatically downloaded if not present
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX format for broad compatibility
path = model.export(format="onnx")

Ultralyticsを使用すれば、 Weights & BiasesやMLflowなどのツールの統合は、パッケージがインストールされていれば自動的に行われ、実験の追跡をさらに簡素化します。

将来を見据えた設計:YOLO26の必要性

YOLO11 優れた選択肢YOLO11 、2026年に新規プロジェクトを開始するUltralytics 強く検討すべきです。2026年1月にリリースされたこのモデルは、YOLO11 YOLOv6の両方に対して世代を超えた飛躍を遂げています。

  • エンドツーエンドNMS:YOLO26は、展開を複雑にし推論を遅延させがちな後処理ステップである非最大抑制(NMS)を排除します。
  • CPU :最大43%高速CPU を実現し、YOLOv6 などの産業用モデルがYOLOv6 苦戦する主要領域に対応します。
  • MuSGDオプティマイザ:LLMトレーニングに着想を得たこの新オプティマイザは、安定した高速収束を保証します。

YOLO26についてさらに詳しく

結論

両方 YOLO11YOLOv6.0は、コンピュータビジョン分野において強力なツールである。

以下の場合にYOLOv6.0を選択してください:

  • NVIDIA (T4、V100)にのみデプロイしています。
  • あなたのパイプラインはTensorRT に大きく依存しています。
  • 特定のハイエンドハードウェアにおけるスループット(FPS)が、成功の唯一の指標である。

YOLO11を選択する場合:

  • 使いやすさと、トレーニングとデプロイメントのための統一されたAPIを重視しています。
  • 多様なハードウェア(CPU、モバイル、TPU、GPU)に対応できる汎用性の高いモデルが必要です。
  • あなたのプロジェクトは、セグメンテーションや姿勢推定など複数のタスクを含んでいます。
  • より優れた精度対パラメータ比と低いメモリ使用量を持つモデルを好みます。
  • Ultralytics が提供する堅牢なサポートとツールへのアクセスをご希望です。

最先端を求める方には、ぜひ YOLO26をお試しください。これは高性能と、YOLOv10などのモデルが先駆けたNMS簡素化されたデプロイメントという両方の長所を兼ね備えています。 YOLOv10


コメント