YOLOv6-3.0 vs. YOLOv5: 包括的な技術比較

リアルタイム物体検出の進化により、さまざまなデプロイシナリオに最適化された複数のアーキテクチャが登場しました。本稿では、業界向けの「YOLOv6-3.0」と、基盤的で汎用性の高い「Ultralytics YOLOv5」という2つの主要なモデルを深く比較します。それぞれのアーキテクチャの選択、パフォーマンス指標、およびエコシステムサポートを理解することは、現実世界のアプリケーションに最適なコンピュータビジョンフレームワークを選択する助けとなります。

YOLOv6-3.0: 産業用スループットとハードウェア最適化

MeituanのVision AI部門によって開発されたYOLOv6-3.0は、高スループットな産業環境向けに大きく調整されています。これは、専用のNVIDIA GPUのようなハードウェアアクセラレータ上でのフレームレートの最大化に焦点を当てています。

  • 著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
  • 組織: Meituan
  • 日付: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6
  • ドキュメント: YOLOv6 Documentation

アーキテクチャ上の強み

YOLOv6-3.0は、速度を重視して設計されたいくつかの構造上の最適化を導入しています。このモデルはEfficientRepバックボーンを採用しており、これはGPU推論においてハードウェアフレンドリーになるよう特別に設計されています。これにより、オフラインでのバッチ処理タスクにおいて、このアーキテクチャは非常に強力なものとなっています。

トレーニング段階において、このモデルは**Anchor-Aided Training (AAT)戦略を取り入れています。このアプローチは、アンカーベースのトレーニングの安定性と、アンカーフリー推論の速度を両立させることを目指しています。さらに、ネックアーキテクチャにはBi-directional Concatenation (BiC)**モジュールを使用し、異なるスケール間での特徴融合を改善しています。TensorRTを使用するハイエンドサーバーGPU向けに高度に最適化されていますが、この専門化により、CPUのみの環境や低電力のエッジデバイスでは、逆にレイテンシが増大する場合があります。

YOLOv6の詳細はこちら

Ultralytics YOLOv5: アクセシブルなVision AIの先駆者

UltralyticsによってリリースされたYOLOv5は、使いやすさ、トレーニング効率、堅牢なデプロイメントの新しい基準を打ち立てました。最新のディープラーニングワークフローと深く統合することで、高性能な物体検出を民主化しました。

エコシステムと汎用性

YOLOv5の決定的な特徴は、その使いやすさにあります。PyTorchフレームワーク上でネイティブに構築されたこのリポジトリは、機械学習のライフサイクルを劇的に簡素化する統一されたPython APIを提供します。データセットの構成から最終的なデプロイメントまで、統合されたエコシステムにより、開発者は環境構築のデバッグに時間を費やす必要がなく、アプリケーションの構築に集中できます。

YOLOv5は物体検出だけに限定されません。並外れた汎用性を誇り、画像分類およびインスタンスセグメンテーションをネイティブにサポートしています。さらに、スマートキャッシング、自動データローダー、分散型マルチGPUトレーニングへの組み込みサポートを備え、比類のないトレーニング効率を実現しています。

Ultralyticsモデルにおけるメモリ効率

モデルアーキテクチャを比較する際、メモリ消費量は重要な要因となります。Ultralytics YOLOモデルは、重量級のTransformerモデルと比較して、トレーニングおよび推論中のVRAM要件が大幅に低く抑えられています。そのため、コンシューマーグレードのハードウェアやGoogle Colabのようなクラウドノートブックを使用する開発者にとって非常に利用しやすいものとなっています。

YOLOv5の詳細はこちら

パフォーマンスとアーキテクチャの比較

以下の表は、標準のCOCO datasetで評価した場合の、両アーキテクチャのパフォーマンス指標を概説したものです。モデルがさまざまな環境で、平均適合率と推論速度のトレードオフをどのようにバランスさせているかに注目してください。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

分析

YOLOv6-3.0は優れたmAPスコアを達成しており、T4 GPUでのTensorRTパイプライン用に大きく最適化されています。しかし、YOLOv5は、ONNX、CoreML、TFLiteを含む複数のフォーマットへの即時エクスポートをサポートする、非常に管理の行き届いたエコシステムでこれに対抗します。このパフォーマンスのバランスにより、YOLOv5は専用サーバーだけでなく、モバイルデバイスやRaspberry Piのようなエッジコンピューティング環境でも確実に動作します。

コード例: Ultralyticsによるシームレスなトレーニング

Ultralyticsエコシステムの最大の利点の1つは、合理化されたユーザーエクスペリエンスです。モデルのトレーニング、評価、エクスポートは、わずか数行のPythonコードで実行できます。

from ultralytics import YOLO

# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format for flexible deployment
model.export(format="onnx")

理想的なユースケースとデプロイシナリオ

これらのアーキテクチャの選択は、多くの場合、特定のインフラストラクチャの制約に依存します。

  • YOLOv6-3.0のデプロイタイミング: 専用のNVIDIA GPUが利用可能で、レイテンシを最小限に抑える必要がある自動製造ラインや高スループットのサーバー分析に最適です。そのアーキテクチャは、TensorRTの最適化をフルに活用できる環境で真価を発揮します。
  • YOLOv5のデプロイタイミング: ラピッドプロトタイピング、クロスプラットフォームデプロイ、および統一されたパイプラインを求めるチームにとって完璧な選択肢です。多様なエクスポート機能により、エッジデバイスでの小売分析、農業用ドローンの監視、フィットネスアプリケーションでの姿勢推定に最適です。

物体検出の未来: YOLO26の登場

YOLOv5とYOLOv6は重要なマイルストーンですが、コンピュータビジョンの分野は急速に進歩しています。新しいプロジェクトを開始する開発者や、絶対的な最先端技術を求める開発者には、Ultralytics YOLO26(2026年1月リリース)へのアップグレードを強く推奨します。

YOLO26は、画期的なエンドツーエンドのNMSフリー設計を導入することで、エッジファーストのVision AIを再定義します。Non-Maximum Suppressionによる後処理を不要にすることで、デプロイメントのロジックを簡素化し、レイテンシの変動を劇的に低減します。

YOLO26の主な革新点:

  • MuSGDオプティマイザ: SGDとMuonのハイブリッドであり、コンピュータビジョンに高度なLLMトレーニングの安定性をもたらし、より速く、より信頼性の高い収束を実現します。
  • 最大43%高速なCPU推論: 専用アクセラレータのない環境向けに大幅に最適化されています。
  • DFLの削除: Distribution Focal Lossの削除により、エクスポートプロセスが簡素化され、低電力エッジデバイスとの互換性が向上します。
  • ProgLoss + STAL: 小さな物体の認識を大幅に向上させる高度な損失関数で、航空写真やスマートシティのIoTセンサーにおいて不可欠です。

汎用的なタスクについては、YOLO11もUltralyticsファミリーの中で、引き続き十分にサポートされた優れた選択肢です。

YOLO26の詳細はこちら

結論

YOLOv6-3.0とYOLOv5はどちらも、リアルタイム検出の進歩において中心的な役割を果たしてきました。YOLOv6-3.0はGPU加速スループットのための高度に専門化されたアーキテクチャを提供し、YOLOv5は広範なドキュメント、使いやすさ、マルチタスク機能を通じて、比類のない開発者エクスペリエンスを提供します。

最新のアプリケーションでは、統合されたUltralyticsエコシステムを活用することで、将来を見据えたワークフローを保証できます。YOLO26のような最新のアーキテクチャを採用することで、デプロイパイプラインは、速度、精度、アルゴリズムのシンプルさにおける最新のブレークスルーの恩恵を確実に受けることができます。

コメント