コンテンツにスキップ

YOLOv5 .YOLOv6.0:リアルタイム物体検出モデル完全ガイド

コンピュータビジョンの分野は絶えず進化を続けており、新たなアーキテクチャが速度と精度の限界を押し広げています。次なるビジョンAIプロジェクトのモデル選定にあたり、開発者は確立された汎用フレームワークと高度に専門化された産業用検出器を比較検討することが多いでしょう。本稿では、 Ultralytics YOLOv5美团(Meituan)YOLOv6の間の技術的差異を掘り下げ、導入ニーズに最適なツール選択を支援します。

モデルの紹介

Ultralytics YOLOv5: 汎用性の高い標準

2020年にリリースUltralytics YOLOv5 、YOLOv5 アクセスしやすく高性能な物体検出のゴールドスタンダードとなった。その驚くほど簡単な操作性、堅牢なトレーニングパイプライン、そして幅広いデプロイメント統合で広く知られている。

YOLOv5 、PyTorchエコシステム内でシームレスな開発者体験を提供するために一からYOLOv5 。 PyTorch エコシステム内でシームレスな開発者体験を提供するために一から設計されました。優れたパフォーマンスバランスを実現し、高い推論速度を維持しながら優れた平均精度(mAP)を達成します。これにより、エッジデバイスからクラウドサーバーまで、多様な実世界の展開シナリオに適しています。

YOLOv5について詳しくはこちら

YOLOv6.0: 産業用スループット

MeituanのVision AI部門によって開発されたYOLOv6-3.0は、産業用アプリケーション向けに特別に調整されており、専用のハードウェアアクセラレータでの生の処理能力を重視しています。

YOLOv6 、NVIDIA などのGPU上で処理速度を最大化することをYOLOv6 。カスタム量子化手法と専用バックボーンを用いて性能を実現しており、バッチ推論が頻繁に利用されるバックエンドサーバー処理において有力な選択肢となります。

YOLOv6について詳しくはこちら

アーキテクチャの違い

これらのモデルの背後にあるアーキテクチャ上の選択を理解することは、その理想的なユースケースを特定するために極めて重要です。

YOLOv5

YOLOv5 、高度に最適化されたCSPDarknetバックボーンとパスアグリゲーションネットワーク(PANet)ネックを組み合わせたYOLOv5 。この構造は、トレーニング時および推論時のメモリ要件を最小限に抑えるよう徹底的に微調整されています。膨大なCUDA 長時間のCUDA 必要とする大規模なトランスフォーマーモデルとは異なり、YOLOv5 標準的なコンシューマー向けハードウェア上で効率的にYOLOv5 。

メモリ効率

Ultralytics 、トレーニング効率を特に重視して設計されています。多くの場合、YOLOv5 単一GPUでトレーニング可能であり、研究者やスタートアップ企業にとって非常に利用しやすい特徴を備えています。

さらに、YOLOv5 単なる物体検出器YOLOv5 。そのアーキテクチャは他のタスクへシームレスに拡張され、画像セグメンテーションや 画像分類に対して堅牢な即戦力サポートを提供します。

YOLOv6.0アーキテクチャ

YOLOv6、GPU ハードウェアに優しい設計のEfficientRepバックボーンを備える。首部には双方向連結(BiC)モジュールを採用し、特徴融合を強化している。

トレーニング中、YOLOv6は収束を安定させるためにAnchor-Aided Training (AAT)戦略を使用しますが、推論中はアンカーフリーの検出器として機能します。このアーキテクチャはGPUアクセラレーションタスクに優れていますが、非常にポータブルなYOLOv5フレームワークと比較して、多様なエッジデバイスへの適応がより複雑になる場合があります。

パフォーマンス分析

これらのモデルを評価する際には、純粋な速度と精度の指標が極めて重要です。以下は、COCO 様々なモデルサイズの性能を比較した表です。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv6.YOLOv6より大規模なバリエーションでmAP を達成する一方、YOLOv5 驚異的な軽量性をYOLOv5 。例えばYOLOv5nは、YOLOv6 パラメータ数とFLOPsを大幅に削減しており、モバイル環境やCPU展開において極めて最適である。

エコシステムと使いやすさ

多くのエンジニアリングチームにとって真の決定的要因は、モデルを取り巻くエコシステムである。

YOLOv6 優れた研究リYOLOv6 、様々なフォーマットに展開するには大量の定型コードが必要です。一方、Ultralytics 洗練されたユーザー体験を特徴とする、よく整備されたエコシステムUltralytics 。統一Python 直感的なUltralytics を通じて、開発者はシームレスなデータセット管理、ワンクリックトレーニング、ONNXなどのフォーマットへの直接エクスポート機能を利用できます。 ONNXTensorRTなどのフォーマットへの直接エクスポートを実現します。

コード例:統合されたUltralytics API

Ultralyticsクス ultralytics pipパッケージを使えば、わずか数行のコードでモデルの読み込み、トレーニング、デプロイが可能です。

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for edge deployment
model.export(format="onnx")

ユースケースと推奨事項

YOLOv5とYOLOv6のどちらを選択するかは、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの好みに依存します。

YOLOv5を選択すべき時

YOLOv5 以下に最適YOLOv5 :

  • 実績のある本番システム: YOLOv5の長年にわたる安定性、広範なドキュメント、および大規模なコミュニティサポートが評価されている既存のデプロイメント。
  • Resource-Constrained Training: 限られたGPUリソースを持つ環境において、YOLOv5の効率的なトレーニングパイプラインと低いメモリ要件が有利です。
  • 豊富なエクスポート形式のサポート: ONNXTensorRTCoreML、およびTFLiteを含む多くの形式でのデプロイを必要とするプロジェクト。

YOLOv6を選択すべき時

YOLOv6 以下に推奨YOLOv6 :

  • 産業用ハードウェア対応デプロイメント: モデルのハードウェア対応設計と効率的な再パラメータ化により、特定のターゲットハードウェアで最適化されたパフォーマンスを提供するシナリオです。
  • 高速シングルステージdetect: 制御された環境でのリアルタイムビデオ処理のために、GPUでの生の推論速度を優先するアプリケーション。
  • 美団エコシステム統合: 美団の技術スタックとデプロイメントインフラストラクチャ内で既に作業しているチーム。

Ultralytics YOLO26)を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。

  • NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
  • CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
  • 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。

前進:YOLO26の優位性

YOLOv5 信頼性の高い主力モデルYOLOv5 、YOLOv6.YOLOv6 GPU 高いGPU を発揮しますが、最先端技術は進化を続けています。新規プロジェクトを開始する開発者には、Ultralytics 推奨される選択肢です。

2026年1月にリリースされたYOLO26は、飛躍的な進化を遂げた製品です。Ultralytics 承しつつ、画期的なアーキテクチャ改良を導入しています:

  • エンドツーエンドのNMSフリー設計: YOLO26はNon-Maximum Suppression後処理を排除し、レイテンシのばらつきを劇的に低減し、デプロイメントロジックを簡素化します。
  • 最大43%高速なCPU推論: DFL除去と最適化されたヘッドにより、エッジデバイスおよび低電力デバイスにおいて、前世代を劇的に凌駕します。
  • MuSGDオプティマイザ: LLMトレーニングの革新を活用することで、新しいMuSGDオプティマイザは非常に安定したトレーニングと驚くほど高速な収束を保証します。
  • Advanced Versatility: YOLO26は、Oriented Bounding Box (obb)姿勢推定、およびセグメンテーションをシームレスに処理し、ProgLossやSTALのような特殊なタスク損失を用いることで、比類のない小さなオブジェクト認識を実現します。

Ultralytics 内で他の選択肢を検討されている場合、汎用的な YOLO11 または革新的なYOLOを、オープンボキャブラリ検出タスク向けに検討されることをお勧めします。

結論

YOLOv5とYOLOv6-3.0は両方ともコンピュータビジョンの分野に大きな影響を与えました。YOLOv6-3.0はハイエンドサーバーハードウェアで優れたスループットを提供し、特殊なオフライン分析に適しています。しかし、YOLOv5は、堅牢で使いやすく、世界クラスのプラットフォームにサポートされた非常に多用途なモデルを必要とする開発者にとって、依然として優れた選択肢です。

次世代の精度、ネイティブなNMSフリーデプロイメント、そして業界最高の開発者体験という究極のバランスを実現するためには、Ultralytics Platformを介してYOLO26にアップグレードすることが、現代のビジョンAIソリューションにとって決定的な選択肢となります。


コメント