YOLOv6.0 対YOLOv5:包括的な技術比較
リアルタイム物体検出技術の進化に伴い、様々な導入シナリオ向けに最適化された複数のアーキテクチャが登場している。本稿では、業界向けのYOLOv6.YOLOv6と、基礎的かつ汎用性の高いUltralyticsという2つの主要モデルを比較検討する。 Ultralytics YOLOv5を比較検討します。各モデルのアーキテクチャ選択、性能指標、エコシステムサポートを理解することで、実世界のアプリケーションに最適なコンピュータビジョンフレームワークを選択する手助けとなるでしょう。
YOLOv6.0: 産業用スループットとハードウェア最適化
MeituanのVision AI部門によって開発されたYOLOv6-3.0は、高スループットの産業環境向けに大幅に調整されています。専用のNVIDIA GPUのようなハードウェアアクセラレータでのフレームレート最大化に重点を置いています。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、Xiangxiang Chu
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
- ドキュメント:YOLOv6 ドキュメント
アーキテクチャの強み
YOLOv6速度向上のために設計された複数の構造的最適化を導入しています。本モデルはEfficientRepバックボーンを採用しており、GPU 優しい特性を備えるよう特別に設計されています。これにより、オフラインバッチ処理タスクにおいて特に強力なアーキテクチャを実現しています。
トレーニングフェーズでは、モデルはAnchor-Aided Training (AAT)戦略を組み込んでいます。このアプローチは、アンカーベーストレーニングの安定性とアンカーフリー推論の速度を両立させようと試みます。さらに、そのネックアーキテクチャは、異なるスケール間での特徴融合を改善するためにBi-directional Concatenation (BiC)モジュールを使用しています。TensorRTを使用するハイエンドサーバーGPU向けに高度に最適化されていますが、この特殊化により、CPUのみのデバイスや低電力エッジデバイスではレイテンシが増加する場合があります。
Ultralytics YOLOv5:誰もが使えるビジョンAIの先駆者
UltralyticsよりリリースされたYOLOv5 、使いやすさ、トレーニング効率、堅牢なデプロイメントにおいて新たな基準をYOLOv5 。現代的な深層学習ワークフローと深く統合することで、高性能な物体検出を民主化しました。
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:ultralytics/yolov5
- プラットフォーム:Ultralytics Platform
エコシステムと多様性
YOLOv5 の最大の特徴は、その使いやすさ YOLOv5 。 PyTorch フレームワーク上にネイティブ構築されており、リポジトリは機械学習ライフサイクルを大幅に簡素化する統一されたPython を提供します。データセットの設定から最終的なデプロイまで、統合されたエコシステムにより、開発者は環境のデバッグに費やす時間を削減し、アプリケーション構築により多くの時間を割くことが可能になります。
YOLOv5 物体検出にYOLOv5 。卓越した汎用性を誇り、画像分類と インスタンスセグメンテーションをネイティブにサポートします。さらに、スマートキャッシュ、自動データローダー、分散GPU 組み込みサポートを備え、比類のないトレーニング効率を実現します。
Ultralytics メモリ効率
モデルアーキテクチャを比較する際、メモリ消費量は重要な要素である。Ultralytics YOLO 、大規模なトランスフォーマーモデルと比較して、トレーニング時と推論時の両方でVRAM要件を大幅に低く抑えており、Google コンシューマー向けハードウェアやクラウドノートブックを利用する開発者にとって非常に利用しやすい。
性能とアーキテクチャの比較
以下の表は、標準的なCOCO で評価した両アーキテクチャの性能指標を示しています。モデルが、平均精度と推論速度のトレードオフを様々な環境でどのようにバランスさせているかに注目してください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
分析
YOLOv6印象的なmAP を達成し、T4 GPU上のTensorRT 向けに高度に最適化されています。しかし、YOLOv5 驚くほど整備されたエコシステムでYOLOv5 、複数のフォーマットへの即時エクスポートをサポートしています。これには ONNX、CoreML、TFLite、非常に良く維持されたエコシステムで対抗しています。このパフォーマンスバランスにより、YOLOv5 専用サーバーだけでなく、モバイルデバイスやラズベリーパイのようなエッジコンピューティング環境でも確実にYOLOv5 。
コード例: Ultralyticsによるシームレスなトレーニング
Ultralytics 最大の利点の一つは、合理化されたユーザー体験です。モデルのトレーニング、評価、エクスポートには、Python済みます。
from ultralytics import YOLO
# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format for flexible deployment
model.export(format="onnx")
理想的な使用例と導入シナリオ
これらのアーキテクチャの選択は、多くの場合、特定のインフラストラクチャ制約に依存します。
- YOLOv6-3.0を展開するタイミング: 専用のNVIDIA GPUが利用可能で、レイテンシを最小限に抑える必要がある自動製造ラインや高スループットサーバー分析に理想的です。そのアーキテクチャは、TensorRT最適化を最大限に活用できる環境で真価を発揮します。
- YOLOv5を展開するタイミング: 迅速なプロトタイピング、クロスプラットフォーム展開、および統一されたパイプラインを求めるチームにとって完璧な選択肢です。その多様なエクスポート機能は、エッジデバイスでの小売分析、農業ドローン監視、およびフィットネスアプリケーションにおける姿勢推定に理想的です。
物体検出の未来:YOLO26の登場
YOLOv6 重要なYOLOv6 、コンピュータビジョン分野は急速に進歩しています。新規プロジェクトを開始する開発者や最先端技術を求める方々に、 Ultralytics (2026年1月リリース)へのアップグレードを強く推奨します。
YOLO26は画期的なエンドツーエンドNMS設計を導入し、エッジファースト視覚AIを再定義します。非最大抑制後処理の必要性を排除することで、展開ロジックを簡素化し、遅延変動を大幅に低減します。
YOLO26の主な革新点には以下が含まれます:
- MuSGDオプティマイザ: SGDとMuonのハイブリッドであり、高度なLLMトレーニングの安定性をコンピュータービジョンにもたらし、より速く、より信頼性の高い収束を実現します。
- CPU推論が最大43%高速化: 専用アクセラレータを持たない環境向けに大幅に最適化されています。
- DFLの削除: Distribution Focal Lossの削除によりエクスポートプロセスが簡素化され、低消費電力エッジデバイスとの互換性が向上します。
- ProgLoss + STAL: 小さな物体認識を大幅に向上させる高度な損失関数は、航空画像やスマートシティのIoTセンサーにとって極めて重要です。
汎用タスクの場合、YOLO11もまた、Ultralyticsファミリー内で優れた、完全にサポートされた選択肢であり続けています。
結論
YOLOv6-3.0とYOLOv5は両方ともリアルタイム検出の進歩において極めて重要な役割を果たしてきました。YOLOv6-3.0はGPUアクセラレーションスループットのための高度に専門化されたアーキテクチャを提供し、一方YOLOv5は、その広範なドキュメント、使いやすさ、およびマルチタスク機能を通じて、比類のない開発者エクスペリエンスを提供します。
現代のアプリケーションにとって、統合されたUltralyticsエコシステムを活用することで、将来性のあるワークフローが保証されます。YOLO26のような最新のアーキテクチャを採用することで、デプロイメントパイプラインが、速度、精度、アルゴリズムのシンプルさにおける最新のブレークスルーから恩恵を受けることを確実にします。