YOLOv5 .YOLOv6.0:リアルタイム物体検出モデル完全ガイド
コンピュータビジョンの分野は絶えず進化を続けており、新たなアーキテクチャが速度と精度の限界を押し広げています。次なるビジョンAIプロジェクトのモデル選定にあたり、開発者は確立された汎用フレームワークと高度に専門化された産業用検出器を比較検討することが多いでしょう。本稿では、 Ultralytics YOLOv5 と美团(Meituan)YOLOv6の間の技術的差異を掘り下げ、導入ニーズに最適なツール選択を支援します。
モデルの紹介
Ultralytics YOLOv5: 汎用性の高い標準
2020年にリリースUltralytics YOLOv5 、YOLOv5 アクセスしやすく高性能な物体検出のゴールドスタンダードとなった。その驚くほど簡単な操作性、堅牢なトレーニングパイプライン、そして幅広いデプロイメント統合で広く知られている。
- Author: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:ultralytics/yolov5
YOLOv5 、PyTorchエコシステム内でシームレスな開発者体験を提供するために一からYOLOv5 。 PyTorch エコシステム内でシームレスな開発者体験を提供するために一から設計されました。優れたパフォーマンスバランスを実現し、高い推論速度を維持しながら優れた平均精度(mAP)を達成します。これにより、エッジデバイスからクラウドサーバーまで、多様な実世界の展開シナリオに適しています。
YOLOv6.0: 産業用スループット
美団のビジョンAI部門が開発したYOLOv6.YOLOv6、産業用途に特化して設計されており、専用ハードウェアアクセラレータ上での生スループットを最優先に考慮している。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、他。
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
YOLOv6 、NVIDIA などのGPU上で処理速度を最大化することをYOLOv6 。カスタム量子化手法と専用バックボーンを用いて性能を実現しており、バッチ推論が頻繁に利用されるバックエンドサーバー処理において有力な選択肢となります。
アーキテクチャの違い
これらのモデルの背後にあるアーキテクチャ上の選択を理解することは、その理想的なユースケースを特定するために極めて重要です。
YOLOv5
YOLOv5 、高度に最適化されたCSPDarknetバックボーンとパスアグリゲーションネットワーク(PANet)ネックを組み合わせたYOLOv5 。この構造は、トレーニング時および推論時のメモリ要件を最小限に抑えるよう徹底的に微調整されています。膨大なCUDA 長時間のCUDA 必要とする大規模なトランスフォーマーモデルとは異なり、YOLOv5 標準的なコンシューマー向けハードウェア上で効率的にYOLOv5 。
メモリ効率
Ultralytics 、トレーニング効率を特に重視して設計されています。多くの場合、YOLOv5 単一GPUでトレーニング可能であり、研究者やスタートアップ企業にとって非常に利用しやすい特徴を備えています。
さらに、YOLOv5 単なる物体検出器YOLOv5 。そのアーキテクチャは他のタスクへシームレスに拡張され、画像セグメンテーションや 画像分類に対して堅牢な即戦力サポートを提供します。
YOLOv6.0アーキテクチャ
YOLOv6、GPU ハードウェアに優しい設計のEfficientRepバックボーンを備える。首部には双方向連結(BiC)モジュールを採用し、特徴融合を強化している。
トレーニング中、YOLOv6 収束を安定化させるためアンカー補助トレーニング(AAT)戦略YOLOv6 、推論時にはアンカーフリー検出器として動作する。このアーキテクチャはGPUに優れる一方、高い移植性をYOLOv5 と比較すると、多様なエッジデバイスへの適応が複雑になる場合がある。
パフォーマンス分析
これらのモデルを評価する際には、純粋な速度と精度の指標が極めて重要です。以下は、COCO 様々なモデルサイズの性能を比較した表です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv6.YOLOv6より大規模なバリエーションでmAP を達成する一方、YOLOv5 驚異的な軽量性をYOLOv5 。例えばYOLOv5nは、YOLOv6 パラメータ数とFLOPsを大幅に削減しており、モバイル環境やCPU展開において極めて最適である。
エコシステムと使いやすさ
多くのエンジニアリングチームにとって真の決定的要因は、モデルを取り巻くエコシステムである。
YOLOv6 優れた研究リYOLOv6 、様々なフォーマットに展開するには大量の定型コードが必要です。一方、Ultralytics 洗練されたユーザー体験を特徴とする、よく整備されたエコシステムUltralytics 。統一Python 直感的なUltralytics を通じて、開発者はシームレスなデータセット管理、ワンクリックトレーニング、ONNXなどのフォーマットへの直接エクスポート機能を利用できます。 ONNX や TensorRTなどのフォーマットへの直接エクスポートを実現します。
コード例: 統合UltralyticsUltralytics
Ultralyticsクス ultralytics pipパッケージを使えば、わずか数行のコードでモデルの読み込み、トレーニング、デプロイが可能です。
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")
ユースケースと推奨事項
YOLOv6 YOLOv5 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの好みにYOLOv6 。
YOLOv5を選択すべき時
YOLOv5 以下に最適YOLOv5 :
- 実績ある生産システム: YOLOv5 track 、豊富なドキュメント、大規模なコミュニティサポートが評価される既存の展開環境。
- リソース制約下でのトレーニング: GPU 限られた環境において、YOLOv5効率的なトレーニングパイプラインと低いメモリ要件が有利に働く。
- 幅広いエクスポート形式のサポート:複数の形式での展開を必要とするプロジェクトに対応 ONNX、 TensorRT、 CoreML、および TFLite。
YOLOv6を選択すべき時
YOLOv6 以下に推奨YOLOv6 :
- 産業用ハードウェア対応デプロイメント:モデルのハードウェア対応設計と効率的な再パラメータ化により、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
- 高速シングルステージ検出:制御された環境におけるリアルタイム動画処理GPU 上での生の推論速度を優先するアプリケーション。
- 美団エコシステム統合: 美団のテクノロジースタックおよびデプロイメントインフラストラクチャ内で既に稼働しているチーム。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
前進:YOLO26の優位性
YOLOv5 信頼性の高い主力モデルYOLOv5 、YOLOv6.YOLOv6 GPU 高いGPU を発揮しますが、最先端技術は進化を続けています。新規プロジェクトを開始する開発者には、Ultralytics 推奨される選択肢です。
2026年1月にリリースされたYOLO26は、飛躍的な進化を遂げた製品です。Ultralytics 承しつつ、画期的なアーキテクチャ改良を導入しています:
- エンドツーエンドNMS設計:YOLO26は非最大抑制(NMS)後処理を排除し、レイテンシ変動を劇的に低減するとともに、展開ロジックを簡素化します。
- 最大43%高速CPU :DFL除去と最適化されたヘッドにより、エッジおよび低消費電力デバイスにおいて前世代を大幅に上回る性能を発揮します。
- MuSGDオプティマイザー:LLMトレーニングの革新技術を活用し、新開発のMuSGDオプティマイザーは極めて安定したトレーニングと驚異的な収束速度を実現します。
- 高度な汎用性:YOLO26は、方向付き境界ボックス(OBB)、姿勢推定、セグメンテーションをシームレスに処理し、ProgLossやSTALといった専用タスク損失関数により、比類のない小物体認識を実現します。
Ultralytics 内で他の選択肢を検討されている場合、汎用的な YOLO11 または革新的なYOLOを、オープンボキャブラリ検出タスク向けに検討されることをお勧めします。
結論
YOLOv5 YOLOv6.YOLOv6 YOLOv5 コンピュータビジョン分野に多大な影響を与えた。YOLOv6.YOLOv6ハイエンドサーバーハードウェア向けに優れたスループットを提供し、専門的なオフライン解析に適している。しかし、 YOLOv5 は、堅牢で使いやすく、高度に汎用的なモデルを世界クラスのプラットフォームでサポートする必要がある開発者にとって、依然として優れた選択肢です。
次世代の精度、ネイティブなNMS展開、業界最高の開発者体験を究極的にバランスさせるため、Ultralytics 経由でのYOLO26へのアップグレードは、現代のビジョンAIソリューションにおける決定的な選択肢です。