YOLOv5 vs. YOLOv6-3.0:リアルタイム物体検出モデルの包括的ガイド
コンピュータビジョンの領域は絶えず進化しており、新しいアーキテクチャが速度と精度の限界を押し広げています。次のビジョンAIプロジェクトに向けたモデルを選択する際、開発者はしばしば、確立された汎用性の高いフレームワークと、非常に専門化された産業用検出器の間で比較検討することになります。本稿では、Ultralytics YOLOv5とMeituanのYOLOv6-3.0の技術的な違いを深く掘り下げ、デプロイメントのニーズに最適なツールを選択するためのヒントを提供します。
モデルの紹介
Ultralytics YOLOv5:多用途のスタンダード
2020年にリリースされたUltralytics YOLOv5は、アクセスしやすく高性能な物体検出のゴールドスタンダードとして急速に定着しました。その圧倒的な使いやすさ、堅牢なトレーニングパイプライン、そして広範なデプロイメント統合機能で知られています。
- 作成者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020-06-26
- GitHub: ultralytics/yolov5
YOLOv5は、PyTorchエコシステム内でのシームレスな開発者体験を提供するためにゼロから設計されました。エッジデバイスからクラウドサーバーまで、多様な実世界のデプロイメントシナリオに適した高い推論速度を維持しつつ、優れた平均精度(mAP)を達成するという、良好なパフォーマンスバランスを実現しています。
YOLOv6-3.0:産業用スループット
MeituanのVision AI Departmentによって開発されたYOLOv6-3.0は、産業用途に特化して調整されており、専用ハードウェアアクセラレータ上でのスループットを最大限に優先しています。
- 著者: Chuyi Li, Lulu Li, Yifei Geng 他
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
YOLOv6は、NVIDIA T4のようなGPU上での処理速度を最大化することを目的としています。独自の量子化手法と専門化されたバックボーンを使用してパフォーマンスを達成しており、バッチ推論が多用されるバックエンドサーバー処理において有力な候補となります。
アーキテクチャの違い
これらのモデルの背後にあるアーキテクチャの選択を理解することは、理想的なユースケースを特定するために極めて重要です。
YOLOv5のアーキテクチャ
YOLOv5は、高度に最適化されたCSPDarknetバックボーンとPath Aggregation Network (PANet) ネックを組み合わせて使用します。この構造は、トレーニングおよび推論中のメモリ要件を最小限に抑えるよう緻密に調整されています。膨大なCUDAメモリと長いトレーニング時間を必要とする大規模なTransformerモデルとは異なり、YOLOv5は標準的なコンシューマー向けハードウェア上で効率的に動作します。
Ultralyticsのモデルは、トレーニング効率を重視して設計されています。多くの場合、ミドルレンジのGPU 1基でYOLOv5モデルをトレーニングできるため、研究者やスタートアップ企業にとって非常に利用しやすいものとなっています。
さらに、YOLOv5は単なる物体検出器ではありません。そのアーキテクチャは他のタスクにもシームレスに拡張でき、画像セグメンテーションや画像分類に対する堅牢な標準サポートを提供しています。
YOLOv6-3.0のアーキテクチャ
YOLOv6-3.0は、特にGPU実行に適したハードウェアフレンドリーなEfficientRepバックボーンを採用しています。ネック部分にはBi-directional Concatenation (BiC) モジュールを採用し、特徴抽出能力を強化しています。
トレーニング中、YOLOv6は収束を安定させるためにAnchor-Aided Training (AAT) 戦略を使用しますが、推論時にはアンカーフリーの検出器となります。このアーキテクチャはGPU加速タスクで優れた性能を発揮しますが、非常にポータブルなYOLOv5フレームワークと比較すると、多様なエッジデバイスへの適応がより複雑になる場合があります。
性能分析
これらのモデルを評価する際は、生の速度と精度のメトリクスが重要です。以下は、COCO datasetにおける様々なモデルサイズのパフォーマンスを比較した表です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv6-3.0はより大きなモデルで高いmAPスコアを達成しますが、YOLOv5は非常に軽量なフットプリントを維持しています。例えば、YOLOv5nは対応するYOLOv6のモデルよりもパラメータ数やFLOPsが大幅に少なく、モバイルやCPU負荷の高い環境へのデプロイに非常に適しています。
エコシステムと使いやすさ
多くのエンジニアリングチームにとって真の決め手となるのは、モデルを取り巻くエコシステムです。
YOLOv6は素晴らしい研究リポジトリですが、さまざまな形式にデプロイするためにはかなりの定型コードが必要です。対照的に、Ultralyticsは効率化されたユーザー体験を特徴とする、メンテナンスの行き届いたエコシステムを提供しています。統一されたPython APIと直感的なUltralytics Platformを通じて、開発者はデータセット管理、ワンクリックトレーニング、ONNXやTensorRTなどの形式への直接エクスポートをシームレスに利用できます。
コード例:統一されたUltralytics API
Ultralyticsの ultralytics pipパッケージを使用すると、わずか数行のコードでモデルの読み込み、トレーニング、デプロイが可能です。
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")ユースケースと推奨事項
YOLOv5とYOLOv6のどちらを選択するかは、プロジェクトの特定の要件、デプロイメントの制約、エコシステムの好みによって決まります。
YOLOv5を選択すべき場合
YOLOv5が適しているケース:
- 実績のある本番システム: YOLOv5の安定性、広範なドキュメント、および膨大なコミュニティサポートという長い実績が重視される既存のデプロイメント。
- リソース制約のあるトレーニング: YOLOv5の効率的なトレーニングパイプラインと低いメモリ要件が有利となる、GPUリソースが限られた環境。
- 広範なエクスポートフォーマットのサポート: ONNX、TensorRT、CoreML、およびTFLiteを含む多くのフォーマット全体でのデプロイメントが必要なプロジェクト。
YOLOv6を選択すべき場合
YOLOv6は以下の場合に推奨されます:
- 産業用ハードウェア対応のデプロイ: モデルのハードウェア対応設計と効率的な再パラメータ化が、特定のターゲットハードウェア上で最適化されたパフォーマンスを発揮するシナリオ。
- 高速なシングルステージ検出: 制御された環境下でのリアルタイム動画処理において、GPU上での純粋な推論速度を優先するアプリケーション。
- Meituanエコシステムとの統合: すでにMeituanの技術スタックおよびデプロイインフラストラクチャ内で作業しているチーム。
Ultralytics (YOLO26) を選択すべき場合
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最高の組み合わせを提供します:
- NMSフリーのエッジデプロイ: Non-Maximum Suppressionの後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: 専用のGPUアクセラレーションがないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となります。
- 小物体の検出: 航空ドローンの映像 やIoTセンサーの分析など、ProgLossとSTALが小物体の精度を大幅に高めることができる困難なシナリオ。
今後の展開:YOLO26の利点
YOLOv5は信頼できる主力モデルであり、YOLOv6-3.0は強力な産業用GPUスループットを提供しますが、最先端技術は進化しています。現在新しいプロジェクトを開始する開発者にとっての推奨パスは、Ultralytics YOLO26です。
2026年1月にリリースされたYOLO26は、大きな飛躍を遂げました。Ultralyticsエコシステムの比類のない汎用性を継承しつつ、画期的なアーキテクチャの改善を導入しています。
- エンドツーエンドのNMS不要設計: YOLO26はNon-Maximum Suppression(NMS)の後処理を排除し、レイテンシのばらつきを劇的に低減し、デプロイメントのロジックを簡素化しました。
- 最大43%のCPU推論高速化: DFLの削除と最適化されたヘッドにより、エッジデバイスや低電力デバイスにおいて以前の世代を劇的に上回る性能を発揮します。
- MuSGDオプティマイザ: LLMトレーニングの革新を活用した新しいMuSGDオプティマイザは、非常に安定したトレーニングと驚異的な速さの収束を保証します。
- 高度な汎用性: YOLO26は、Oriented Bounding Box (OBB)、Pose Estimation、およびセグメンテーションをシームレスに処理し、ProgLossやSTALのようなタスク特化型の損失関数を使用して、前例のない小物体認識を実現します。
Ultralyticsエコシステム内の他の選択肢として、汎用的なYOLO11や、オープンボキャブラリー検出タスクのための革新的なYOLO-Worldも検討してみてください。
結論
YOLOv5とYOLOv6-3.0はどちらもコンピュータビジョンの分野に大きな影響を与えてきました。YOLOv6-3.0はハイエンドサーバーハードウェアに対して優れたスループットを提供し、専門的なオフライン分析に適しています。しかし、堅牢で使いやすく、ワールドクラスのプラットフォームに支えられた非常に多用途なモデルを必要とする開発者にとって、YOLOv5は依然として優れた選択肢です。
次世代の精度、ネイティブなNMS不要デプロイメント、そして業界最高の開発者体験の究極のバランスを求める場合、Ultralytics Platformを通じてYOLO26にアップグレードすることが、最新のビジョンAIソリューションにとっての決定的な選択となります。