YOLOv5 YOLOv6.0:包括的な技術比較
コンピュータビジョンの急速に進化する分野において、YOLO You Only Look Once)シリーズほど大きな影響を与えたモデル群はほとんど存在しない。本比較では、二つの重要な進化形を深く掘り下げる: Ultralytics YOLOv5。前者はその使いやすさで物体検出を民主化した伝説的モデルであり、YOLOv6Meituan)YOLOv6産業用途に焦点を当ててYOLOv6強力な進化形です。両モデルのアーキテクチャ上の差異、性能指標、最適なユースケースを検証し、プロジェクトに適したツール選択を支援します。
概要
両モデルはリアルタイム物体検出における重要なマイルストーンである。 YOLOv5 は、比類のない使いやすさ、堅牢性、そして機械学習ライフサイクル全体をサポートする広範なエコシステムで知られています。YOLOv6.YOLOv6 GPU スループット最適化に重点を置いており、専用ハードウェア上でミリ秒単位の遅延が主要制約となる産業用展開において有力な選択肢となります。
しかし、2026年に新規プロジェクトを開始する開発者にとって、状況はさらに変化している。Ultralytics リリースにより、ネイティブなエンドツーエンドNMSと最大43%高速化CPU 導入され、両方の前世代モデルに対して魅力的なアップグレードを提供している。
Ultralytics YOLOv5
グレン・ジョチャーと UltralyticsによってYOLOv5 、開発者がAIと対話する方法をYOLOv5 変えました。単なるモデルではなく、アクセシビリティを追求した完全なフレームワークでした。
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:ultralytics/yolov5
YOLOv5 使いやすさと 汎用性をYOLOv5 。物体検出だけでなく、インスタンスセグメンテーションや画像分類など幅広いタスクをサポートします。そのアーキテクチャは高速性と精度を両立させつつ、メモリ要件を低く抑えているため、Raspberry NVIDIA などのデバイスへのエッジデプロイメントに非常に適しています。
美団YOLOv6.0 概要
美団(Meituan)が開発したYOLOv6、産業用途に特化したシングルステージ物体検出器として位置付けられている。バージョン3.0「全面的な再構築」では、標準ベンチマークにおける性能向上のため、大幅なアーキテクチャ変更が導入された。
- 著者: Chuyi Li、Lulu Li、Yifei Geng、他。
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv:YOLOv6 v3.0: 全面的なリローディング
- GitHub:meituan/YOLOv6
YOLOv6.YOLOv6、GPU には効率的だが、構造の再パラメータ化が必要なため訓練がより複雑になり得るRepVGGスタイルのバックボーンを採用している。
性能指標の比較
以下の表は、COCO における主要な性能指標をまとめたものです。YOLOv6.YOLOv6 GPU 高い数値を示しますが、YOLOv5 多くの構成において優れたCPU と低いパラメータ数をYOLOv5 。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
パフォーマンスコンテキスト
ベンチマーク指標は重要だが、実際のパフォーマンスはデプロイ環境に大きく依存する。Ultralytics 、ピークGPU だけでなく、多様なハードウェア環境における汎用性と 信頼性で高く評価されている。
アーキテクチャの詳細
YOLOv5アーキテクチャ
YOLOv5 CSPDarknetバックボーンYOLOv5 、特徴抽出において非常に効率的です。その設計には以下が含まれます:
- フォーカスレイヤー(後にConvに統合):空間次元を減らしつつチャネル深さを増加させ、速度を最適化する。
- CSP(クロスステージ部分)ボトルネック:勾配情報の冗長性を最小化し、精度を向上させながらパラメータ数とFLOPsを削減する。
- PANet Neck:特徴伝播を強化し、より優れた局所化を実現します。
- アンカーベースヘッド:事前定義されたアンカーボックスを用いて物体の位置を予測する。
YOLOv6.0 アーキテクチャ
YOLOv6.0GPU に特化した異なる哲学を採用している:
- RepVGGバックボーン:構造的再パラメータ化を利用し、収束性を高めるためのマルチブランチ学習を、速度向上のための単一パス推論モデルに統合可能とする。
- EfficientRep Bi-Fusion Neck:レイテンシー低減のための簡素化されたネック設計。
- アンカーフリーヘッド:アンカーボックスを排除し、バウンディングボックス座標を直接予測する。これにより設計が簡素化されるが、損失関数の慎重な調整が必要となる場合がある。
Ultralyticsの利点
生データは重要ですが、モデルの価値は、本番ワークフローへの統合の容易さで決まることがよくあります。Ultralytics が真価を発揮するのは、まさにこの点です。
1. 使いやすさとエコシステム
Ultralytics シームレスな「ゼロからヒーローへ」の体験Ultralytics 。 ultralytics Python 、わずか数行のコードでモデルのトレーニング、検証、デプロイが可能です。 Ultralytics Platform データセット管理を容易にします。 自動アノテーションおよびクラウドトレーニング。
from ultralytics import YOLO
# Load a model (YOLOv5 or the recommended YOLO26)
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
path = model.export(format="onnx")
対照的に、研究目的のモデルを展開するには、複雑な設定ファイルの操作や手動での依存関係管理が必要となる場合が多い。
2. タスク全体にわたる多様性
YOLOv5 (例: YOLO11 やYOLO26など)は物体検出に限定されません。これらはネイティブで以下をサポートします:
- インスタンスセグメンテーション:ピクセルレベルの理解のために。
- 姿勢推定:人体上のキーポイント追跡のため。
- 分類:画像全体のカテゴリ分類用。
- OBB:航空写真において極めて重要な、方向性バウンディングボックス検出。
YOLOv6 主に物体検出モデルYOLOv6 、他のタスクへの対応は限定的です。
3. 訓練効率と記憶
Ultralytics トレーニング効率を最適化しています。トランスフォーマーを多用するアーキテクチャや複雑な再パラメータ化モデルと比較して、CUDA 一般的に少なくて済みます。これにより開発者はコンシューマー向けGPUでより大きなバッチサイズを利用可能となり、高性能AIトレーニングへのアクセスが民主化されます。
ユースケースの推奨事項
YOLOv5に最適
- エッジコンピューティング:ラズベリーパイ、スマートフォン(Android)、その他の低消費電力デバイスを用いたプロジェクトでは、YOLOv5低メモリ消費量とTFLiteへの効率的なエクスポートが有益です。 TFLite および CoreMLへの効率的なエクスポートから恩恵を受けます。
- ラピッドプロトタイピング:シンプルなAPIと充実したドキュメントにより、コンセプトを検証する最速の方法です。
- マルチタスクアプリケーション:検出、セグメンテーション、分類を必要とするパイプラインの場合、単一Ultralytics 内で処理することで保守が簡素化されます。
YOLOv6-3.0 に最適
- 専用GPU : FPSの最大化が唯一の指標となる、T4またはV100 GPU上で稼働する産業用検査ライン。
- ハイスループット動画解析:特定のTensorRT を活用する、大量の同時動画ストリームを処理するシナリオ。
未来:なぜYOLO26に移るのか?
最高のパフォーマンスを求める開発者には、Ultralytics はYOLO26を Ultralytics 。2026年1月にリリースされたこのモデルは、前世代の両方の制限に対処しています。
- エンドツーエンドNMS:非最大抑制(NMS)を排除することで、YOLOv2は展開ロジックを簡素化し、レイテンシのばらつきを低減します。この機能は YOLOv10で初めて導入された機能です。
- MuSGDオプティマイザ:大規模言語モデル(LLM)のトレーニング(Moonshot AIのKimi K2など)に着想を得たこのオプティマイザは、安定した収束と頑健なトレーニングダイナミクスを保証します。
- 効率性向上:分布焦点損失(DFL)の除去により、YOLO26はCPU において最大43%高速化され、現代のエッジAIにおける究極の選択肢となりました。
結論
YOLOv5 YOLOv6 YOLOv5 YOLOv6 YOLOv5 コンピュータビジョンの殿堂入りを果たしている。YOLOv6.YOLOv6専門的な産業タスクにおけるGPU 限界を押し広げた。しかし、 YOLOv5 は、使いやすさ、汎用性、コミュニティサポートの面で依然としてベンチマークであり続けている。
現代の開発者にとって、選択肢は次世代へと急速に移行しつつある。Ultralytics 、YOLOv5 ユーザーフレンドリーなエコシステムYOLOv5 両方の前世代モデルを上回る性能を実現するアーキテクチャの革新YOLOv5 融合。今日のコンピュータビジョンにおいて、最もバランスが取れ、強力で将来性のあるソリューションを提供する。