コンテンツにスキップ

YOLOv6.0 対YOLOv5:リアルタイム物体検出器の技術的比較

リアルタイム物体検出の技術は急速に進化し、複数のアーキテクチャが速度と精度の頂点を争っている。この道のりにおける二つの重要なマイルストーンYOLOv6.YOLOv6とYOLOv5である。両者は「YOLO」(You Only Look Once)の系譜を共有するものの、設計思想、最適化対象、想定用途において大きく異なる。

本ガイドでは、これら2つのモデルについて詳細な技術分析を行い、開発者やエンジニアがコンピュータビジョンアプリケーションに適したツールを選択する手助けをします。アーキテクチャ上の差異、ベンチマーク性能、Ultralytics などの最新ソリューションとの比較を検証します。

パフォーマンス指標の概要

以下の表は、物体検出の標準的なベンチマークであるCOCO における両モデルの性能を比較したものです。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv6.0:産業用ヘビー級

YOLOv6.YOLOv6(通称「YOLOv6 .0: A Full-Scale Reloading」)は、美団(Meituan)の研究者によって開発された。2023年1月にリリースされ、専用ハードウェア(NVIDIA )が利用可能な産業用途向けに明示的に設計されている。

アーキテクチャと設計

YOLOv6 はRepVGGに着想を得た大幅に変更を加えたバックボーンYOLOv6 。このアーキテクチャは構造的再パラメータ化を利用し、学習時には複雑なマルチブランチトポロジーを持つ一方で、推論時には単純で高速な3x3畳み込みのスタックへと収縮することを可能にしている。

主要な機能は以下の通りです。

  • アンカーフリー設計:アンカーボックスのハイパーパラメータ調整の複雑さを排除し、トレーニングパイプラインを簡素化します。
  • SimOTAラベル割り当て:予測値と真値オブジェクトを動的に一致させる高度なラベル割り当て戦略であり、収束を改善する。
  • 量子化対応:本モデルは量子化対応トレーニング(QAT)を考慮して構築されており、TensorRTデプロイ時にINT8へ変換する際の精度低下を最小限に抑えます。

長所と短所

YOLOv6の主な強みはGPU上での生スループットである。ハードウェアに優しい演算への最適化により、Tesla T4などのデバイスで驚異的なFPSを達成する。しかしこの特化には代償が伴う。再パラメータ化されたアーキテクチャは、メモリ帯域幅がボトルネックとなるCPUやモバイルデバイスでは効率が低下する可能性がある。さらに、Ultralytics提供する統一された体験と比較すると、そのエコシステムはより分断されている。

YOLOv6について詳しくはこちら

YOLOv5:汎用性の高い標準

YOLOv5Ultralytics 開発されたYOLOv5は、物体検出のアクセシビリティに革命をもたらしました。2020年6月のリリース以来、その「ゼロからヒーローへ」というシンプルさで知られる、世界で最も広く使用されているビジョンAIモデルの一つとなっています。

アーキテクチャと設計

YOLOv5 CSPDarknetYOLOv5 、特徴抽出能力と計算効率のバランスを実現している。初期バージョンにおけるFocus層やSiLU活性化関数の広範な採用など、現在標準となっている数々の革新を導入した。

主要な機能は以下の通りです。

  • ユーザー中心のエコシステム: YOLOv5 単なるモデルYOLOv5 、完全なフレームワークです。データ拡張ハイパーパラメータ進化、デプロイメントのためのシームレスな統合が含まれています。
  • 幅広いハードウェアサポート:ハイエンドGPU専用に最適化されたモデルとは異なり、YOLOv5 CPU、ラズベリーパイなどのエッジデバイス、モバイルチップセットにおいて TFLiteを通じて、CPU、ラズベリーパイなどのエッジデバイス、モバイルチップセットなど幅広いハードウェアで安定した動作
  • マルチタスク機能:単純な検出を超え、YOLOv5 インスタンスセグメンテーションと分類YOLOv5 、複雑なプロジェクトにおける柔軟な選択肢となります。

長所と短所

YOLOv5 汎用性と使いやすさにYOLOv5 。トレーニング時のメモリ要件は多くの競合モデルより著しく低く、一般消費者向けGPUでのトレーニングを可能にします。特定のハードウェア上では純粋なベンチマーク指標において新モデルがわずかに上回る場合もありますが、YOLOv5 汎用アプリケーション向けの堅牢で実戦経験豊富なソリューションYOLOv5 。

YOLOv5について詳しくはこちら

理想的な使用例

YOLOv6-3.0を選択するタイミング

YOLOv6.YOLOv6、以下の条件を満たす厳密な産業環境において有力な選択肢です:

  • GPU :デプロイ環境ではNVIDIANVIDIA (T4、V100、Jetson Orinなど)と TensorRTを採用しています。
  • スループットが重要である:高速製造ライン検査のようなシナリオでは、特定のハードウェアにおけるミリ秒単位の遅延が成功の唯一の指標となる。

YOLOv5を選択すべき時

YOLOv5 、より幅広い用途においてYOLOv5 優れた選択肢です:

  • エッジとCPU :ラズベリーパイ、スマートフォン、またはCPUクラウドインスタンスといったデバイスにおいて、YOLOv5アーキテクチャはより優れた互換性と速度を提供します。
  • ラピッドプロトタイピング:トレーニングの容易さと豊富なドキュメントにより、開発者はデータセットからデプロイ済みモデルまでを数時間で実現できます。
  • リソース制約下でのトレーニング:限られたハードウェア(例:8GBGPU )でトレーニングする場合、YOLOv5他に類を見ない。

Ultralytics :モデルを超えて

建築は重要ではあるが、モデルの周囲のエコシステムがプロジェクトの成功を左右することが多い。Ultralytics (YOLOv5 その後継モデルを含む)Ultralytics 、以下の明確な利点を提供する:

  1. 使いやすさ: Ultralytics Python は、トレーニング、検証、推論を統合します。YOLOv5、 YOLO11、またはYOLO26の切り替えには、コード内の単一の文字列を変更するだけで済みます。
  2. 健全なエコシステム:活発な開発、頻繁なアップデート、そして活発なコミュニティにより、バグは迅速に修正され、新機能(ワールドモデルなど)はシームレスに統合されます。
  3. トレーニング効率: Ultralytics トレーニング効率を Ultralytics 、カスタムデータに対して迅速に収束する最適化された事前学習済み重みを提供します。
  4. プラットフォーム統合: Ultralytics は、インフラ管理を必要とせずに、データセットの管理、クラウド上でのモデルトレーニング、様々なエンドポイントへのデプロイを実現するノーコードソリューションを提供します。

シームレスな統合

Ultralytics ワンクリックでのエクスポートをサポートしています ONNXCoreMLOpenVINO、および TensorRTにより、デプロイに必要なエンジニアリング作業を大幅に削減します。

推奨:未来はYOLO26だ

2026年に新規プロジェクトを開始する開発者には、従来のモデルを超えたUltralytics の利用を強く推奨します。

YOLO26は効率性と精度の頂点を体現する。画期的な設計により、YOLOv5 速度と精度のトレードオフ)YOLOv6 ハードウェアの硬直性)の双方の限界を克服している。

  • ネイティブにエンドツーエンド:YOLO26は、デプロイを複雑化し遅延を生む後処理ステップである非最大抑制(NMS)を不要にします。これによりパイプラインはよりシンプルかつ高速になります。
  • CPU :分布焦点損失(DFL)の削除と特定のアーキテクチャ調整により、YOLO26はCPU上で最大43%高速な推論を実現し、エッジコンピューティングに最適です。
  • MuSGDオプティマイザー:大規模言語モデル(LLM)のトレーニングにおける革新に着想を得た新開発のMuSGDオプティマイザーは、小規模なデータセットにおいても安定したトレーニングの動的特性とより速い収束を保証します。
  • 小型物体検出の強化:ProgLossおよびSTAL関数の導入により、航空画像やリモートセンシングタスクにおいて重要な要件である小型物体に対する性能が大幅に向上した。

YOLO26についてさらに詳しく

コード例

Ultralytics 、モデル世代を超えて一貫性を保つように設計されています。YOLOv5 を使用する場合YOLOv5 推奨されるYOLO26YOLOv5 、推論の読み込みと実行がいかに簡単かをご覧ください。

from ultralytics import YOLO

# Load the recommended YOLO26 model (or YOLOv5)
# Switch to 'yolov5s.pt' to use YOLOv5
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# The predict method returns a list of Result objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    result.show()  # Display result to screen
    result.save(filename="result.jpg")  # Save result to disk

他の最先端機能に関心のあるユーザーは、オープンボキャブラリ検出YOLORT-DETR でトランスフォーマーベースの高精度検出をご検討ください。

結論

YOLOv6.0YOLOv5 はコンピュータビジョン分野の発展において重要な役割を果たしてきました。YOLOv6 GPU 限界をYOLOv6 、YOLOv5 強力なAIツールへのアクセスをYOLOv5 。しかし、この分野は急速に進化しています。YOLO26により、Ultralytics 両者の長所をUltralytics :ハードウェアを意識した設計の高速性、エンドツーエンドパイプラインの簡便性、そして包括的なエコシステムの汎用性です。工場現場での展開であれモバイルアプリであれ、スケーラブルで保守性の高いAIソリューション構築において、Ultralytics は依然として優れた選択肢です。


コメント