コンテンツにスキップ

YOLOv8 YOLOv5:包括的な技術比較

堅牢な機械学習パイプラインを構築する上で、適切なコンピュータビジョンアーキテクチャの選択は極めて重要なステップです。この詳細な技術比較では、ビジョンAIエコシステムで最も人気のある2つのモデル、YOLOv8YOLOv5の違いを探ります。どちらのモデルもUltralyticsによって開発され、リアルタイム物体検出の状況を大きく変え、速度、精度、使いやすさの業界標準を確立しました。

エッジデバイスへの展開であれ、クラウド推論のスケールアップであれ、これらのモデルのアーキテクチャの変化、パフォーマンス指標、およびトレーニング手法を理解することは、コンピュータビジョンプロジェクトにおける情報に基づいた意思決定に役立ちます。

Ultralytics YOLOv8: 多彩な標準

2023年初頭に発表YOLOv8 、先行モデルから大幅なアーキテクチャの転換をYOLOv8 。インスタンスセグメンテーション、画像分類、姿勢推定など複数のビジョンタスクをネイティブに処理可能な統合フレームワークとして、一から設計された。

アーキテクチャと手法

YOLOv8 はアンカーボックス不要の検出YOLOv8 。これにより、データセットの分布に基づいて手動でアンカーボックスを設定する必要がなくなり、学習プロセスが簡素化された。この改良により、カスタムデータセットへの汎化におけるモデルの頑健性が向上し、予測されるボックスの数が減少したため、非最大抑制(NMS)の処理速度が向上した。

このアーキテクチャは、YOLOv5に採用されているC3モジュールに代わるC2fモジュール(クロスステージ部分ボトルネック、2つの畳み込みを含む)を特徴としています。C2fモジュールは勾配の流れを改善し、計算コストを大幅に増加させることなく、より豊かな特徴表現を学習することを可能にします。さらに、YOLOv8 オブジェクト検出、分類、回帰タスクを分離するデカップリングヘッド構造 YOLOv8 、これにより収束速度と精度の向上が実証されています。

メモリ効率

Ultralytics YOLO (YOLOv8を含む)は、多くのTransCUDA ベースの代替モデル(例: RT-DETRといった多くのトランスフォーマーベースの代替モデルと比較して、トレーニング時のCUDAメモリ使用量が低減されるよう最適化されています。これにより、NVIDIA シリーズなどの標準的なコンシューマー向けGPUでより大きなバッチサイズを使用することが可能になります。

長所と短所

長所:

  • 単純なバウンディングボックス検出を超えた、複数のタスクにおける比類のない汎用性。
  • Python の合理化 ultralytics パッケージ化により、トレーニングとエクスポートが非常に直感的になります。
  • YOLOv5と比較して、全サイズバリエーションにおいて平均精度(mAP)が向上している。

弱点:

  • 分離されたヘッドとC2fモジュールにより、一部のバリエーションでは、YOLOv5 完全な実装と比較して、パラメータ数とFLOPsがわずかに増加する。

YOLOv8について詳しくはこちら

Ultralytics YOLOv5:俊敏な先駆者

2020年に導入YOLOv5 、YOLO PyTorch エコシステムに導入され、開発者のアクセス性を劇的に向上させました。これにより、高速で信頼性が高く、容易にデプロイ可能な物体検出モデルの業界標準として急速に普及しました。

アーキテクチャと手法

YOLOv5 アンカーベースのアーキテクチャYOLOv5 、改良版CSPDarknet53バックボーンを利用している。アンカーベースの手法では、トレーニング前に最適なアンカーを定義するためにデータセットの境界ボックスを慎重にクラスタリングする必要があるが、特定で明確に定義されたデータセットに対しては非常に効果的である。

YOLOv5はC3モジュールをYOLOv5 、低パラメータフットプリントを維持しながら効率的に特徴量を抽出する。その損失関数は、ネットワークを正確な予測へと導くため、Objectness損失と分類損失、境界ボックス回帰損失を組み合わせたものに大きく依存している。

長所と短所

長所:

  • 非常に軽量であるため、Nano (YOLOv5n) および Small (YOLOv5s) バリアントは、リソースが制約されたエッジAIデプロイメントに非常に適しています。
  • 非常に高速な推論速度を誇り、特にCPUでの性能が優れています。
  • 膨大なコミュニティチュートリアルとサードパーティ統合を備えた、深く確立されたエコシステム。

弱点:

  • アンカーボックスの設定が必要であり、多様性が高いデータセットやカスタムデータセットでは設定が複雑化する可能性があります。
  • YOLOv8 といった最新のアンカーフリーアーキテクチャと比較して、全体的な精度(mAP)が低い。

YOLOv5について詳しくはこちら

パフォーマンス比較

これらのモデルを評価する際には、速度と精度の間で良好なトレードオフを達成することが最も重要です。以下の表は、COCO で評価した両アーキテクチャの性能指標を示しています。CPU ONNXで測定し、GPU TensorRTを用いてテストしました。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv5 Nano版はパラメータ数と絶対的な処理速度においてわずかな優位性をYOLOv5 一方、YOLOv8 mAP 大幅な向上YOLOv8 、要求の厳しい実環境での展開シナリオにおいてより強力な性能バランスを提供します。

使いやすさとUltralyticsエコシステム

現代のUltralyticsモデルの決定的な特徴は、それらを取り巻く適切に維持されたエコシステムです。YOLOv5からYOLOv8への移行により、統一されたものが導入されました。 ultralytics pipパッケージは、非常に合理化されたユーザー体験を実現します。

開発者は、わずか数行のpythonコードでモデルトレーニング、検証、予測、エクスポートをシームレスに処理でき、ディープラーニングプロジェクトでこれまで必要とされてきた複雑なボイラープレートスクリプトを回避できます。

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the model to ONNX for production deployment
path = model.export(format="onnx")

さらに、Ultralytics などのツールとの統合により、データセット管理、クラウド上でのトレーニング、デプロイメントが簡素化され、活発な開発と強力なコミュニティサポートが保証されます。

理想的なユースケース

YOLOv5を選択するタイミング: レガシーシステムを維持している場合、Raspberry Piのような厳しく制約されたCPUで推論を実行している場合、またはモデルサイズのわずかなメガバイト単位の節約が重要となるプロジェクトに取り組んでいる場合、YOLOv5は信頼できる主力モデルであり続けます。

YOLOv8を選択するタイミング: 今日から始まるほぼすべての新規プロジェクトにおいて、YOLOv5よりもYOLOv8が強く推奨されます。その高度なアーキテクチャは、複雑なtrack、oriented bounding boxes (OBB)、およびsegmentを容易に処理します。自律ロボットから医療画像解析、スマートシティインフラまで、現代の幅広いアプリケーションに理想的です。

最新の先端技術をお探しですか?

YOLOv8 は非常に高性能YOLOv8 、開発者が性能の絶対的な限界を求めるなら、YOLO26を検討すべきです。 YOLO26を検討すべきです。2026年にリリースされたこのモデルは、いくつかの画期的な進歩をもたらしました:

  • エンドツーエンドのNMSフリー設計: NMS後処理を排除することで、より高速でシンプルなデプロイを実現します。これはYOLOv10で初めて開拓されたコンセプトです。
  • MuSGDオプティマイザ: SGDとMuonのハイブリッドであり、LLMトレーニングの革新をコンピュータービジョンにもたらし、より安定したトレーニングと高速な収束を可能にします。
  • 最大43%高速なCPU推論: 専用GPUを持たないエッジコンピューティング環境向けに高度に最適化されています。
  • DFLの削除: Distribution Focal Lossが削除されたことで、エクスポートが簡素化され、エッジデバイスとの互換性が強化されました。
  • ProgLoss + STAL: 小さな物体認識において顕著な改善を促進する高度な損失関数は、航空画像やIoTにとって不可欠です。

Ultralyticsが提供する包括的なドキュメンテーションとツールを活用することで、YOLOv8を容易に展開したり、最先端のYOLO26を探索したりして、これまでにない速度と精度で複雑な視覚的課題を解決できます。さらなる学習のために、ハイパーパラメータチューニングモデル展開の実践に関するガイドをご参照ください。


コメント