YOLOv8 YOLOv5:包括的な技術比較
適切なコンピュータビジョンアーキテクチャの選択は、堅牢な機械学習パイプライン構築における重要なステップです。この詳細な技術比較では、ビジョンAIエコシステムで最も人気のある2つのモデル間の差異を探ります: YOLOv8 と YOLOv5。両モデルUltralytics 開発されUltralytics リアルタイム物体検出の分野を大きく形作りUltralytics 速度、精度、使いやすさにおいて業界標準を確立しています。
エッジデバイスへの展開であれ、クラウド推論のスケールアップであれ、これらのモデルのアーキテクチャの変化、パフォーマンス指標、およびトレーニング手法を理解することは、コンピュータビジョンプロジェクトにおける情報に基づいた意思決定に役立ちます。
Ultralytics YOLOv8: 多彩な標準
2023年初頭に発表YOLOv8 、先行モデルから大幅なアーキテクチャの転換をYOLOv8 。インスタンスセグメンテーション、画像分類、姿勢推定など複数のビジョンタスクをネイティブに処理可能な統合フレームワークとして、一から設計された。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023-01-10
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLOv8 ドキュメント
アーキテクチャと方法論
YOLOv8 はアンカーボックス不要の検出YOLOv8 。これにより、データセットの分布に基づいて手動でアンカーボックスを設定する必要がなくなり、学習プロセスが簡素化された。この改良により、カスタムデータセットへの汎化におけるモデルの頑健性が向上し、予測されるボックスの数が減少したため、非最大抑制(NMS)の処理速度が向上した。
このアーキテクチャは、YOLOv5に採用されているC3モジュールに代わるC2fモジュール(クロスステージ部分ボトルネック、2つの畳み込みを含む)を特徴としています。C2fモジュールは勾配の流れを改善し、計算コストを大幅に増加させることなく、より豊かな特徴表現を学習することを可能にします。さらに、YOLOv8 オブジェクト検出、分類、回帰タスクを分離するデカップリングヘッド構造 YOLOv8 、これにより収束速度と精度の向上が実証されています。
メモリ効率
Ultralytics YOLO (YOLOv8を含む)は、多くのTransCUDA ベースの代替モデル(例: RT-DETRといった多くのトランスフォーマーベースの代替モデルと比較して、トレーニング時のCUDAメモリ使用量が低減されるよう最適化されています。これにより、NVIDIA シリーズなどの標準的なコンシューマー向けGPUでより大きなバッチサイズを使用することが可能になります。
長所と短所
長所:
- 単純なバウンディングボックス検出を超えた、複数のタスクにおける比類のない汎用性。
- Python の合理化
ultralyticsパッケージ化により、トレーニングとエクスポートが非常に直感的になります。 - YOLOv5と比較して、全サイズバリエーションにおいて平均精度(mAP)が向上している。
弱点:
- 分離されたヘッドとC2fモジュールにより、一部のバリエーションでは、YOLOv5 完全な実装と比較して、パラメータ数とFLOPsがわずかに増加する。
Ultralytics YOLOv5:俊敏な先駆者
2020年に導入YOLOv5 、YOLO PyTorch エコシステムに導入され、開発者のアクセス性を劇的に向上させました。これにより、高速で信頼性が高く、容易にデプロイ可能な物体検出モデルの業界標準として急速に普及しました。
- Author: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:ultralytics/yolov5
- ドキュメント:YOLOv5 ドキュメント
アーキテクチャと方法論
YOLOv5 アンカーベースのアーキテクチャYOLOv5 、改良版CSPDarknet53バックボーンを利用している。アンカーベースの手法では、トレーニング前に最適なアンカーを定義するためにデータセットの境界ボックスを慎重にクラスタリングする必要があるが、特定で明確に定義されたデータセットに対しては非常に効果的である。
YOLOv5はC3モジュールをYOLOv5 、低パラメータフットプリントを維持しながら効率的に特徴量を抽出する。その損失関数は、ネットワークを正確な予測へと導くため、Objectness損失と分類損失、境界ボックス回帰損失を組み合わせたものに大きく依存している。
長所と短所
長所:
- 非常に軽量であるため、Nano(YOLOv5n)およびSmall(YOLOv5s)のバリエーションは、リソース制約のあるエッジAI展開に極めて適している。
- 特にCPU上において、非常に高速な推論速度。
- 確立されたエコシステムで、膨大なコミュニティチュートリアルとサードパーティ統合を備えています。
弱点:
- アンカーボックスの設定が必要であり、多様性が高いデータセットやカスタムデータセットでは設定が複雑化する可能性があります。
- YOLOv8 といった最新のアンカーフリーアーキテクチャと比較して、全体的な精度(mAP)が低い。
パフォーマンス比較
これらのモデルを評価する際には、速度と精度の間で良好なトレードオフを達成することが最も重要です。以下の表は、COCO で評価した両アーキテクチャの性能指標を示しています。CPU ONNXで測定し、GPU TensorRTを用いてテストしました。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv5 Nano版はパラメータ数と絶対的な処理速度においてわずかな優位性をYOLOv5 一方、YOLOv8 mAP 大幅な向上YOLOv8 、要求の厳しい実環境での展開シナリオにおいてより強力な性能バランスを提供します。
Ultralytics やすさとUltralyticsエコシステム
現代Ultralytics 特徴づけるのは、それらを取り巻くよく整備されたエコシステムである。YOLOv5 YOLOv8 YOLOv5 移行YOLOv8 、統一された ultralytics pipパッケージは、非常に合理化されたユーザー体験を実現します。
開発者は、わずか数行のPython でモデルのトレーニング、検証、予測、エクスポートをシームレスに処理でき、深層学習プロジェクトで従来必要とされていた複雑な定型スクリプトを回避できます。
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the model to ONNX for production deployment
path = model.export(format="onnx")
さらに、Ultralytics などのツールとの統合により、データセット管理、クラウド上でのトレーニング、デプロイメントが簡素化され、活発な開発と強力なコミュニティサポートが保証されます。
理想的なユースケース
YOLOv5すべき場合: レガシーシステムの保守、ラズベリーパイのような厳しく制約されたCPUでの推論実行、あるいはモデルサイズを1メガバイト単位で節約することが極めて重要なプロジェクトに取り組んでいる場合、YOLOv5 信頼できる主力ツールYOLOv5 。
YOLOv8すべき場合: 今日から開始するほぼ全ての新規プロジェクトにおいて、YOLOv5 YOLOv8 強くYOLOv8 。その先進的なアーキテクチャは、複雑な追跡、方向性バウンディングボックス(OBB)、セグメンテーションを容易に処理します。自律ロボットから医療画像解析、スマートシティインフラに至る現代的なアプリケーションに最適です。
最新の先端技術をお探しですか?
YOLOv8 は非常に高性能YOLOv8 、開発者が性能の絶対的な限界を求めるなら、YOLO26を検討すべきです。 YOLO26を検討すべきです。2026年にリリースされたこのモデルは、いくつかの画期的な進歩をもたらしました:
- エンドツーエンドNMS: YOLOv10で初めて導入された概念であり、NMS 排除することで、より迅速かつ簡素な展開を実現します。
- MuSGDオプティマイザー: SGD オンのハイブリッド手法であり、大規模言語モデル(LLM)のトレーニング技術革新をコンピュータビジョンにもたらし、より安定したトレーニングと高速な収束を実現します。
- 最大43%高速CPU :専用GPUのないエッジコンピューティング環境向けに大幅に最適化されています。
- DFLの削除:配分焦点損失(Distribution Focal Loss)を削除し、エクスポートを簡素化するとともに、エッジデバイスの互換性を強化しました。
- ProgLoss + STAL:小物体認識において顕著な改善をもたらす高度な損失関数。これは航空画像やIoTにおいて極めて重要である。
Ultralytics提供する包括的なドキュメントとツールを活用することで、YOLOv8簡単にデプロイしたり、最先端のYOLO26を探索したりして、複雑な視覚的課題をかつてない速度と精度で解決できます。さらに学習を深めるには、ハイパーパラメータ調整や モデルデプロイの実践に関するガイドの参照をご検討ください。