Link to this sectionYOLOv8 と YOLOv5 の比較#
適切なコンピュータビジョンアーキテクチャを選択することは、堅牢な機械学習パイプラインを構築する上で極めて重要なステップです。この詳細な技術比較では、ビジョンAIエコシステムで最も人気のある2つのモデル、YOLOv8 と YOLOv5 の違いを解説します。両モデルとも Ultralytics によって開発され、リアルタイム物体検出の状況を大きく形作り、スピード、精度、そして使いやすさの業界標準を確立してきました。
エッジデバイスへのデプロイであれ、クラウド推論のスケールであれ、これらのモデルのアーキテクチャの変遷、パフォーマンス指標、学習手法を理解することは、コンピュータビジョンプロジェクトにおいて情報に基づいた意思決定を行う助けとなります。
Link to this sectionUltralytics YOLOv8:汎用的な標準#
2023年初頭にリリースされた YOLOv8 は、その前身から主要なアーキテクチャの転換を表すものでした。このモデルは、インスタンスセグメンテーション、画像分類、姿勢推定など、複数のビジョンタスクをネイティブに処理できる統合フレームワークとして一から設計されました。
- 著者: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 組織: Ultralytics
- 日付: 2023-01-10
- GitHub: ultralytics/ultralytics
- ドキュメント: YOLOv8ドキュメント
Link to this sectionアーキテクチャと手法#
YOLOv8 introduced an anchor-free detection head, which simplifies the training process by eliminating the need to manually configure anchor boxes based on dataset distribution. This makes the model more robust when generalizing to custom datasets and reduces the number of box predictions, speeding up Non-Maximum Suppression (NMS).
アーキテクチャには、YOLOv5 に見られた C3 モジュールに代わる C2f モジュール (2つの畳み込みを用いた Cross-Stage Partial ボトルネック) が搭載されています。C2f モジュールは勾配フローを改善し、計算コストを大幅に増やすことなく、より豊かな特徴表現を学習することを可能にします。さらに、YOLOv8 は デカップルドヘッド 構造を利用して物体検出、分類、回帰タスクを分離しており、これにより収束速度と精度が向上することが示されています。
YOLOv8 を含む Ultralytics YOLO モデルは、RT-DETR のような Transformer ベースの代替モデルと比較して、学習中の CUDA メモリ使用量が低くなるよう最適化されています。これにより、開発者は NVIDIA RTX シリーズのような一般的なコンシューマー向け GPU で、より大きなバッチサイズを使用できます。
Link to this section強みと弱み#
強み:
- 単純なバウンディングボックス検出を超えた、多タスクに対応する比類のない汎用性。
ultralyticsパッケージによる合理化された Python API。学習やエクスポートが非常に直感的です。- Higher mean Average Precision (mAP) across all size variants compared to YOLOv5.
弱み:
- デカップルドヘッドと C2f モジュールの導入により、YOLOv5 の同等モデルと比較して、一部のバリエーションではパラメータ数と FLOPs がわずかに増加しています。
Link to this sectionUltralytics YOLOv5: アジャイルなパイオニア#
2020年に導入された YOLOv5 は、YOLO を PyTorch エコシステムにもたらし、開発者のアクセスビリティを劇的に向上させました。高速で信頼性が高く、デプロイが容易な物体検出モデルとして、すぐに業界標準となりました。
- 作成者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020-06-26
- GitHub: ultralytics/yolov5
- ドキュメント: YOLOv5ドキュメント
Link to this sectionアーキテクチャと手法#
YOLOv5 は アンカーベース のアーキテクチャに依存し、改良された CSPDarknet53 バックボーンを利用しています。アンカーベースの手法では、学習前に最適なアンカーを定義するためにデータセットのバウンディングボックスを慎重にクラスタリングする必要がありますが、特定の十分に定義されたデータセットに対しては非常に効果的です。
YOLOv5 は C3 モジュール を組み込んでおり、低いパラメータフットプリントを維持しながら効率的に特徴を抽出します。その損失関数は、物体性損失 (Objectness loss) を中心とし、分類およびバウンディングボックス回帰損失と組み合わせてネットワークの正確な予測を導きます。
Link to this section強みと弱み#
強み:
- Extremely lightweight, making the Nano (YOLOv5n) and Small (YOLOv5s) variants highly suitable for resource-constrained edge AI deployments.
- 特に CPU 上で非常に高速な推論速度。
- 広範なコミュニティチュートリアルとサードパーティ統合を備えた、深く定着したエコシステム。
弱み:
- アンカーボックスの構成が必要であり、非常に多様なデータセットやカスタムデータセットの場合、セットアップが複雑になる可能性があります。
- YOLOv8 や YOLO26 といった最新のアンカーフリーアーキテクチャと比較すると、全体的な精度 (mAP) が低い。
Link to this sectionパフォーマンスの比較#
これらのモデルを評価する際、速度と精度の良好なトレードオフを実現することが最も重要です。以下の表は、COCOデータセットで評価された両アーキテクチャのパフォーマンス指標を概説しています。CPU 速度は ONNX を使用して測定され、GPU 速度は TensorRT を使用してテストされました。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv5 は Nano バリエーションにおいてパラメータ数と絶対的な生の速度でわずかな優位性を維持していますが、YOLOv8 は全体として mAP を大幅に向上させており、要求の厳しい実際のデプロイメントシナリオにおいて、より優れたパフォーマンスのバランスを提供します。
Link to this section使いやすさと Ultralytics エコシステム#
現代の Ultralytics モデルの決定的な特徴は、それを取り巻く十分に管理されたエコシステムです。YOLOv5 から YOLOv8 への移行により、統合された ultralytics pip パッケージが導入され、非常に合理化されたユーザー体験が実現しました。
開発者は、数行の Python コードで モデル学習、検証、予測、およびエクスポートをシームレスに処理でき、ディープラーニングプロジェクトで歴史的に必要とされてきた複雑なボイラープレートスクリプトを回避できます。
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the model to ONNX for production deployment
path = model.export(format="onnx")さらに、Ultralytics Platform のようなツールとの統合により、データセット管理、クラウド学習、デプロイメントが簡素化され、積極的な開発と強力なコミュニティサポートが保証されています。
Link to this section理想的なユースケース#
YOLOv5 を選択すべき時: レガシーシステムを維持している場合、Raspberry Pi のような厳しく制限された CPU で推論を実行している場合、あるいはモデルサイズの数メガバイトを節約することが不可欠なプロジェクトに取り組んでいる場合、YOLOv5 は信頼できる主力モデルです。
YOLOv8 を選択すべき時: 今日から始まる事実上すべての新規プロジェクトにおいて、YOLOv5 よりも YOLOv8 が強く推奨されます。その高度なアーキテクチャは、複雑なトラッキング、OBB (Oriented Bounding Boxes)、およびセグメンテーションを容易に処理します。自律型ロボット工学から医療画像分析、スマートシティインフラストラクチャに至るまでの最新のアプリケーションに最適です。
YOLOv8 は非常に優れた能力を備えていますが、パフォーマンスの絶対的な最前線を求める開発者は、YOLO26 を検討すべきです。2026年にリリースされたこのモデルは、いくつかの画期的な進歩を導入しています。
- エンドツーエンドの NMS フリー設計: NMS 後処理を排除し、より速く、よりシンプルなデプロイを実現します。この概念は YOLOv10 で最初に開拓されました。
- MuSGD オプティマイザー: SGD と Muon のハイブリッドであり、LLM 学習の革新をコンピュータビジョンにもたらし、より安定した学習と高速な収束を可能にします。
- 最大 43% 高速な CPU 推論: 専用 GPU を持たないエッジコンピューティング環境向けに大幅に最適化されています。
- DFL の削除: Distribution Focal Loss が削除され、エクスポートの簡素化とエッジデバイスとの互換性が向上しました。
- ProgLoss + STAL: 航空画像や IoT に不可欠な、小物体認識の顕著な改善を促進する高度な損失関数。
Ultralytics が提供する包括的なドキュメントとツールを活用することで、YOLOv8 を容易にデプロイしたり、最先端の YOLO26 を探索して、これまでにないスピードと精度で複雑な視覚的課題を解決したりできます。さらなる学習のために、ハイパーパラメータチューニング および モデルデプロイメントのベストプラクティス に関するガイドを探索することを検討してください。