YOLO11 vs YOLOv5:オブジェクト検出における技術的進化
適切な物体検出モデルの選択は、精度、速度、デプロイメントの容易さの必要性のバランスを取る上で重要な決定です。このページでは、Ultralyticsの2つの画期的なモデル、最先端のUltralytics YOLO11と、広く採用されているUltralytics YOLOv5との包括的な技術比較を提供します。YOLOv5はそのパフォーマンスと使いやすさで業界標準を確立しましたが、YOLO11は次世代の進化を代表し、優れた精度、強化された汎用性、最新のアーキテクチャ革新を、すべて堅牢でユーザーフレンドリーなUltralyticsエコシステム内で実現します。
Ultralytics YOLO11:最新の最先端技術
Glenn JocherとJing Qiuによって作成されたYOLO11は、Ultralytics YOLOシリーズの最新かつ最先端のモデルです。2024年にリリースされ、YOLOv8のような前モデルの強力な基盤の上に構築され、性能と効率において新たなベンチマークを打ち立てます。物体検出だけでなく、多数のコンピュータビジョンタスクに対応する包括的なフレームワークとして設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は、アンカーフリー検出ヘッドや最適化されたネットワーク構造など、アーキテクチャの大幅な改良を導入しています。この最新の設計選択により、アンカーボックスを事前に定義する必要がなくなるため、トレーニングプロセスが簡素化され、多様なデータセットでの一般化が向上します。このモデルは、多くの場合、YOLOv5よりも少ないパラメータと計算要件(FLOP)で、より高い平均適合率(mAP)を達成し、優れた効率を示しています。
YOLO11 の際立った特徴は、その汎用性です。これは、物体検出、インスタンスセグメンテーション、画像分類、ポーズ推定、および傾斜バウンディングボックス (OBB)をネイティブにサポートする統合フレームワークです。このマルチタスク機能により、複雑な AI システムにとって非常に強力で柔軟なツールとなっています。
長所
- 最先端の精度: YOLOv5と比較して大幅に高いmAPスコアを提供し、新たなパフォーマンス基準を確立します。
- 高い効率: より効率的なアーキテクチャでより良い精度を実現し、多くの場合、より少ないパラメータとFLOPsを必要とします。
- Anchor-Free Design: アンカーボックスの設定への依存性を排除することで、学習を簡素化し、パフォーマンスを向上させます。
- マルチタスクの汎用性: 広範囲なビジョンタスクに対応する単一のフレームワークで、多面的なアプリケーションの開発を効率化します。
- 優れた維持管理体制のエコシステム: 継続的な開発、広範なドキュメント、強力なコミュニティサポート、MLOpsのためのUltralytics HUBのようなツールとのシームレスな統合の恩恵を受けています。
- 学習効率: 事前学習済みのウェイトがすぐに利用できる効率的な学習プロセスを提供し、一般的にTransformerのようなより複雑なアーキテクチャよりも少ないメモリ使用量で済みます。
弱点
- 最先端のモデルとして、YOLO11のより大きなバリアントは計算負荷が高くなる可能性があり、最適なパフォーマンスを得るには最新のGPUハードウェアが必要です。
理想的なユースケース
YOLO11は、最高の精度と柔軟性を必要とする新しいプロジェクトに最適な選択肢です。
- 高度なロボティクス: 動的な環境における正確な物体インタラクションとナビゲーションのため。
- 産業オートメーション: 高精度な品質管理と欠陥検出に。
- Healthcare: 腫瘍検出などのタスクのために、医療画像解析を支援します。
- スマートシティ: 交通管理と公共安全のための複雑なシステムを強化します。
YOLOv5:確立された汎用性の高い主力製品
2020年にUltralyticsのGlenn JocherによってリリースされたYOLOv5は、瞬く間に世界で最も人気のある物体検出モデルの1つになりました。その卓越した速度と精度のバランス、使いやすさ、そしてPyTorchでの堅牢で十分に文書化された実装が高く評価されています。
- Author: Glenn Jocher
- 組織: Ultralytics
- Date: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Docs: https://docs.ultralytics.com/models/yolov5/
アーキテクチャと主な機能
YOLOv5 は、効果的な特徴集約のために、CSPDarknet53 バックボーンと PANet ネックに基づくアーキテクチャを使用しています。その検出ヘッドはアンカーベースであり、リリース当時は標準的で効果的なアプローチでした。YOLOv5 の最大の強みの 1 つは、そのスケーラビリティであり、小型の「n」(ナノ)バージョンから大型の「x」(特大)バージョンまでの範囲のモデルを提供し、開発者は速度と精度の間で簡単にトレードオフできます。
長所
- 卓越した推論速度: リアルタイムパフォーマンスに高度に最適化されており、NVIDIA Jetsonのようなエッジデバイスでのアプリケーションに最適です。
- 使いやすさ: シンプルなAPI、広範なチュートリアル、および効率化された学習とデプロイのワークフローで知られています。
- 成熟したエコシステム: 大規模なコミュニティ、長年の活発な開発、および無数の実際の展開によって支えられており、安定性と信頼性を確保しています。
- 柔軟性: 幅広いモデルサイズにより、ほぼすべてのハードウェア制約に適応できます。
弱点
- 精度が低い: 依然として強力ですが、その精度はYOLO11のような新しいモデルに凌駕されています。
- Anchor-Based Detection: 事前に定義されたアンカーボックスに依存しており、最新のアンカーフリー検出器と比較して、カスタムデータセットで最適なパフォーマンスを得るには、手動での調整が必要になる場合があります。
理想的なユースケース
YOLOv5 は、特定のシナリオにおいて依然として優れた選択肢です。
- Edge Computing: 推論速度が最優先事項であるRaspberry Piのようなリソース制約のあるデバイスへのデプロイ。
- 迅速なプロトタイピング: そのシンプルさとスピードにより、概念実証アプリケーションを迅速に構築およびテストするのに最適です。
- レガシーシステム: YOLOv5フレームワーク上に構築された既存のプロジェクトの維持または更新。
- リアルタイム監視: 高い FPS が重要なセキュリティシステムを強化します。
性能とベンチマーク:YOLO11 vs. YOLOv5
この性能指標は、YOLOv5からYOLO11への進化を明確に示しています。COCOデータセットにおいて、YOLO11モデルは、同様のサイズのYOLOv5モデルよりも一貫して高いmAPスコアを達成しています。例えば、YOLO11mは51.5 mAPに達し、YOLOv5mの45.4 mAPを大幅に上回っています。さらに、YOLO11は多くの場合、より優れた計算効率でこれを実現しています。特に、最小のモデルであるYOLO11nは、CPUでの速度がYOLOv5nよりも高速でありながら、mAPが11.5ポイントも向上しています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
結論: どのモデルを選ぶべきか?
YOLO11とYOLOv5のどちらを選択するかは、プロジェクト固有のニーズによって異なります。
YOLOv5は、実績があり、信頼性が高く、信じられないほど高速なモデルです。特に古いハードウェアやリソースが限られたハードウェアでは、速度が最優先事項であるアプリケーションにとって、依然として素晴らしい選択肢です。その成熟度と広大なコミュニティサポートは、多くのプロジェクトに安定した基盤を提供します。
しかし、ほぼすべての新規プロジェクトにおいて、YOLO11 が明確でおすすめの選択肢です。これは大きな飛躍を遂げたものであり、最先端の精度、優れた効率、比類のない汎用性を提供します。アンカーフリーのアーキテクチャと複数のビジョンタスクのネイティブサポートにより、より強力で柔軟性があり、将来性のあるソリューションとなっています。YOLO11 を選択することで、開発者は最新の AI の進歩を活用して、より高性能で正確なコンピュータビジョンアプリケーションを構築できると同時に、合理化され、適切にメンテナンスされた Ultralytics エコシステムの恩恵を受けることができます。
その他のモデル比較
これらのモデルと他の主要なアーキテクチャとの比較にご興味があれば、以下の比較ページをご覧ください。