YOLOv8 vs YOLO11:詳細な技術比較
特に物体検出のためにコンピュータビジョンモデルを選択する場合、異なるアーキテクチャの長所と短所を理解することが不可欠です。このページでは、Ultralytics YOLOv8とUltralytics YOLO11の間の詳細な技術比較を提供します。これらは、物体検出およびその他のビジョンタスク用に設計されたUltralyticsの2つの最先端モデルです。アーキテクチャのニュアンス、パフォーマンスベンチマーク、および適切なアプリケーションを分析して、プロジェクトで情報に基づいた意思決定を行うのに役立てます。
Ultralytics YOLOv8
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
2023年初頭にリリースされたYOLOv8は、すぐにリアルタイム物体検出のベンチマークとなり、以前のバージョンよりも大幅にパフォーマンスが向上しました。アンカーフリーの検出メカニズムと、精度と速度の両方を向上させた新しいCSPDarknet53ベースのバックボーンが導入されました。YOLOv8は、検出、インスタンスセグメンテーション、ポーズ推定、画像分類など、幅広いビジョンAIタスクをサポートする、非常に汎用性の高いモデルです。
アーキテクチャと主な機能
YOLOv8のアーキテクチャは、効率性と柔軟性を重視して構築されています。アンカーフリーのヘッドにより、ボックス予測の数が減少し、後処理のパイプラインが簡素化され、推論が高速化されます。このモデルは、単一のモデルとしてだけでなく、さまざまなタスクのモデルをトレーニングするための統合プラットフォームを提供する包括的なフレームワークとして設計されました。Ultralyticsエコシステムへの統合により、ユーザーはトレーニングからデプロイメントまで、合理化されたワークフローの恩恵を受けることができ、広範なドキュメントと堅牢なツールセットによってサポートされています。
長所
- 実績ある性能: 信頼性が高く、広く採用されているモデルであり、性能と速度において業界標準を確立しています。
- タスクの汎用性: 検出、セグメンテーション、分類、姿勢推定を処理できる単一の統合フレームワークです。
- 成熟したエコシステム: 多数のコミュニティチュートリアル、サードパーティの統合、および本番環境での広範な展開から恩恵を受けています。
- 使いやすさ: シンプルなPython APIとCLIを備えており、初心者から専門家までアクセス可能です。
弱点
- 依然としてトップパフォーマーですが、その精度と速度は、特にCPUバウンドのシナリオにおいて、後継モデルであるYOLO11に上回られています。
- より大きなモデル(YOLOv8l、YOLOv8x)は、計算負荷が高くなる可能性があり、リアルタイムパフォーマンスにはかなりのGPUリソースが必要です。
ユースケース
YOLOv8は、特に安定性と成熟したエコシステムが重視される幅広いアプリケーションにとって、依然として優れた選択肢です。以下の点で優れています。
- 産業オートメーション: 製造業における品質管理と欠陥検出。
- セキュリティシステム: リアルタイム監視と侵入検知のための高度なセキュリティシステムを強化します。
- 小売分析: 在庫管理の改善と顧客行動の分析。
Ultralytics YOLO11
著者: Glenn Jocher and Jing Qiu
所属: Ultralytics
日付: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolo11/
YOLO11は、Ultralytics YOLOシリーズの最新版であり、優れた精度と効率を実現するために設計されています。YOLOv8の強力な基盤の上に構築されたYOLO11は、特徴抽出と処理を最適化するアーキテクチャの改良を導入しています。これにより、特にCPU上で、より少ないパラメータとより高速な推論速度で、より高い検出精度を実現します。前モデルと同様に、YOLO11は、検出、セグメンテーション、分類、姿勢推定、および指向性バウンディングボックス(OBB)を同じ合理化されたフレームワーク内でサポートするマルチタスクモデルです。
アーキテクチャと主な機能
YOLO11は、計算コストと性能のより良いバランスを実現するために、ネットワーク構造を改良しています。以下の性能表に示すように、YOLOv8と比較して、より少ないパラメータ数とより少ないFLOPで、より高い精度を達成しています。この効率性により、リソースに制約のあるエッジデバイスから強力なクラウドサーバーまで、幅広いハードウェアへのデプロイに非常に適しています。YOLO11の重要な利点は、適切にメンテナンスされたUltralyticsエコシステムへのシームレスな統合であり、優れたユーザーエクスペリエンス、すぐに利用できる事前トレーニング済みの重みによる効率的なトレーニングプロセス、およびトレーニングと推論中のより低いメモリ使用量を保証します。
長所
- 最先端の精度: すべてのモデルサイズにおいて、YOLOv8よりも高いmAPスコアを提供し、物体検出の新たな標準を打ち立てます。
- 効率性の向上: 特にCPUにおいて、大幅に高速な推論速度を提供し、必要なパラメータとFLOPsを削減します。
- パフォーマンスのバランス: 速度と精度の間で卓越したトレードオフを提供し、多様な現実世界のアプリケーションに最適です。
- スケーラビリティと多様性: さまざまなハードウェア上で優れた性能を発揮し、単一の使いやすいフレームワーク内で複数のコンピュータビジョンタスクをサポートします。
- 優れた維持管理体制のエコシステム: 活発な開発、GitHubやDiscordを通じた強力なコミュニティサポート、頻繁なアップデートの恩恵を受けています。
弱点
- より新しいモデルであるため、確立されたYOLOv8と比較して、サードパーティの統合が最初は少ない場合があります。
- 最大のモデル(例えば、YOLO11x)は、トレーニングとデプロイメントに依然としてかなりの計算能力を必要としますが、これは高精度な検出器に共通する特徴です。
ユースケース
YOLO11は、最高レベルの精度とリアルタイム性能を要求する新しいプロジェクトに推奨される選択肢です。その効率性により、以下に最適です。
- ロボティクス: 自律システムにおける正確なナビゲーションと物体インタラクションを可能にする。
- Healthcare: 腫瘍検出などのアプリケーションのために、医療画像解析を支援します。
- スマートシティ: インテリジェントな交通管理と公共安全システムを強化します。
性能の直接対決:YOLOv8 vs. YOLO11
YOLOv8とYOLO11の主な違いは、パフォーマンスにあります。YOLO11は、より高い精度(mAP)とより高い効率(より少ないパラメータとより速い速度)を提供することで、一貫してYOLOv8を上回ります。たとえば、YOLO11lはYOLOv8l(52.9)よりも高いmAP(53.4)を達成していますが、パラメータは約42%少なく、CPUでは大幅に高速です。この傾向はすべてのモデルバリアントに当てはまり、YOLO11はより強力で効率的な後継モデルとなっています。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
結論と推奨事項
YOLOv8とYOLO11はどちらも優れたモデルですが、わずかに異なるニーズに対応しています。
-
YOLOv8は堅牢で成熟したモデルであり、すでに構築されているプロジェクトや、既存のサードパーティツールやチュートリアルの広範なエコシステムに大きく依存しているプロジェクトにとって、安全な選択肢となります。幅広いコンピュータビジョンタスクにおいて、依然として強力な選択肢です。
-
YOLO11は、パフォーマンスと効率の点で明確な勝者です。これは、リアルタイムオブジェクト検出の最先端を表しています。新しいプロジェクトでは、YOLO11を開始点として推奨します。その優れた精度、より高速な推論速度(特にCPU上)、およびより効率的なアーキテクチャは、大きな利点を提供し、アプリケーションを将来にわたって保証します。Ultralyticsエコシステム内での継続的なサポートと開発は、開発者と研究者にとって最高の選択肢としての地位をさらに強固なものにします。
他のモデルの調査に関心のある方のために、Ultralytics は、基礎となるYOLOv5、最近のYOLOv9、RT-DETRのような Transformer ベースのモデルを含む、さまざまなアーキテクチャもサポートしています。詳細な比較は、モデル比較ページでご覧いただけます。