YOLO11 vs YOLOX:技術比較
適切な物体検出モデルの選択は、精度、速度、実装の容易さのバランスを取る重要な決定です。このページでは、Ultralytics YOLO11(Ultralyticsの最新の最先端モデル)と、Megviiの重要なアンカーフリーモデルであるYOLOXとの詳細な技術的比較を提供します。どちらのモデルもリアルタイム物体検出の分野を進歩させていますが、YOLO11は、堅牢で活発にメンテナンスされているエコシステムによって支えられた、より包括的で汎用性が高く、ユーザーフレンドリーなソリューションを提供します。
Ultralytics YOLO11:最先端のパフォーマンスと汎用性
Ultralytics YOLO11は、Ultralyticsの最新のフラッグシップモデルであり、幅広いコンピュータビジョンタスクにおいて、比類のないパフォーマンスと柔軟性を提供するように設計されています。Glenn JocherとJing Qiuによって作成され、YOLOv8のような以前のモデルの成功した基盤を基に構築され、優れた精度と効率を実現するための重要なアーキテクチャの改良が導入されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11は、高度に最適化されたアンカーフリーのアーキテクチャを特徴とし、特徴抽出を強化し、検出プロセスを効率化します。この設計により、速度と精度の間でより良いトレードオフが実現され、多くの場合、他のモデルと比較して、より少ないパラメータと低い計算コストでより高いmAPスコアを達成します。
YOLO11の主な利点は、その汎用性です。これは単なる物体検出器ではなく、インスタンスセグメンテーション、画像分類、ポーズ推定、および傾斜バウンディングボックス(OBB)検出を含む、複数のタスクをすぐにサポートする包括的なビジョンAIフレームワークです。
長所
- 優れた性能: 最新の精度と速度を実現し、同様のモデルサイズの多くの競合製品を凌駕します。
- 使いやすさ: シンプルなPython APIとCLI、充実したドキュメント、そして多数のチュートリアルが付属しており、初心者から専門家までアクセスできます。
- 優れた維持管理体制のエコシステム: 継続的な開発、GitHubとDiscord上の強力なコミュニティ、頻繁なアップデートの恩恵を受けています。Ultralytics HUBのようなツールとの統合は、シームレスなMLOps体験を提供します。
- 学習効率: 事前学習済みのウェイトがすぐに利用できるため、効率的な学習プロセスを提供し、より迅速な収束を可能にします。また、Transformerのようなより複雑なアーキテクチャと比較して、学習および推論中のメモリ要件が低くなっています。
- マルチタスクの汎用性: 単一のフレームワークを広範なビジョンタスクに使用できるため、開発の複雑さと時間が軽減されます。
- Deployment Flexibility: エッジデバイスからクラウドサーバーまで、さまざまなハードウェア向けに最適化されており、ONNXやTensorRTなどの多数のエクスポート形式をサポートしています。
弱点
- 最先端のモデルとして、YOLO11xのような大規模なバリアントは計算負荷が高くなる可能性があり、リアルタイムのパフォーマンスには強力なハードウェアが必要です。
- エコシステムは堅牢ですが、ニッチなサードパーティ製ツールとの統合は、旧来の確立されたモデルの方が成熟している場合があります。
理想的なユースケース
YOLO11は、高精度、高速性、汎用性を兼ね備えているため、幅広い用途に最適です。
- 産業オートメーション: 生産ラインでの品質管理と欠陥検出。
- スマートシティ: 交通管理システムと公共安全監視を強化します。
- Healthcare: 腫瘍検出などの医療画像解析を支援します。
- 小売: 在庫管理と顧客分析の強化。
YOLOX:アンカーフリーなアプローチ
Megviiによって開発されたYOLOXは、検出パイプラインを簡素化し、以前のバージョンよりも性能を向上させるためにアンカーフリー設計を導入し、YOLOファミリーへの注目すべき貢献となりました。
- 著者: Zheng Ge、Songtao Liu、Feng Wang、Zeming Li、Jian Sun
- 組織: Megvii
- Date: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Docs: https://yolox.readthedocs.io/en/latest/
アーキテクチャと主な機能
YOLOXの主な革新には、アンカーフリー検出器、分類と回帰のためのデカップルドヘッド、およびSimOTAと呼ばれる高度なラベル割り当て戦略が含まれます。これらの変更は、より効率的で効果的なオブジェクト検出器を作成することを目的としていました。
長所
- 高精度: YOLOXは、特に大規模なモデルバリアントにおいて、競争力のあるmAPスコアを提供します。
- Anchor-Free Simplicity: 事前に定義されたアンカーボックスを排除することで、調整が必要なハイパーパラメータの数を減らし、一般化を向上させることができます。
- 確立されたモデル: 2021年にリリースされて以来、コミュニティがあり、さまざまなプロジェクトで採用されています。
弱点
- 汎用性の制限: YOLOXは主に物体検出用に設計されています。YOLO11で標準となっているセグメンテーション、姿勢推定、OBBのような他のタスクに対する組み込みサポートがありません。
- 分断されたエコシステム: オープンソースではありますが、Ultralyticsが提供するような統一され、十分にメンテナンスされたエコシステムはありません。MLOpsツールとの統合やデプロイメントには、より多くの労力が必要となる場合があります。
- パフォーマンスのギャップ: パフォーマンスの表に示すように、YOLOXモデルはYOLO11モデルよりも低速で精度が低い場合があります。たとえば、YOLOX-lは、YOLO11lよりもmAPが劣り、パラメーターとFLOPが大幅に多くなっています。
- CPUパフォーマンス: CPU 推論のベンチマークは容易に入手できないため、YOLO11 が明確な指標を提供する CPU バウンドのシナリオでのパフォーマンスを評価することは困難です。
理想的なユースケース
YOLOXは、以下を特に必要とするプロジェクトに適しています。
- 高性能物体検出: 主な目標が純粋な物体検出精度であるシナリオ。
- 研究のベースライン: アンカーフリー検出法の研究における基礎モデルとして。
- 産業用アプリケーション: 専用の物体検出器で十分な品質管理などのタスク向け。
性能分析:YOLO11 vs YOLOX
この性能比較は、Ultralytics YOLO11によって達成された進歩を明確に示しています。すべてのモデルサイズにおいて、YOLO11は一貫して精度と効率のより良いバランスを提供します。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
- 精度: YOLO11モデルは、YOLOXモデルよりも一貫して高いmAPスコアを達成しています。たとえば、YOLO11mは51.5 mAPに達し、少ないパラメータでYOLOXmの46.9 mAPを大幅に上回っています。
- 効率性: YOLO11は優れた効率性を示しています。YOLO11lはわずか25.3Mのパラメータで53.4 mAPを達成していますが、YOLOXlはより低い49.7 mAPに到達するために54.2Mのパラメータを必要とします。
- 速度: YOLO11は、CPUとGPUの両方の推論用に最適化されています。その最小モデルであるYOLO11nは、T4 GPU上で印象的な1.5 msのレイテンシを誇り、リアルタイムアプリケーションに最適です。YOLOXの報告された速度は、同等のモデルよりも遅いです。
結論と推奨事項
YOLOXはアンカーフリー物体検出における重要な開発でしたが、Ultralytics YOLO11は、最高のパフォーマンス、汎用性、使いやすさの組み合わせを求める開発者や研究者にとって、明確な勝者です。
YOLO11は、精度や効率などの主要な指標でYOLOXを上回るだけでなく、はるかに包括的でサポート的なエコシステムを提供します。単一の使いやすいフレームワーク内で複数のビジョンタスクを処理できるため、最新のAIソリューションを構築するためのより実用的で強力な選択肢となります。迅速なプロトタイピングから本番規模のデプロイまで、あらゆる新しいプロジェクトには、Ultralytics YOLO11が推奨されるモデルです。
その他のモデル比較
YOLO11とYOLOXと他のモデルとの比較にご興味があれば、以下の比較ページをご覧ください。
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv9
- YOLO11 vs YOLOv8
- YOLOv8 vs YOLOX
- YOLOv5 vs YOLOX
- RT-DETR vs YOLOX
- YOLO11 vs EfficientDet