Link to this sectionYOLOX対YOLO11#
コンピュータビジョンの進化は、高い精度と推論速度を両立するリアルタイム物体検出フレームワークの探求によって大きく牽引されてきました。この道のりにおける最も注目すべきマイルストーンとして、YOLOXとUltralytics YOLO11が挙げられます。両モデルともこの分野に多大な貢献をしてきましたが、その基盤となるアーキテクチャ、設計哲学、そして開発者エコシステムは大きく異なります。
本技術比較では、次なる人工知能プロジェクトに向けて情報に基づいた意思決定ができるよう、両モデルのアーキテクチャ、パフォーマンスメトリクス、学習手法、および理想的なデプロイシナリオについて詳しく解説します。
Link to this sectionYOLOXの概要#
2021年7月18日にMegviiの研究者であるZheng Ge、Songtao Liu、Feng Wang、Zeming Li、およびJian Sunらによって発表されたYOLOXは、YOLOシリーズにおける重要な転換点となりました。アンカーフリー設計を導入することで、学術研究と産業応用の間のギャップを埋めることに成功しました。
技術的な背景の詳細については、オリジナルのYOLOX Arxiv論文をご確認ください。
Link to this section主要なアーキテクチャの特徴#
YOLOXは、デカップルヘッド(decoupled head)とアンカーフリーメカニズムを採用することで、従来のアンカーベースの検出から脱却しました。この設計により設計パラメータ数が削減され、さまざまなベンチマークにおいてモデルのパフォーマンスが向上しました。さらに、SimOTAのような高度なラベル割り当て戦略を導入し、学習プロセスの加速と収束の改善を実現しました。
YOLOXは当時としては非常に優れた精度を提供しましたが、主にバウンディングボックスによる物体検出に焦点を当てており、他の複雑なビジョンタスクへのネイティブ対応は提供されていません。
定義済みのアンカーボックスを排除することで、YOLOXはデータセットごとに必要となるヒューリスティックな調整を劇的に削減し、アンカーフリー手法の研究における強力なベースラインとなりました。
Link to this sectionUltralytics YOLO11の概要#
2024年9月27日にUltralyticsのGlenn JocherとJing QiuによってリリースされたYOLO11は、コンピュータビジョンにおける汎用性と使いやすさを再定義する最先端のモデルです。長年の基礎研究に基づいて構築されており、多様なタスクで優れた性能を発揮する、洗練されたプロダクション対応のソリューションを提供します。
Link to this sectionUltralyticsの利点#
YOLO11は単なる物体検出器ではありません。インスタンスセグメンテーション、画像分類、姿勢推定、および指向性バウンディングボックス(OBB)検出をサポートする統合フレームワークです。速度、パラメータ数、精度のバランスを最適化する非常に効率的なアーキテクチャを誇ります。
さらに、YOLO11はUltralytics Platformに完全に統合されており、データアノテーション、モデル学習、デプロイのための合理化されたエコシステムを提供します。
Link to this sectionパフォーマンスと指標の比較#
これらのモデルを比較すると、パフォーマンスのバランスが明らかになります。YOLO11は、多くのサイズカテゴリにおいて、YOLOXと比較してパラメータ数とFLOPsが大幅に少ないにもかかわらず、より高いmAP(平均適合率)を達成しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
示されている通り、YOLO11モデルは、より少ないパラメータ数でYOLOXよりも一貫して高い精度を達成しています。例えば、YOLO11mはわずか20.1Mのパラメータで51.5 mAPを達成するのに対し、YOLOXxは同等の51.1 mAPを達成するために99.1Mものパラメータを必要とします。学習および推論時のこのメモリ効率の高さにより、YOLO11はRT-DETRのような古いモデルやTransformerベースのモデルに特有の重いCUDAメモリ要件を回避でき、エッジAIデバイスへのデプロイに非常に適しています。
Ultralyticsモデルは、YOLOXやTransformerベースのアーキテクチャと比較して、学習時に必要なGPUメモリが大幅に少ないため、研究者は標準的なコンシューマー向けハードウェアで強力なモデルを学習できます。
Link to this sectionエコシステムと使いやすさ#
両フレームワークの最も際立った違いの一つは、開発者体験です。
YOLOXでは、リポジトリのクローン作成、複雑な環境構築、そしてモデルをONNXやTensorRTなどのフォーマットにエクスポートするために、冗長なコマンドライン引数を実行する必要があることがよくあります。
対照的に、Ultralytics YOLO11は非常にシンプルなPython APIとCLIを提供します。Ultralyticsライブラリは、データ拡張、ハイパーパラメータチューニング、およびエクスポートを自動的に処理します。
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")This well-maintained ecosystem is backed by extensive documentation and seamless integration with tools like Weights & Biases for experiment tracking.
Link to this section理想的なユースケース#
これらのモデルの選択は、多くの場合、デプロイ環境の詳細に依存します。
Link to this sectionYOLOXを使用すべき場合#
- レガシーシステム: MegEngineフレームワークや2021年初期の物体検出パラダイムを中心に構築された確立されたパイプラインがある場合。
- 学術的なベースライン: 2021年時代の基礎的なアンカーフリーアーキテクチャと直接ベンチマーク比較を行う必要がある研究を行う場合。
Link to this sectionYOLO11を使用すべき場合#
- 本番環境へのデプロイ: スマートリテールやセキュリティアラームシステムなどの商用アプリケーションにおいて、堅牢でメンテナンスされたコードと高精度が不可欠な場合。
- マルチタスクパイプライン: 物体の追跡、人間の姿勢推定、インスタンスのセグメンテーションを単一の統合フレームワークで行う必要があるプロジェクトの場合。
- Resource-Constrained Edge Devices: Because of its low parameter count and high throughput, YOLO11 is ideal for deployment on Raspberry Pi or mobile edge nodes via CoreML and NCNN.
Link to this section今後の展望: YOLO26の優位性#
YOLO11はYOLOXから大幅な飛躍を遂げましたが、コンピュータビジョンの分野は急速に進歩しています。今日新しくプロジェクトを開始する開発者には、**Ultralytics YOLO26**を強く推奨します。
2026年1月にリリースされたYOLO26は、YOLO11のアーキテクチャの輝きを受け継ぎ、いくつかの画期的な機能を導入しています。
- エンドツーエンドのNMSフリー設計: YOLO26は非最大値抑制(NMS)の後処理を排除し、推論をネイティブにストリーミングすることで、より高速でシンプルなデプロイパイプラインを実現します(この概念はYOLOv10で初めて探求されました)。
- 最大43%高速なCPU推論: Distribution Focal Loss (DFL)の削除により、YOLO26はCPUや低電力エッジデバイス上で大幅に効率化されました。
- MuSGDオプティマイザ: Moonshot AIのLLM学習の革新から着想を得たMuSGDオプティマイザは、非常に安定した学習と高速な収束を保証します。
- 高度な損失関数: ProgLossとSTALを活用することで、YOLO26は小物体認識において顕著な向上を達成しており、ドローン画像や自律ロボットにおいて極めて重要です。
現代のコンピュータビジョンのタスクの大半において、パイプラインをYOLO26へとアップグレードすることで、速度、精度、およびデプロイの単純さのバランスが最も優れたものとなります。