Link to this sectionYOLO11対YOLOX#
コンピュータビジョンの分野では、ここ数年で急速な進歩が見られ、リアルタイムの物体検出モデルはますます高度化しています。本番環境や学術研究のためにアーキテクチャを選択する際、開発者はしばしばレガシーなマイルストーンと最先端のイノベーションの間でトレードオフを検討します。この包括的な比較では、Ultralytics YOLO11とMegviiのYOLOXの違いを探り、それらのアーキテクチャ、パフォーマンス指標、および理想的なデプロイメントシナリオについて深い洞察を提供します。
Link to this sectionアーキテクチャの概要#
両モデルとも物体検出における大きな飛躍を表していますが、それぞれ異なる設計思想に基づいており、異なる開発者体験を対象としています。
Link to this sectionYOLO11:汎用マルチタスクエンジン#
2024年9月にUltralyticsのGlenn JocherとJing QiuによってリリースされたYOLO11は、高い精度と極めて高い効率性を両立させる統一フレームワークとして設計されています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
YOLO11は標準的なバウンディングボックスを超え、インスタンスセグメンテーション、画像分類、姿勢推定、および方向付きバウンディングボックス(OBB)検出をネイティブでサポートしています。洗練されたアーキテクチャが特徴抽出を最適化し、複雑な空間階層全体でより優れた特徴保持を保証します。
Link to this sectionYOLOX:アンカーフリーの先駆者#
Megviiの研究者によって開発されたYOLOXは、純粋なアンカーフリーのアプローチにより、研究と産業応用の間のギャップを埋める存在として2021年に大きな注目を集めました。
- 著者: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
- 組織: Megvii
- 日付: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- ドキュメント: https://github.com/Megvii-BaseDetection/YOLOX/tree/main/docs
YOLOXはデカップルドヘッド(分離ヘッド)とアンカーフリーのパラダイムを導入し、リリース当時、設計パラメータの数を大幅に削減し、学術ベンチマークでのパフォーマンスを向上させました。
YOLOXによって普及したアンカーフリーの設計は、その後の多くのアーキテクチャに影響を与えました。Ultralyticsは、YOLOv8やYOLO11などの後のイテレーションにおいて、これらのアンカーフリーのコンセプトを取り入れ、大幅に改良することで、優れた精度とデプロイの柔軟性を提供しています。
Link to this sectionパフォーマンスとメトリクス#
検出モデルを評価する際、パラメータのバランス、計算コスト(FLOPs)、および平均適合率(mAP)を検討することは、現実世界のモデルデプロイメントにおいて非常に重要です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
表に見られるように、YOLO11xはYOLOXxを絶対精度(54.7 mAP対51.1 mAP)で大幅に上回り、かつ必要なパラメータはほぼ半分(56.9M対99.1M)です。この効率性はトレーニング中および推論中のメモリ要件の低減につながり、本番環境にとって大きな利点となります。
Link to this sectionエコシステムと開発者体験#
Link to this sectionUltralyticsの利点#
YOLO11とYOLOXの最も深い違いの一つは使いやすさにあります。YOLOXは主に研究用コードベースとして動作し、複雑な環境設定、C++演算子の手動コンパイル、そしてカスタムデータセットのトレーニングを開始するための冗長なコマンドライン引数を必要とします。
対照的に、YOLO11はUltralytics Pythonパッケージに完全に統合されており、合理化された「ゼロからヒーローへ」のワークフローを提供します。Ultralytics Platformは、データアノテーション、実験トラッキング、クラウドベースのトレーニングのための広範なツールを提供し、ボイラープレートコードを抽象化することで、エンジニアがモデルのパフォーマンスに集中できるようにします。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")さらに、UltralyticsモデルをTensorRT、CoreML、またはOpenVINOなどの形式にエクスポートするにはコマンド1つで済みますが、レガシーなリポジトリでは複雑なサードパーティツールや手動のグラフ修正が必要になることがよくあります。
Link to this section実際のユースケース#
Link to this sectionYOLOXを検討すべき時#
YOLOXは、特定のデカップルドヘッドのテンソル出力に基づいて、すでに高度にカスタマイズされたC++推論パイプラインを構築しているような、特殊なレガシーデプロイメントにおいて依然として有効な選択肢です。さらに、2021年の最先端アーキテクチャに対して比較研究を行う研究者は、依然としてYOLOXをベンチマークデータセットの基準として使用します。
Link to this sectionYOLO11が優れている点#
ほぼすべての現代の本番シナリオにおいて、YOLO11ははるかに優れた体験を提供します。
- スマートシティおよび小売: 卓越した速度と精度の比率により、YOLO11は混雑したシーンを難なく処理し、巨大なGPUクラスターを必要とせずに、自動化された小売分析や交通管理システムを強化します。
- Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
- 複雑なパイプライン: プロジェクトで物体検出と姿勢キーポイント(例:スポーツ分析)や、正確なインスタンスセグメンテーション(例:医療画像)の組み合わせが必要な場合、YOLO11は1つの統合されたAPIですべてのタスクをネイティブに処理します。
Link to this sectionユースケースと推奨事項#
YOLO11とYOLOXの選択は、特定のプロジェクト要件、デプロイの制約、およびエコシステムの好みに依存します。
Link to this sectionYOLO11を選択すべき時#
YOLO11は以下のような場合に適しています:
- 本番環境へのエッジ展開: Raspberry PiやNVIDIA Jetsonなどのデバイス上で動作する商業アプリケーションで、信頼性と継続的なメンテナンスが最優先される場合。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内でdetection、segmentation、pose estimation、OBBが必要なプロジェクト。
- 迅速なプロトタイピングと展開: 効率化されたUltralytics Python APIを使用して、データ収集から本番運用まで素早く移行する必要があるチーム。
Link to this sectionYOLOXを選択すべき時#
YOLOXが推奨されるケース:
- アンカーフリー検出研究: 新しい検出ヘッドや損失関数を実験するためのベースラインとして、YOLOXのクリーンでアンカーフリーなアーキテクチャを使用する学術研究。
- 超軽量エッジデバイス: YOLOX-Nanoバリアントの非常に小さなフットプリント(0.91Mパラメータ)が不可欠な、マイクロコントローラやレガシーモバイルハードウェアへのデプロイ。
- SimOTAラベル割り当ての研究: 最適輸送に基づくラベル割り当て戦略と、それが学習の収束に与える影響を調査する研究プロジェクト。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this section今後の展望:YOLO26の力#
YOLO11は非常に優れた選択肢ですが、AIの状況は絶えず加速しています。効率と安定性の極致を求めるチームにとって、YOLO26(2026年1月リリース)が新しいコンピュータビジョンプロジェクトにとっての究極の推奨事項です。
YOLO26は、エンドツーエンドのNMSフリー設計を実装することで、大きな飛躍を遂げました。Non-Maximum Suppression (NMS)の後処理を排除することで、レイテンシのばらつきを完全になくし、デプロイロジックを劇的に簡素化しました。これはYOLOv10で初めて先駆けて導入されたコンセプトです。
さらに、YOLO26はDFL除去(Distribution Focal Loss)を備えており、アーキテクチャを最適化して最大43%高速なCPU推論を実現し、低電力およびエッジデバイスにとっての議論の余地のないチャンピオンとなっています。トレーニングの安定性も、SGDとMuonのLLMに着想を得たハイブリッドであるMuSGDオプティマイザーによって強化され、収束が加速されます。ProgLoss + STALなどの高度な損失関数と組み合わせることで、YOLO26はドローン映像やIoTエッジセンサーのような困難な環境での小さな物体の検出に優れています。
物体検出アーキテクチャの知識を深めたいですか?YOLO-Worldのオープンボキャブラリー機能を探索するか、Ultralyticsエコシステムに文書化されているトランスフォーマーベースのRT-DETRモデルを詳しく調べてみてください。
結論として、YOLOXは2021年に重要なアーキテクチャのコンセプトを導入しましたが、YOLO11の包括的なツールセット、メモリ効率、最先端のパフォーマンス、そして特にYOLO26の革命的なアーキテクチャにより、今日、研究者やエンタープライズ開発者にとってUltralyticsエコシステムが明らかな選択肢となっています。