YOLO11 YOLOX:高性能物体検出の進化
コンピュータビジョン分野はここ数年で急速な進歩を遂げ、リアルタイム物体検出モデルはますます高度化している。実稼働環境や学術研究向けのアーキテクチャを選択する際、開発者は往々にして従来技術と最先端技術の間でトレードオフを天秤にかける。本比較では以下の差異を包括的に検証する Ultralytics YOLO11 とMegviiのYOLOXの差異を比較し、各アーキテクチャの構造、性能指標、最適な導入シナリオについて深い洞察を提供する。
アーキテクチャの概要
両モデルは物体detectにおける大きな飛躍を意味しますが、それらは異なる設計哲学に由来し、異なる開発者体験をターゲットとしています。
YOLO11:多機能マルチタスクエンジン
2024年9月、Glenn JocherとJing Qiuにより Ultralyticsよりリリースされた、 YOLO11 は、高い精度と究極の効率性を両立させる統合フレームワークとして設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- ドキュメント:https://docs.ultralytics.com/models/yolo11/
YOLO11 標準的なバウンディングボックスYOLO11 、インスタンスセグメンテーション、画像分類、姿勢推定、およびオリエンテッドバウンディングボックス(OBB)検出をネイティブにサポートします。洗練されたアーキテクチャは特徴抽出を最適化し、複雑な空間階層全体でより優れた特徴保持を保証します。
YOLOX: アンカーフリーの先駆者
Megviiの研究者によって開発されたYOLOXは、純粋なアンカーフリーのアプローチにより、研究と産業アプリケーションの間のギャップを埋め、2021年に大きな注目を集めました。
- 著者: Zheng Ge、Songtao Liu、Feng Wang、Zeming Li、Jian Sun
- 組織: Megvii
- 日付: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
- ドキュメント:https://yolox.readthedocs.io/en/latest/
YOLOXは分離型ヘッドとアンカーフリーパラダイムを導入し、設計パラメータ数を大幅に削減するとともに、リリース当時の学術ベンチマークにおける性能を向上させた。
ご存知でしたか?
YOLOXによって普及したアンカーフリー設計は、その後多くのアーキテクチャに影響を与えた。Ultralytics これらのアンカーフリー概念Ultralytics 後続の反復(例: YOLOv8 やYOLO11 などの後続バージョンでこれらのアンカーフリー概念をYOLO11 優れた精度と展開の柔軟性YOLO11 。
パフォーマンスとメトリクス
検出モデルを評価する際には、パラメータのバランス、計算コスト(FLOPs)、平均精度(mAP)を検討することが、実環境でのモデル展開において極めて重要である。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
表が示すように、YOLO11xは、絶対精度においてYOLOXxを大幅に上回っています(54.7 mAP対51.1 mAP)。パラメータ数はほぼ半分(56.9M対99.1M)です。この効率性は、学習と推論の両方におけるメモリ要件の低減につながり、生産環境にとって大きな利点となります。
エコシステムと開発者体験
Ultralyticsの利点
YOLO11 最も根本的な違いの一つは、使いやすさにあります。YOLOXは主に研究用コードベースとして動作し、複雑な環境設定、C++オペレーターのハンドコンパイル、カスタムデータセットのトレーニングを開始するための冗長なコマンドライン引数が必要となります。
対照的に、YOLO11 Ultralytics Python 完全にYOLO11 、効率的な「ゼロからヒーローへ」のワークフローを提供します。Ultralytics は、データアノテーション、実験追跡、クラウドベースのトレーニングのための広範なツールを提供し、定型処理を抽象化することで、エンジニアがモデルの性能に集中できるようにします。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
さらに、Ultralytics を TensorRT、CoreML、または OpenVINO へのエクスポートは単一のコマンドのみで実現できるのに対し、従来のリポジトリでは複雑なサードパーティ製ツールや手動でのグラフ操作が必須となるケースが少なくありません。
実際のユースケース
YOLOXを検討すべき時
YOLOXは、開発者が特定の分離されたtensor 中心に高度にカスタマイズされたC++推論パイプラインを既に構築している、特殊なレガシー展開において有効な選択肢であり続ける。さらに、2021年の最先端アーキテクチャとの比較研究を行う研究者らは、ベンチマークデータセットのベースラインとしてYOLOXを引き続き利用するだろう。
YOLO11 が優れている点
ほぼすべての現代の生産シナリオにおいて、YOLO11ははるかに優れたエクスペリエンスを提供します。
- スマートシティと小売: その卓越した速度とAPの比率により、YOLO11は混雑したシーンを難なく処理し、大規模なGPUクラスターを必要とせずに自動小売分析や交通管理システムを強化します。
- エッジコンピューティング: 高いメモリ効率と堅牢なエクスポートオプションにより、YOLO11はRaspberry PiやNVIDIA Jetsonプラットフォームのようなデバイス上でのエッジAIデプロイメントに最適です。
- 複雑なパイプライン:プロジェクトがオブジェクトdetectと姿勢キーポイント(例:スポーツ分析)または正確なインスタンスsegment(例:医療画像)の組み合わせを要求する場合、YOLO11は単一の統合APIを通じてすべてのタスクをネイティブに処理します。
ユースケースと推奨事項
YOLO11とYOLOXの選択は、特定のプロジェクト要件、デプロイ制約、およびエコシステムへの適合性によって決まります。
YOLO11を選択すべき時
YOLO11 以下に最適YOLO11 :
- 本番エッジデプロイ: Raspberry PiやNVIDIA Jetsonのようなデバイス上での商用アプリケーションにおいて、信頼性と継続的なメンテナンスが最重要となります。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内で、detect、segment、姿勢推定、およびOBBを必要とするプロジェクト。
- 迅速なプロトタイピングとデプロイ: 合理化されたUltralytics Python APIを使用して、データ収集から本番環境へ迅速に移行する必要があるチーム向け。
YOLOXを選択すべき時
YOLOXは以下の方におすすめです:
- アンカーフリー検出研究: YOLOXのクリーンなアンカーフリーアーキテクチャをベースラインとして使用し、新しい検出ヘッドや損失関数を実験する学術研究。
- 超軽量エッジデバイス: YOLOX-Nanoバリアントの極めて小さいフットプリント(0.91Mパラメータ)が重要となるマイクロコントローラーやレガシーモバイルハードウェアへのデプロイ。
- SimOTAラベル割り当て研究: 最適輸送ベースのラベル割り当て戦略と、それがトレーニング収束に与える影響を調査する研究プロジェクト。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。
- NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
- CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
- 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。
今後の展望: YOLO26の力
YOLO11 卓越した選択肢YOLO11 、AIの進化は絶えず加速している。効率性と安定性の絶対的な頂点を求めるチームにとって、 YOLO26 (2026年1月リリース)が新たなコンピュータビジョンプロジェクトにおける究極の推奨選択肢となります。
YOLO26はエンドツーエンドNMSを実現することで、飛躍的な進歩を遂げました。ノンマキシマムサプレッション(NMS)後処理を排除することで、遅延変動を完全に除去し、展開ロジックを劇的に簡素化しました。この概念は YOLOv10で初めて確立された概念です。
さらに、YOLO26はDFL除去(分布焦点損失)を搭載し、アーキテクチャを最適化することで CPU 最大43%高速化。これにより、低消費電力デバイスやエッジデバイスにおける圧倒的な性能を実現しています。 トレーニング安定性も、収束を加速するLLMに着想を得たSGD ハイブリッド手法であるMuSGDオプティマイザーによって大幅に向上。ProgLoss + STALなどの先進的な損失関数と組み合わせることで、YOLO26はドローン画像やIoTエッジセンサーといった困難な環境下における微小物体の検出に特に優れています。
さらなる探求
物体検出アーキテクチャの知識を拡充したいですか?YOLOのオープンボキャブラリ機能を探求するか、トランスフォーマーベースの RT-DETRUltralytics モデルを深く掘り下げましょう。
結論として、YOLOXが2021年に重要なアーキテクチャ概念を導入した一方で、YOLO11包括的なツールセット、メモリ効率、最先端の性能、そして特にYOLO26の革新的なアーキテクチャにより、Ultralytics 今日の研究者や企業開発者にとって明らかな選択肢となっている。