YOLO11 YOLOX:高性能物体検出の進化
コンピュータビジョン分野はここ数年で急速な進歩を遂げ、リアルタイム物体検出モデルはますます高度化している。実稼働環境や学術研究向けのアーキテクチャを選択する際、開発者は往々にして従来技術と最先端技術の間でトレードオフを天秤にかける。本比較では以下の差異を包括的に検証する Ultralytics YOLO11 とMegviiのYOLOXの差異を比較し、各アーキテクチャの構造、性能指標、最適な導入シナリオについて深い洞察を提供する。
アーキテクチャの概要
両モデルとも物体検出において大きな飛躍を遂げているが、異なる設計思想に基づいており、異なる開発者体験をターゲットとしている。
YOLO11:多機能マルチタスクエンジン
2024年9月、Glenn JocherとJing Qiuにより Ultralyticsよりリリースされた、 YOLO11 は、高い精度と究極の効率性を両立させる統合フレームワークとして設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- ドキュメント:https://docs.ultralytics.com/models/yolo11/
YOLO11 標準的なバウンディングボックスYOLO11 、インスタンスセグメンテーション、画像分類、姿勢推定、およびオリエンテッドバウンディングボックス(OBB)検出をネイティブにサポートします。洗練されたアーキテクチャは特徴抽出を最適化し、複雑な空間階層全体でより優れた特徴保持を保証します。
YOLOX: アンカーフリーの先駆者
Megviiの研究者によって開発されたYOLOXは、純粋なアンカーフリー手法により研究と産業応用との間のギャップを埋めたことで、2021年に大きな注目を集めた。
- 著者: Zheng Ge、Songtao Liu、Feng Wang、Zeming Li、Jian Sun
- 組織: Megvii
- 日付: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
- ドキュメント:https://yolox.readthedocs.io/en/latest/
YOLOXは分離型ヘッドとアンカーフリーパラダイムを導入し、設計パラメータ数を大幅に削減するとともに、リリース当時の学術ベンチマークにおける性能を向上させた。
ご存知でしたか?
YOLOXによって普及したアンカーフリー設計は、その後多くのアーキテクチャに影響を与えた。Ultralytics これらのアンカーフリー概念Ultralytics 後続の反復(例: YOLOv8 やYOLO11 などの後続バージョンでこれらのアンカーフリー概念をYOLO11 優れた精度と展開の柔軟性YOLO11 。
パフォーマンスとメトリクス
検出モデルを評価する際には、パラメータのバランス、計算コスト(FLOPs)、平均精度(mAP)を検討することが、実環境でのモデル展開において極めて重要である。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
表に示す通り、YOLO11x は絶対精度においてYOLOXxを大幅に上回る(54.7mAP対 51.1mAP)一方で、必要なパラメータ数は約半分(56.9M 対 99.1M)である。この効率性は、トレーニング時と推論時の両方でメモリ要件を低減し、実稼働環境において大きな利点となる。
エコシステムと開発者体験
Ultralyticsの利点
YOLO11 最も根本的な違いの一つは、使いやすさにあります。YOLOXは主に研究用コードベースとして動作し、複雑な環境設定、C++オペレーターのハンドコンパイル、カスタムデータセットのトレーニングを開始するための冗長なコマンドライン引数が必要となります。
対照的に、YOLO11 Ultralytics Python 完全にYOLO11 、効率的な「ゼロからヒーローへ」のワークフローを提供します。Ultralytics は、データアノテーション、実験追跡、クラウドベースのトレーニングのための広範なツールを提供し、定型処理を抽象化することで、エンジニアがモデルの性能に集中できるようにします。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
さらに、Ultralytics を TensorRT、CoreML、または OpenVINO へのエクスポートは単一のコマンドのみで実現できるのに対し、従来のリポジトリでは複雑なサードパーティ製ツールや手動でのグラフ操作が必須となるケースが少なくありません。
実際のユースケース
YOLOXを検討すべき時
YOLOXは、開発者が特定の分離されたtensor 中心に高度にカスタマイズされたC++推論パイプラインを既に構築している、特殊なレガシー展開において有効な選択肢であり続ける。さらに、2021年の最先端アーキテクチャとの比較研究を行う研究者らは、ベンチマークデータセットのベースラインとしてYOLOXを引き続き利用するだろう。
YOLO11 が優れている点
ほぼすべての現代的な生産シナリオにおいて、YOLO11 はるかに優れた体験YOLO11 :
- スマートシティと小売業: YOLO11 卓越した速度と精度のバランスにより、混雑したシーンを容易にYOLO11 、大規模なGPU 必要とせずに自動化された小売分析や交通管理システムを実現します。
- エッジコンピューティング:高いメモリ効率と堅牢なエクスポート機能により、YOLO11 Raspberry PiやNVIDIA プラットフォームなどのデバイスにおけるエッジAI展開にYOLO11 です。
- 複雑なパイプライン:プロジェクトが物体検出と姿勢キーポイント(例:スポーツ分析)の組み合わせや精密なインスタンスセグメンテーション(例:医療画像)を必要とする場合、YOLO11 単一の統合APIを通じて全てのタスクをネイティブにYOLO11
ユースケースと推奨事項
YOLO11 プロジェクトの具体的な要件、デプロイメントの制約、およびエコシステムの好みに依存します。
YOLO11を選択すべき時
YOLO11 以下に最適YOLO11 :
- 生産環境への導入: ラズベリーパイやNVIDIA などのデバイス上で動作する商用アプリケーションにおいて、信頼性と積極的なメンテナンスが最優先事項となる場合。
- マルチタスク視覚アプリケーション:単一の統合フレームワーク内で検出、セグメンテーション、姿勢推定、およびOBBを必要とするプロジェクト。
- 迅速なプロトタイピングとデプロイメント:データ収集から生産までを迅速に進める必要があるチーム向けに、Ultralytics Python 効率化されたインターフェースを提供します。
YOLOXを選択すべき時
YOLOXは以下の方におすすめです:
- アンカーフリー検出研究:YOLOXのクリーンなアンカーフリーアーキテクチャをベースラインとして、新たな検出ヘッドや損失関数の実験を行う学術研究。
- 超軽量エッジデバイス:マイクロコントローラーやレガシーモバイルハードウェアへの展開において、YOLOX-Nanoモデルの極めて小さなフットプリント(0.91Mパラメータ)が極めて重要となる。
- SimOTAラベル割り当て研究:最適輸送に基づくラベル割り当て戦略と、それが学習収束に与える影響を調査する研究プロジェクト。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
今後の展望: YOLO26の力
YOLO11 卓越した選択肢YOLO11 、AIの進化は絶えず加速している。効率性と安定性の絶対的な頂点を求めるチームにとって、 YOLO26 (2026年1月リリース)が新たなコンピュータビジョンプロジェクトにおける究極の推奨選択肢となります。
YOLO26はエンドツーエンドNMSを実現することで、飛躍的な進歩を遂げました。ノンマキシマムサプレッション(NMS)後処理を排除することで、遅延変動を完全に除去し、展開ロジックを劇的に簡素化しました。この概念は YOLOv10で初めて確立された概念です。
さらに、YOLO26はDFL除去(分布焦点損失)を搭載し、アーキテクチャを最適化することで CPU 最大43%高速化。これにより、低消費電力デバイスやエッジデバイスにおける圧倒的な性能を実現しています。 トレーニング安定性も、収束を加速するLLMに着想を得たSGD ハイブリッド手法であるMuSGDオプティマイザーによって大幅に向上。ProgLoss + STALなどの先進的な損失関数と組み合わせることで、YOLO26はドローン画像やIoTエッジセンサーといった困難な環境下における微小物体の検出に特に優れています。
さらなる探求
物体検出アーキテクチャの知識を拡充したいですか?YOLOのオープンボキャブラリ機能を探求するか、トランスフォーマーベースの RT-DETRUltralytics モデルを深く掘り下げましょう。
結論として、YOLOXが2021年に重要なアーキテクチャ概念を導入した一方で、YOLO11包括的なツールセット、メモリ効率、最先端の性能、そして特にYOLO26の革新的なアーキテクチャにより、Ultralytics 今日の研究者や企業開発者にとって明らかな選択肢となっている。