コンテンツにスキップ

YOLOX対YYOLO1111:研究と実世界応用をつなぐ

物体検出の急速に進化する分野において、適切なモデルを選択するには、最先端の研究と実用的な導入ニーズのバランスを取ることが求められる。本比較では、2021年に発表された高性能なアンカーフリー検出器であるYOLOXとYOLO11(Ultralytics 汎用性と堅牢性をUltralytics モデル)Ultralytics 。両モデルともYOLO 継ぐものの、アーキテクチャの設計思想、エコシステムサポート、使いやすさにおいて顕著な差異が見られる。

性能指標の比較

物体検出器を評価する際、平均精度(mAP)や推論速度といった主要指標が極めて重要である。下表は、YOLO11 新たなアーキテクチャが、特に速度と精度のトレードオフにおいて優れた効率性をYOLO11 示している。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

YOLOX:アンカーフリー進化

YOLO 導入された。検出ヘッドを簡素化し、事前定義されたアンカーボックスの必要性を排除することで、学術研究と産業応用との間のギャップを埋めることを目的とした。

主な特徴:

  • アンカーフリー設計:複雑なアンカーボックスのクラスタリングプロセスを排除し、トレーニングパイプラインを簡素化します。
  • 分離ヘッド:分類と回帰タスクを別々のブランチに分離し、収束速度と精度を向上させる。
  • SimOTA:陽性サンプルを動的に割り当てる高度なラベル割り当て戦略であり、学習の安定性を向上させる。

YOLOXは2021年に大きな前進をもたらしたが、その実装にはより複雑な設定が必要となることが多く、新しいフレームワークに見られるような統一されたマルチタスクサポートが欠けている。

YOLOXの詳細:

YOLO11:汎用性とエコシステムパワー

UltralyticsリリースしたYOLO11、先行モデルの成功を基盤とし、精度が高いだけでなく、驚くほど使いやすく導入も容易なモデルを実現しています。幅広いコンピュータービジョンタスクに対応する包括的なソリューションとして設計されています。

主な強み:

  • 使いやすさ: Ultralytics はそのシンプルさで知られています。データの読み込み、トレーニング、予測をわずか数行のコードで実行でき、開発者の参入障壁を大幅に低減します。
  • 健全に維持されたエコシステム: YOLO11 活発なメンテナンス、頻繁な更新、そして活発なコミュニティによってYOLO11 。これにより最新の PyTorch バージョンとの互換性と迅速なバグ修正を実現します。
  • 汎用性:主に物体検出器であるYOLOXとは異なり、YOLO11 インスタンスセグメンテーション姿勢推定分類、および向き付き境界ボックス(OBB)検出を含む複数のタスクをYOLO11 サポートする。
  • トレーニング効率: YOLO11 効率的なリソース使用のためにYOLO11 、Transformerベースの代替手法(例: RT-DETRなどのトランスフォーマーベースの代替手法と比較して、トレーニング中のメモリ使用量が少ない場合が多い。

YOLO11の詳細について。

YOLO11 :

ご存知でしたか?

最先端のエッジ性能を求めるなら、YOLO26をご覧ください。2026年1月にリリースされた本モデルは、ネイティブのエンドツーNMS設計、MuSGDオプティマイザーを搭載し、CPU 最大43%高速化。エッジAIの最適な選択肢です。

アーキテクチャの比較

YOLOXとYOLO11 のアーキテクチャ上の差異は、物体検出戦略の経時的な進化をYOLO11 。

YOLOX アーキテクチャ

YOLOXYOLOv5 と同様のCSPDarknetバックボーンYOLOv5 分離型ヘッド構造を導入している。 従来のYOLO では、分類と位置特定が結合された形で実行されていました。YOLOXはこれらを2つの独立した分岐に分割し、分類の信頼度と位置特定精度の間の矛盾を解決するのに役立ちます。そのアンカーフリー機構は物体検出を点回帰問題として扱うため、モデル設計を簡素化しますが、アンカーベースの手法と比較すると、非常に密な物体シナリオでは時に苦戦することがあります。

YOLO11アーキテクチャ

YOLO11 洗練されたバックボーンとネック構造YOLO11 、異なるスケールにわたる特徴抽出能力を強化しています。高度なモジュールを統合することで、空間的注意と特徴融合の精度を向上させています。Ultralytics 重要な利点は、エクスポート機能のシームレスな統合にあります。このアーキテクチャは、 ONNXTensorRTOpenVINOにより、トレーニング中に観察された高い精度がエッジデバイス上での効率的な推論に直接反映されることを保証します。

理想的なユースケース

これらのモデルの中から選択する際は、プロジェクトの具体的な要件によって決まることが多い。

YOLOXを選択すべき時

  • 研究の基準点:YOLOXは、アンカーフリー検出手法や分離ヘッドの改良に焦点を当てた学術研究における優れた参照点である。
  • レガシーシステム:Megviiのコードベースを基盤に構築された既存のパイプラインをお持ちの場合、または特定のニッチなデータセットに対してSimOTA割り当て戦略を特に必要とする場合。

YOLO11を選択すべき時

  • 迅速な開発:データセットからデプロイ済みモデルへの移行を迅速に行う必要がある場合、合理化されたUltralytics とPython 、YOLO11 優れたYOLO11 となります。
  • マルチタスク要件:単純な検出からセグメンテーション追跡へ拡張する可能性のあるプロジェクトは、YOLO11統一フレームワークの恩恵を受ける。
  • 実稼働環境への導入:小売、スマートシティ、セキュリティなどの商用アプリケーションにおいて、YOLO11 の堅牢なエクスポートサポートとコミュニティで実証された信頼性が導入リスクYOLO11 。
  • エッジコンピューティング:最適化されたバリエーションにより、YOLO11 ラズベリーパイやNVIDIA のようなリソース制約のあるデバイス上で非常に優れた性能YOLO11 。

コード比較:使いやすさ

トレーニングワークフローを比較すると、使いやすさの違いは顕著である。

Ultralytics YOLO11 でのトレーニング: Ultralytics は複雑さを抽象化し、データに集中できるようにします。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

YOLOXでのトレーニング: YOLOXでは通常、リポジトリのクローン作成、特定の環境設定、多数の引数を含むコマンドラインスクリプトによるトレーニングの実行が必要であり、Pythonワークフローでは直感的でない場合があります。

結論

YOLO11 優れた性能YOLO11 、コンピュータビジョン分野に大きく貢献してきた。YOLOXはアンカーベース手法の優位性に挑戦し、分離ヘッドといった重要な概念を導入した。しかし、今日の大半の開発者や企業にとって、 YOLO11 がより魅力的な選択肢を提供します。その高い性能汎用性、そして比類のないエコシステムの組み合わせが、現実世界のAIソリューション構築における実用的な選択肢となっています。

限界をさらに押し広げたい方、特にエッジ展開を検討されている方には、ぜひ YOLO26の検討を強く推奨します。エンドツーエンドNMS設計とディストリビューション焦点損失(DFL)の排除により、YOLO26は効率性と速度における次の飛躍を実現します。

その他の検討すべきモデル

  • YOLO26: Ultralytics 最新鋭モデルUltralytics 2026年1月)、NMS論と特化損失関数を特徴とする。
  • YOLOv8: YOLO において広く採用されている古典的手法であり、速度と精度のバランスに優れていることで知られる。
  • RT-DETR高精度を実現するトランスフォーマーベースの検出器。リアルタイム速度よりも精度が重視されるシナリオに最適です。
  • SAM :Metaのセグメント・エニシング・モデル。ゼロショットセグメンテーションタスクに最適。

コメント