コンテンツにスキップ

モデル比較: プロジェクトに最適なオブジェクト検出モデルを選択する

適切なニューラルネットワークアーキテクチャの選択は、あらゆる成功したコンピュータービジョンプロジェクトの要です。Ultralyticsモデル比較ハブへようこそ!このページでは、最新のUltralytics YOLO26と、YOLO11、YOLOv10、RT-DETR、EfficientDetなどの主要なアーキテクチャとのトレードオフを詳細な技術分析と性能ベンチマークで比較検討しています。

アプリケーションがエッジAIのミリ秒単位のレイテンシを要求する場合でも、医用画像処理に求められる高精度を要求する場合でも、このガイドは情報に基づいた選択を行うために必要なデータ駆動型の洞察を提供します。モデルは、平均平均精度 (mAP)推論速度、パラメータ効率、およびデプロイの容易さに基づいて評価されます。

インタラクティブなパフォーマンスベンチマーク

速度と精度の関係を視覚化することは、オブジェクトdetectの「パレートフロンティア」、つまり特定の速度制約に対して最高の精度を提供するモデルを特定するために不可欠です。下のチャートは、COCOのような標準データセットにおける主要なメトリクスを比較しています。

このチャートは主要なパフォーマンスメトリクスを視覚化し、異なるモデル間のトレードオフを迅速に評価できるようにします。これらのメトリクスを理解することは、特定のデプロイ制約に合致するモデルを選択するための基本です。

クイック決定ガイド

どこから始めればよいかわからない場合、この決定木を使用して、ハードウェアとパフォーマンス要件に最も適したアーキテクチャを絞り込んでください。

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

現状:YOLO26とその先

オブジェクト検出の分野は急速に進化しています。古いモデルはレガシーサポートのために依然として関連性がありますが、新しいアーキテクチャは可能性の限界を押し広げています。

Ultralytics YOLO26

2026年1月にリリースされたYOLO26は、最新の最先端モデルであり、すべての新規プロジェクトに推奨される出発点です。これは、非最大抑制(NMS)の後処理を不要にするEnd-to-End NMS-Free Designを含む画期的なアーキテクチャ革新を導入しており、より高速で予測可能な推論時間を実現します。YOLO26は、以前の世代と比較してCPUで最大43%高速であり、エッジデプロイメントに最適です。

主なイノベーションは以下の通りです:

  • NMSフリーのエンドツーエンド: 後処理不要でデプロイメントを簡素化
  • DFLの削除: ONNX、TensorRT、CoreMLへのエクスポートを効率化
  • MuSGDオプティマイザ: LLMトレーニングにインスパイアされたハイブリッドSGD/Muonオプティマイザで安定した収束を実現
  • ProgLoss + STAL: 小物体 detect 性能の向上

YOLO26を選ぶ理由

YOLO26は、Ultralyticsエンジニアリングの頂点であり、CNNの効率性とトランスフォーマーのようなエンドツーエンド機能を兼ね備えています。detect、segment、姿勢推定、分類、およびobbといったすべてのタスクをサポートし、これまで以上に小型で高速、かつデプロイが容易です。

Ultralytics YOLO11

YOLO11は、YOLOv8と比較してパラメータを22%削減しつつ、detect精度を向上させた、非常に高性能なモデルです。実績のある安定性を求めるユーザーや、既存のYOLO11パイプラインを持つユーザーに完全にサポートされ、推奨されています。

コミュニティモデル: YOLO12とYOLO13に関する注意点

コミュニティの議論やリポジトリで、YOLO12YOLO13への言及を見かけるかもしれません。

本番環境での注意

現在、YOLO12またはYOLO13の本番環境での使用は推奨していません

  • YOLO12: アテンションレイヤーを利用していますが、これはしばしば学習の不安定性、過剰なメモリ消費、および大幅なCPU推論速度の低下を引き起こします。
  • YOLO13: ベンチマークでは、YOLO11と比較して精度がわずかに向上するものの、モデルはより大きく、より低速であることが示されています。報告された結果には再現性の問題が見られます。



見る: YOLOモデル比較:Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

詳細なモデル比較

バックボーンの選択、ヘッドの設計、損失関数など、特定のアーキテクチャの違いを理解するために、詳細な技術比較をご覧ください。アクセスしやすいようにモデルごとに整理しました。

YOLO26 vs

YOLO26は、NMSフリーのエンドツーエンド detect、MuSGDオプティマイザ、および最大43%高速なCPU推論を特徴とする最新のUltralyticsモデルです。最先端の精度を達成しつつ、エッジデプロイメント向けに最適化されています。

YOLO11 vs

YOLO11は、最先端の研究に基づき、その前身モデルの成功の上に構築されています。特徴抽出の改善と効率の最適化のために、改良されたバックボーンおよびネックアーキテクチャを備えています。

YOLOv10 vs

清華大学によって開発されたYOLOv10は、Non-Maximum Suppression (NMS)ステップの除去に焦点を当て、レイテンシのばらつきを低減し、計算オーバーヘッドを削減しながら最先端のパフォーマンスを提供します。

YOLOv9 vs

YOLOv9は、ディープニューラルネットワークにおける情報損失に対処するため、Programmable Gradient Information (PGI) と Generalized Efficient Layer Aggregation Network (GELAN) を導入しています。

YOLOv8 vs

Ultralytics YOLOv8は依然として非常に人気のある選択肢であり、高度なバックボーンおよびネックアーキテクチャと、最適な精度と速度のトレードオフを実現するアンカーフリーの分割ヘッドを特徴としています。

YOLOv7 vs

YOLOv7は、「trainable bag-of-freebies」とモデルの再パラメータ化を導入し、推論コストを増大させることなくトレーニングプロセスの最適化に焦点を当てています。

YOLOv6 vs

MeituanのYOLOv6は、産業用アプリケーション向けに設計されており、双方向連結 (BiC) モジュールとアンカー補助型トレーニング戦略を特徴としています。

YOLOv5 vs

Ultralytics YOLOv5は、その使いやすさ、安定性、および速度で高く評価されています。幅広いデバイス互換性を必要とするプロジェクトにとって、依然として堅牢な選択肢です。

RT-DETR vs

RT-DETR (Real-Time Detection Transformer) はビジョントランスフォーマーを活用し、リアルタイム性能で高精度を達成し、グローバルな文脈理解に優れています。

PP-YOLOE+ vs

Baiduが開発したPP-YOLOE+は、効率と精度のバランスを取るために、Task Alignment Learning (TAL) とデカップルドヘッドを使用しています。

DAMO-YOLO vs

Alibaba GroupのDAMO-YOLOは、静的ベンチマークでの精度を最大化するために、ニューラルアーキテクチャ探索 (NAS) と効率的なRepGFPNを採用しています。

YOLOX vs

Megviiが開発したYOLOXは、デカップルドヘッドとSimOTAラベル割り当て戦略で知られるアンカーフリーの進化形です。

EfficientDet vs

Google BrainのEfficientDetは、パラメータ効率を最適化するために複合スケーリングとBiFPNを使用し、さまざまな制約に対応するモデルのスペクトル (D0-D7) を提供しています。

このインデックスは、新しいモデルがリリースされ、ベンチマークが改良されるにつれて継続的に更新されます。次のコンピュータービジョンプロジェクトに最適なものを見つけるために、これらのリソースをぜひご活用ください。プライベートライセンス付きのエンタープライズグレードのソリューションをお探しの方は、ライセンスページをご覧ください。比較をお楽しみください!


コメント