Meet YOLO26: next-gen vision AI.

Link to this sectionモデル比較: プロジェクトに最適な物体検出モデルを選択#

適切なニューラルネットワークアーキテクチャの選択は、コンピュータービジョンプロジェクトを成功させるための基盤です。Ultralyticsモデル比較ハブへようこそ!このページでは、詳細な技術分析とパフォーマンスベンチマークを一元化し、最新のUltralytics YOLO26と、YOLO11、YOLOv10、RT-DETR、EfficientDetといった他の主要なアーキテクチャとの間のトレードオフを分析します。

アプリケーションがエッジAIのミリ秒単位のレイテンシを必要とする場合でも、医療用画像処理に求められる高精度な忠実度を必要とする場合でも、このガイドは情報に基づいた選択を行うために必要なデータ駆動型の洞察を提供します。モデルは、平均精度(mAP)推論速度、パラメータ効率、および導入の容易さに基づいて評価されます。

Link to this sectionインタラクティブなパフォーマンスベンチマーク#

速度と精度の関係を可視化することは、物体検出の「パレートフロンティア」、つまり特定の速度制限に対して最高の精度を提供するモデルを特定するために不可欠です。下のグラフは、COCOのような標準的なデータセットにおける主要なメトリクスを対比させています。

このグラフは、主要なパフォーマンスメトリクスを可視化しており、異なるモデル間のトレードオフを迅速に評価できます。これらのメトリクスを理解することは、特定のデプロイメント制約に適合するモデルを選択する上で不可欠です。

Link to this sectionクイック意思決定ガイド#

どこから始めればよいか迷っていますか?この決定ツリーを使用して、ハードウェアとパフォーマンスの要件に最適なアーキテクチャに絞り込んでください。

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

Link to this section現在の状況: YOLO26とその先#

物体検出の分野は急速に進化しています。古いモデルもレガシーサポートの観点からは依然として関連性がありますが、新しいアーキテクチャは可能性の限界を押し広げています。

Link to this sectionUltralytics YOLO26#

2026年1月にリリースされたYOLO26は、最新の最先端モデルであり、すべての新規プロジェクトの推奨出発点です。これは、Non-Maximum Suppression(NMS)のポストプロセッシングを不要にするEnd-to-End NMS-Free Designを含む画期的なアーキテクチャの革新を導入しており、より高速で予測可能な推論時間を実現します。YOLO26は前世代と比較してCPUで最大43%高速であり、エッジデプロイメントに最適です。

主な革新は以下の通りです:

  • NMS-Free End-to-End: ポストプロセッシング不要でデプロイメントを簡素化
  • DFL Removal: ONNX、TensorRT、CoreMLへのエクスポートを合理化
  • MuSGD Optimizer: LLMトレーニングに触発された、安定した収束のためのハイブリッドSGD/Muonオプティマイザ
  • ProgLoss + STAL: 小さな物体検出性能の向上
なぜYOLO26を選ぶのか?

YOLO26はUltralyticsエンジニアリングの頂点であり、CNNの効率性とTransformerのようなエンドツーエンドの能力を融合させています。検出、セグメンテーション、ポーズ推定、分類、OBBのすべてのタスクをサポートしつつ、従来よりも小さく、高速で、デプロイが容易になっています。

Link to this sectionUltralytics YOLO11#

YOLO11は依然として非常に有能なモデルであり、YOLOv8と比較してパラメータを22%削減しながら検出精度を向上させています。完全にサポートされており、実証済みの安定性が必要なユーザーや、既存のYOLO11パイプラインを持つユーザーに推奨されます。

Link to this sectionコミュニティモデル: YOLO12とYOLO13に関する注意点#

コミュニティの議論やリポジトリでYOLO12YOLO13への言及を見かけることがあるかもしれません。

プロダクションにおける注意点

現時点では、プロダクションでの使用においてYOLO12またはYOLO13を推奨しません

  • YOLO12: トレーニングの不安定性、過度なメモリ消費、およびCPU推論速度の著しい低下を引き起こすことが多いアテンションレイヤーを利用しています。
  • YOLO13: ベンチマークによると、YOLO11と比較して精度はわずかな向上にとどまる一方、より大きく低速です。報告されている結果には再現性の問題が見られます。


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

Link to this section詳細なモデル比較#

バックボーンの選択、ヘッド設計、損失関数などの具体的なアーキテクチャの違いを理解するために、詳細な技術比較をご覧ください。アクセスのしやすさを考慮して、モデルごとに整理しています:

Link to this sectionYOLO26 vs#

YOLO26は、NMSフリーのエンドツーエンド検出、MuSGDオプティマイザ、最大43%高速なCPU推論を特徴とする最新のUltralyticsモデルです。エッジデプロイメント向けに最適化されており、最先端の精度を達成しています。

Link to this sectionYOLO11 vs#

YOLO11は、最先端の研究を通じて前モデルの成功の上に構築されています。優れた特徴抽出のための改良されたバックボーンとネックアーキテクチャを特徴とし、効率が最適化されています。

Link to this sectionYOLOv10 vs#

清華大学によって開発されたYOLOv10は、レイテンシの変動を低減するためにNon-Maximum Suppression (NMS)ステップを削除することに重点を置いており、計算オーバーヘッドを削減しながら最先端のパフォーマンスを提供します。

Link to this sectionYOLOv9 vs#

YOLOv9は、ディープニューラルネットワークにおける情報損失に対処するために、Programmable Gradient Information(PGI)とGeneralized Efficient Layer Aggregation Network(GELAN)を導入しています。

Link to this sectionYOLOv8 vs#

Ultralytics YOLOv8は、高度なバックボーンとネックアーキテクチャ、および最適な精度と速度のトレードオフのためのアンカーフリーの分割ヘッドを備えており、依然として非常に人気のある選択肢です。

Link to this sectionYOLOv7 vs#

YOLOv7は、「trainable bag-of-freebies(学習可能な無料の工夫)」とモデルの再パラメータ化を導入し、推論コストを増加させずにトレーニングプロセスを最適化することに注力しています。

Link to this sectionYOLOv6 vs#

MeituanのYOLOv6は産業用途向けに設計されており、双方向連結(BiC)モジュールとアンカー支援型の学習戦略を備えています。

Link to this sectionYOLOv5 vs#

Ultralytics YOLOv5は、使いやすさ、安定性、そして速度において高く評価されています。幅広いデバイス互換性を必要とするプロジェクトにとって、依然として堅牢な選択肢です。

Link to this sectionRT-DETR vs#

RT-DETR(リアルタイム検出Transformer)は、Vision Transformerを活用して、グローバルなコンテキスト理解に優れ、高い精度とリアルタイムパフォーマンスを両立しています。

Link to this sectionPP-YOLOE+ vs#

Baiduによって開発されたPP-YOLOE+は、タスクアライメント学習(TAL)とデカップルヘッドを採用し、効率性と精度のバランスを図っています。

Link to this sectionDAMO-YOLO vs#

Alibaba GroupによるDAMO-YOLOは、ニューラルアーキテクチャ探索(NAS)と効率的なRepGFPNを採用しており、静的なベンチマークで精度を最大化します。

Link to this sectionYOLOX vs#

Megviiによって開発されたYOLOXは、アンカーフリーの進化系であり、デカップルヘッドとSimOTAラベル割り当て戦略で知られています。

Link to this sectionEfficientDet vs#

Google BrainによるEfficientDetは、コンパウンドスケーリングとBiFPNを使用してパラメータ効率を最適化しており、さまざまな制約に対応するモデルのスペクトル(D0-D7)を提供しています。

このインデックスは、新しいモデルのリリースやベンチマークの洗練に合わせて継続的に更新されます。次のコンピュータビジョンプロジェクトに最適なモデルを見つけるために、これらのリソースをぜひ活用してください。プライベートライセンスを含むエンタープライズグレードのソリューションをお探しの場合は、ライセンスページをご覧ください。比較検討をお楽しみください!

コメント