モデル比較: プロジェクトに最適な物体検出モデルの選択

適切なニューラルネットワークアーキテクチャの選択は、あらゆる コンピュータビジョン プロジェクトを成功させるための礎です。Ultralytics Model Comparison Hub へようこそ!このページでは、最新の Ultralytics YOLO26 と、YOLO11、YOLOv10、RT-DETR、EfficientDet といった他の主要なアーキテクチャとのトレードオフを詳細に技術分析・ベンチマークし、集約しています。

アプリケーションが エッジAI のミリ秒単位のレイテンシを必要とする場合でも、医療画像診断に必要な高精度の忠実度を求める場合でも、このガイドは情報に基づいた選択を行うために必要なデータ駆動型のインサイトを提供します。ここでは、平均精度(mAP)推論速度、パラメータ効率、およびデプロイの容易さに基づいてモデルを評価します。

インタラクティブなパフォーマンスベンチマーク

速度と精度の関係を視覚化することは、物体検出における「パレートフロンティア」、つまり特定の速度制限に対して最高の精度を提供するモデルを特定するために不可欠です。以下のチャートは、COCOのような標準データセット における主要なメトリクスを対比させたものです。

This chart visualizes key performance metrics enabling you to quickly assess the trade-offs between different models. Understanding these metrics is fundamental to selecting a model that aligns with your specific deployment constraints.

クイック決定ガイド

どこから始めればよいか迷っていますか?この決定木を使用して、ハードウェアとパフォーマンスの要件に最も適したアーキテクチャに絞り込んでください。

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

現在の状況: YOLO26 とその先へ

物体検出の分野は急速に進化しています。古いモデルはレガシーサポートの面で依然として重要ですが、新しいアーキテクチャは可能性の境界を押し広げています。

Ultralytics YOLO26

2026年1月にリリースされた YOLO26 は、最新の最先端モデルであり、すべての新規プロジェクトにおける推奨の出発点です。Non-Maximum Suppression(NMS)のポストプロセッシングを不要にする End-to-End NMS-Free Design を含む画期的なアーキテクチャの革新を導入しており、より高速で予測可能な推論時間を実現します。YOLO26 は前世代と比較して CPUで最大43%高速化 されており、エッジへのデプロイに最適です。

主な革新点は以下の通りです:

  • NMS-Free End-to-End: ポストプロセッシングが不要で、デプロイが簡素化されています
  • DFL Removal: ONNX、TensorRT、CoreML へのエクスポートを最適化
  • MuSGD Optimizer: LLMの学習から着想を得た、安定した収束のためのハイブリッド SGD/Muon オプティマイザ
  • ProgLoss + STAL: 小物体検出性能の強化
なぜ YOLO26 を選ぶのか?

YOLO26 は Ultralytics エンジニアリングの頂点であり、CNN の効率性と Transformer のようなエンドツーエンドの機能を融合させたモデルです。検出、セグメンテーション、ポーズ推定、分類、OBB といったすべてのタスクをサポートしつつ、従来よりも小型、高速で、かつデプロイが容易になっています。

Ultralytics YOLO11

YOLO11 は依然として非常に有能なモデルであり、YOLOv8 と比較してパラメータを22%削減しながら、検出精度を向上させています。実績のある安定性が必要なユーザーや、既存の YOLO11 パイプラインを運用しているユーザーに完全にサポートされており、推奨されます。

コミュニティモデル: YOLO12 および YOLO13 に関する注記

コミュニティの議論やリポジトリで YOLO12YOLO13 に関する言及を見かけることがあるかもしれません。

本番環境での注意

現時点では、本番環境での利用において YOLO12 または YOLO13 を 推奨しません

  • YOLO12: 注意層を利用していますが、学習の不安定性、過剰なメモリ消費、および CPU 推論速度の大幅な低下を招くことがよくあります。
  • YOLO13: ベンチマークによると、YOLO11 と比較して精度の向上はわずかであるにもかかわらず、より大きく低速です。報告された結果には再現性に問題があることが示されています。


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

詳細なモデル比較

バックボーンの選択、ヘッド設計、損失関数など、具体的なアーキテクチャの違いを理解するために、詳細な技術比較をご覧ください。アクセスのしやすさを考慮し、モデルごとに整理しています:

YOLO26 vs

YOLO26 は、NMSフリーのエンドツーエンド検出、MuSGD オプティマイザ、および CPU 推論の最大43%高速化を実現した最新の Ultralytics モデルです。最先端の精度を維持しながら、エッジへのデプロイに最適化されています。

YOLO11 vs

YOLO11 は、前任モデルの成功を基盤とし、最先端の研究を取り入れています。特徴抽出を改善し、効率を最適化するための改良されたバックボーンおよびネックアーキテクチャを備えています。

YOLOv10 vs

清華大学によって開発された YOLOv10 は、レイテンシの変動を抑えるために 非最大値抑制(NMS) ステップを削除することに重点を置いており、計算オーバーヘッドを削減しながら最先端のパフォーマンスを提供します。

YOLOv9 vs

YOLOv9 は、深層ニューラルネットワークにおける情報損失に対処するために、プログラマブル勾配情報(PGI)と一般化効率層集約ネットワーク(GELAN)を導入しています。

YOLOv8 vs

Ultralytics YOLOv8 は、高度なバックボーンおよびネックアーキテクチャと、最適な精度と速度のトレードオフを実現するアンカーフリー分割ヘッドを備え、依然として非常に人気のある選択肢です。

YOLOv7 vs

YOLOv7は「trainable bag-of-freebies(学習可能な無料の特典)」とモデルの再パラメータ化を導入し、推論コストを増加させることなくトレーニングプロセスの最適化に注力しています。

YOLOv6 vs

MeituanのYOLOv6は産業用途向けに設計されており、Bi-directional Concatenation (BiC) モジュールとアンカーを活用したトレーニング戦略を特徴としています。

YOLOv5 vs

Ultralytics YOLOv5は、その使いやすさ、安定性、そしてスピードで高く評価されています。幅広いデバイス互換性を必要とするプロジェクトにおいて、堅牢な選択肢であり続けています。

RT-DETR vs

RT-DETR (Real-Time Detection Transformer) は、Transformerを利用して高い精度とリアルタイム性を実現し、グローバルなコンテキスト理解において優れた能力を発揮します。

PP-YOLOE+ vs

Baiduによって開発されたPP-YOLOE+は、Task Alignment Learning (TAL) とデカップルドヘッドを採用し、効率性と精度のバランスを最適化しています。

DAMO-YOLO vs

Alibaba GroupによるDAMO-YOLOは、Neural Architecture Search (NAS) と効率的なRepGFPNを採用し、静的なベンチマークにおける精度を最大化しています。

YOLOX vs

Megviiによって開発されたYOLOXは、アンカーフリーの進化モデルであり、デカップルドヘッドとSimOTAラベル割り当て戦略で知られています。

EfficientDet vs

Google BrainによるEfficientDetは、コンパウンドスケーリングとBiFPNを使用してパラメータ効率を最適化し、さまざまな制約に対応する多様なモデルラインナップ(D0-D7)を提供しています。

このインデックスは、新しいモデルのリリースやベンチマークの更新に合わせて継続的に更新されます。次のコンピュータビジョンプロジェクトに最適なモデルを見つけるために、これらのリソースをぜひご活用ください。商用利用が可能なエンタープライズ向けのソリューションをお探しの場合は、ライセンスページをご覧ください。比較検討にお役立てください!

コメント