コンテンツにスキップ

モデル比較: プロジェクトに最適なオブジェクト検出モデルを選択する

適切なニューラルネットワークアーキテクチャを選択することは、コンピュータビジョンプロジェクトを成功させるための基礎となります。Ultralytics モデル比較ハブへようこそ!このページでは、詳細な技術分析と性能ベンチマークを一元化し、最新の Ultralytics YOLO11と、YOLOv10、RT-DETR、EfficientDetのような他の主要なアーキテクチャとのトレードオフを解剖しています。

エッジAIのミリ秒単位のレイテンシーが要求されるアプリケーションであれ、医療用画像処理に要求される忠実度の高い精度が要求されるアプリケーションであれ、本ガイドは十分な情報に基づいた選択を行うために必要なデータ駆動型の洞察を提供します。平均平均精度(mAP)推論速度、パラメータ効率、および導入の容易さに基づいてモデルを評価します。

インタラクティブ・パフォーマンス・ベンチマーク

速度と精度の関係を視覚化することは、与えられた速度制約に対して最高の精度を提供する物体検出モデルの「パレートフロンティア」を特定するために不可欠です。下のチャートは、 COCOような標準的なデータセットにおける主要な指標を対比したものです。

このチャートは、主要なパフォーマンス指標を視覚化し、異なるモデル間のトレードオフを迅速に評価できるようにします。これらのメトリクスを理解することは、特定の展開制約に沿ったモデルを選択するための基本です。

即決ガイド

何から始めたらよいかわからない?このデシジョンツリーを使って、ハードウェアとパフォーマンスの要件に最適なアーキテクチャを絞り込んでください。

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO11n / YOLO11s]
    C -- "Balanced Legacy" --> F[YOLOv5s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO11x / RT-DETR-X]
    D -- "Balanced Performance" --> H[YOLO11m / YOLO11l]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO11 / YOLOv8]
    I -- "Video Analytics" --> L[YOLO11 + Tracking]

現在の状況:YOLO11 その後

物体検出の分野は急速に進歩している。古いモデルがレガシー・サポートに関連する一方で、新しいアーキテクチャが可能性の限界を押し広げている。

Ultralytics YOLO11

最新の安定版として YOLO11は新しいプロジェクトの出発点として推奨される。特徴抽出機能の強化や計算グラフの最適化など、旧バージョンと比較してアーキテクチャが大幅に改善されている。検出、セグメンテーション、ポーズ推定、分類、OBB(Oriented Bounding Boxes)といった一連のタスクを、単一の統一されたフレームワークでサポートしている。

YOLO11選ぶ理由

YOLO11 Ultralytics エンジニアリングの最高峰であり、実世界のアプリケーションにスピードと精度の最高のバランスを提供します。YOLO11はUltralyticsのエコシステムによって完全にサポートされ、長期的なメンテナンスと互換性を保証します。

コミュニティ・モデルYOLO12とYOLO13についてのメモ

コミュニティの議論やリポジトリでYOLO12や YOLO13に言及することがあるかもしれない。

製造上の注意

現在のところ、YOLO12やYOLO13を本番で使用することは推奨していない

  • YOLO12:アテンションレイヤーを使用するため、トレーニングが不安定になり、メモリを過剰に消費し、CPU 推論速度が著しく低下する。
  • YOLO13:ベンチマークによると、YOLO11 精度がわずかに向上しただけで、より大きく、より遅い。報告された結果は、再現性に問題があることを示している。

先を見据えてYOLO26とUltralytics

Ultralytics 、2025年後半のオープンソースリリースを目標に、YOLO26を積極的に開発している。この次世代モデルは、YOLO11 すべてのタスクをサポートしながら、より小さく、より速く、ネイティブなエンドツーエンドを目指します。さらに2026年には、Ultralytics 、データソーシング、自動アノテーション、クラウドトレーニングのための包括的なSaaSソリューションとして登場し、MLOpsのライフサイクル全体を簡素化する予定です。



見る: YOLO モデルの比較:Ultralytics YOLO11 vs.YOLOv10 vs.YOLOv9 vs.Ultralytics YOLOv8 🎉.

詳細モデルの比較

バックボーンの選択、ヘッドの設計、損失関数など、具体的な構造の違いを理解するために、詳細な技術比較をご覧ください。簡単にアクセスできるよう、モデル別に整理しました:

YOLO11 vs

YOLO11 、前作の成功に最先端の研究を加えたものである。より優れた特徴抽出と最適化された効率のために、バックボーンとネック・アーキテクチャが改良されている。

YOLOv10

清華大学によって開発されたYOLOv10 、レイテンシのばらつきを減らすためにNMS(Non-Maximum Suppression)ステップを削除することに重点を置き、計算オーバーヘッドを減らしながら最先端の性能を提供する。

YOLOv9

YOLOv9 、ディープニューラルネットワークにおける情報損失に対処するために、プログラム可能な勾配情報(PGI)と一般化された効率的なレイヤー集約ネットワーク(GELAN)を導入している。

YOLOv8 vs

Ultralytics YOLOv8 、先進的なバックボーンとネック構造、そして精度とスピードのトレードオフを最適化するアンカーフリーのスプリットヘッドを特徴とし、依然として高い人気を誇っている。

YOLOv7

YOLOv7 、"訓練可能なフリーバイオバッグ "とモデルの再パラメータ化を導入し、推論コストを増加させることなく訓練プロセスを最適化することに焦点を当てた。

YOLOv6

MeituanのYOLOv6 6は、双方向コンカチネーション(BiC)モジュールとアンカー支援トレーニングストラテジーを特徴とする産業用アプリケーション向けに設計されている。

YOLOv5 vs

Ultralytics YOLOv5 5は、その使いやすさ、安定性、スピードで高く評価されています。幅広いデバイスの互換性を必要とするプロジェクトにとって、強力な選択肢であり続けています。

RT-DETR vs

RT-DETR Detection Transformer)は、ビジョントランスフォーマーを活用し、グローバルなコンテキスト理解に優れたリアルタイム性能で高精度を実現します。

PP-YOLOE+ vs

バイドゥが開発したPP-YOLOE+は、タスク・アライメント・ラーニング(TAL)と非連結ヘッドを使用し、効率と精度のバランスを取っている。

DAMO-YOLO vs

アリババ・グループのDAMO-YOLO 、静的ベンチマークで精度を最大化するために、ニューラル・アーキテクチャ・サーチ(NAS)と効率的なRepGFPNを採用している。

YOLOX vs

Megviiによって開発されたYOLOXは、アンカーフリー進化であり、非結合ヘッドとSimOTAラベル割り当て戦略で知られている。

EfficientDet vs

Google BrainのEfficientDetは、複合スケーリングとBiFPNを使用してパラメータ効率を最適化し、さまざまな制約に対応するさまざまなモデル(D0~D7)を提供します。

このインデックスは、新しいモデルのリリースやベンチマークの改良に伴い、継続的に更新されます。あなたの次のコンピュータビジョンプロジェクトに最適なリソースを見つけるために、これらのリソースを探索することをお勧めします。プライベートライセンスのエンタープライズグレードのソリューションをお探しの場合は、ライセンスのページをご覧ください。ハッピー比較!


コメント