コンテンツにスキップ

YOLO11 .YOLOv10: リアルタイム物体検出における進化と革命の架け橋

コンピュータビジョンの世界は、急速な反復と画期的な飛躍によって特徴づけられる。 YOLO11 および YOLOv10 は、この進化における二つの異なる哲学を表している。YOLO11 確立された堅牢Ultralytics 最大限の汎用性と実運用準備態勢に向けてYOLO11 一方で、YOLOv10 NMSトレーニングといった革新的な概念YOLOv10 、その後YOLO26などの新モデルに影響を与えている。

この包括的な比較では、両モデルのアーキテクチャ上の決定事項、性能指標、および理想的なユースケースを探求し、開発者が次のコンピュータビジョンプロジェクトに最適なツールを選択する手助けをします。

パフォーマンス指標の概要

両モデルとも優れた性能を発揮しますが、推論パイプラインの異なる側面を優先しています。以下の表は標準データセットにおける主要な性能指標を示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

アーキテクチャの詳細

YOLO11:万能のパワーハウス

YOLO11Ultralytics リリースしたUltralytics 、広範な実世界テストの遺産に基づいて構築されています。特徴量の豊富さを追求して設計された強化されたバックボーンとネック構造を採用しており、物体検出だけでなく、インスタンスセグメンテーション姿勢推定といった複雑な下流タスクにおいても優れた性能を発揮します。

主要なアーキテクチャ機能は以下の通りです。

  • C3k2ブロック:勾配の流れとパラメータ効率を最適化する、CSPボトルネックブロックの改良版。
  • 空間的注意力の向上: 航空画像解析において極めて重要な要件である、小型または部分的に遮蔽された物体へのモデルの注目能力を強化します。
  • アンカーフリー設計:ハイパーパラメータ調整の複雑さを軽減し、多様なデータセットにおける汎化性能を向上させる。

YOLO11の詳細について。

YOLOv10: エンドツーエンドのパイオニア

YOLOv10清華大学の研究者らが開発したYOLOv10は、非最大抑制(NMS)後処理ステップの除去に焦点を当てたことで注目を集めた。このアーキテクチャの変更は、検出された物体の数に基づいてNMS 予測不能に変動する可能性のある、導入パイプラインにおける長年のボトルネックに対処するものである。

主なイノベーションは以下の通りです:

  • NMSトレーニング:トレーニング中に一貫した二重アサインメントを利用することで、モデルはオブジェクトごとに正確に1つのボックスを予測できるようになり、NMS の必要性を排除します。
  • 包括的な効率性と正確性を兼ね備えた設計:軽量な分類ヘッドと空間チャネル分離型ダウンサンプリングを採用したアーキテクチャにより、計算オーバーヘッドを低減。
  • ランクガイド型ブロック設計:モデルのステージを最適化し冗長性を削減、精度を損なうことなくFLOPsを低減します。

YOLOv10について詳しくはこちら

エコシステムと使いやすさ

生の指標は重要だが、開発者体験がプロジェクトの成否を左右することが多い。

Ultralyticsの利点

YOLO11 Ultralytics YOLO11 、企業および研究ワークフローに大きな利点を提供します:

  1. 統一API: Python 検出、セグメンテーション、分類、OBB、姿勢推定をサポートします。タスクの切り替えはモデルファイルを変更するだけで簡単に行えます。
  2. プラットフォーム統合: Ultralytics とシームレスに連携し、データセットの管理、トレーニング実行の可視化、エッジデバイスへのデプロイを実現します。
  3. エクスポート柔軟性:組み込みサポートによるエクスポート先 ONNXTensorRT、CoreML、OpenVINO エクスポートをOpenVINO 、あらゆるハードウェア上でモデルが効率的に動作OpenVINO 。

効率化されたワークフロー

Ultralytics を使用することで、定型コードの記述に費やす時間を削減し、ドメイン固有の問題解決に注力できます。最先端モデルをトレーニングするのに必要なのは、わずか数行のコードだけです。

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with minimal configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

YOLOv10

Ultralytics 、ユーザーは同じ便利な構文を活用できます。ただし学術的貢献であるため、Ultralytics 、タスク固有の更新(OBBや追跡性能の改善など)の頻度は低くなる可能性があります。NMS特定のレイテンシ優位性をもたらす純粋な検出タスクにおいて、優れた選択肢となります。

現実世界のアプリケーション

これらのモデル間の選択は、多くの場合、導入環境の具体的な制約によって決まります。

YOLO11の理想的なシナリオ

YOLO11、複雑で多面的な用途において最適な選択肢となります:

  • スマート小売: track (姿勢)と棚の在庫(検知)track 同時にtrack 、店舗レイアウトと在庫を最適化します。
  • 自律型ロボティクス: 方向性バウンディングボックス(OBB)を活用し、水平方向に完全に整列していない物体をロボットが把持できるようにする。
  • 農業:単純なバウンディングボックスでは不十分な葉上の作物病害を正確に特定するため、セグメンテーションモデルを展開する。

YOLOv10の理想的なシナリオ

YOLOv10 、後処理の遅延が重大なボトルネックとなる環境でYOLOv10 :

  • 高密度群衆カウント:数百の物体が存在するシナリオでは、NMS 処理速度が低下するNMS 。YOLOv10、物体の数にかかわらず一貫した速度を維持します。
  • 組込みシステム:後処理用のCPU が限られているデバイスにおいて、NMS の除去は貴重なリソースをNMS 。

結論: どのモデルを選ぶべきか?

YOLO11 大多数の開発者にとって、依然として最も堅牢なオールラウンダーです。速度、精度、そして複数のビジョンタスクへの対応力というバランス——包括的なUltralytics によって裏付けられた——が、商用展開において安全かつ強力な選択肢となっています。

YOLOv10 特定の検出専用ワークフローにおいて、NMS 排除が遅延安定性に顕著な利点NMS 場合に、有力な代替手段を提供する。

ただし、最先端を求める方にはYOLO26の検討をお勧めします。2026年1月にリリースされたYOLO26は、両方の長所を効果的に融合しています。YOLOv10 先駆けたエンドツーエンドNMS YOLOv10 YOLO11の豊富な機能、タスクの汎用性、エコシステムサポートを維持しています。MuSGDトレーニングDFL除去といった最適化により、YOLO26はエッジとクラウドの両展開において優れた性能を発揮します。

YOLO26についてさらに詳しく

その他の検討すべきモデル

  • YOLO26:Ultralytics による最新鋭モデルUltralytics 2026年1月)、NMSアーキテクチャとCPU 特徴とする。
  • YOLOv8: 信頼性と幅広い互換性で知られる、広く採用されている業界標準。
  • RT-DETR: 高精度を実現するトランスフォーマーベースの検出器。GPU 豊富なシナリオに最適です。
  • SAM : Metaのセグメント・エニシング・モデル。トレーニングデータが不足しているゼロショットセグメンテーションタスクに最適。

コメント