コンテンツにスキップ

YOLO YOLO11:包括的な技術比較

次回のコンピュータビジョンプロジェクトでリアルタイム物体検出アーキテクチャを選択する際、主要モデル間の微妙な差異を理解することが極めて重要です。本総合ガイドでは、YOLO Ultralytics YOLO11比較する詳細な技術分析を提供し、両モデルのアーキテクチャ、性能指標、トレーニング手法、および理想的な実環境展開シナリオを探求します。

YOLO :
著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
組織:Alibaba Group 日付: 2022-11-23
Arxiv:2211.15444v2
GitHub:YOLO
ドキュメント:YOLO

YOLO11 :
著者: Glenn Jocher と Jing Qiu
組織: Ultralytics
日付: 2024-09-27
GitHub:ultralytics
ドキュメント:YOLO11

建築設計の理念

物体検出モデルの基盤となるアーキテクチャは、その推論速度、精度、および様々なハードウェア環境における適応性を決定する。

YOLOいくつかの学術的革新を導入し、バックボーンの自動設計にニューラルアーキテクチャ検索(NAS)を多用している。効率的なRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)を用いて特徴融合を強化し、従来のアーキテクチャで頻繁に見られた重い予測ヘッドを大幅に縮小するZeroHead設計を採用している。 このNAS駆動型アプローチYOLO 特定GPUで効率化を達成YOLO 一方、生成されるアーキテクチャは多様なエッジデバイス間でシームレスに汎化するために必要な柔軟性を欠く場合がある。

対照的に、 YOLO11 は、長年にわたる基礎研究を基盤として構築され、高度に最適化された手作業によるアーキテクチャを実現しています。合理化されたバックボーンと、冗長な計算を削減する高効率なネックに焦点を当てています。YOLO11 主な利点の一つは、洗練されたパラメータYOLO11 。Transformerベースのモデル(例: RT-DETRのようなトランスフォーマーベースのモデルに典型的な重いVRAM要件なしに高い特徴表現を実現します。YOLO11 汎用性YOLO11 、コンシューマー向けGPU、モバイルデバイス、専用エッジアクセラレータ上でスムーズに動作します。

パフォーマンスとメトリクス

性能評価には、表面的な精度だけでなく、速度、モデルサイズ、計算負荷(FLOPs)のバランスを考慮する必要がある。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

表が示すように、YOLO11 良好な性能バランスYOLO11 。 YOLO11s 例えば、バリアントは DAMO-YOLOs 精度を維持しながら、パラメータのフットプリントを大幅に縮小します。このメモリ要件の削減は、直接的にデプロイメントコストの低減とエッジデバイス上でのより俊敏なパフォーマンスにつながります。

YOLO11の詳細について。

トレーニング方法論とユーザビリティ

トレーニングパイプラインは開発者が大半の時間を費やす場所であり、トレーニング効率は最重要課題である。

YOLO 知識蒸留に大きく依存した多段階トレーニングプロセスをYOLO 。ラベル割り当てにはAlignedOTA(最適輸送割り当て)を利用し、知識を蒸留して小型の「生徒」モデルへ転移させるため、より大規模な「教師」モデルのトレーニングを必要とする場合が多い。このCUDA 大幅に増加させ、最適な収束を達成するために必要な全体的な計算時間を増加させる。

一方、Ultralytics モデルトレーニングの複雑さを抽象化します。YOLO11 卓越した使いやすさを追求してYOLO11 、合理化Python 包括的なCLI 備えています。これによりエンジニアは単一のコマンドでカスタムデータセットのトレーニングを開始できます。トレーニングパイプラインは本質的にリソース効率に優れ、メモリ使用量の急増を最小限に抑えるため、大規模なモデルでも標準的なハードウェア上でトレーニングが可能です。

Ultralyticsによる効率化されたトレーニング

Ultralytics トレーニングには、一切の定型コードが不要です。組み込みのデータ読み込み、拡張、損失計算のパイプラインは、最初から完全に最適化されています。

Ultralytics トレーニングとデプロイがいかに簡単かを示す簡単な例を以下に示します:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX for seamless deployment
model.export(format="onnx")

YOLO11の詳細について。

実世界での応用と汎用性

これらのアーキテクチャの選択は、多くの場合、導入環境で必要とされるタスクの幅によって決まります。

DAMO-YOLOの適合性

YOLO 純粋な物体検出フレームワークYOLO 。研究チームが再パラメータ化を探求したり、特定のニューラルアーキテクチャ探索(NAS)実験を再現したりする学術研究環境において特に優れている。また、NASが生成したバックボーンと完全に一致する特定のGPU 使用される、制約の厳しい産業環境での展開も可能である。

Ultralyticsの利点

Ultralytics (YOLO11を含むUltralytics 、比類のない汎用性と整備されたエコシステムにより、実世界の商用アプリケーションで真価を発揮します。YOLOとは異なり、Ultralytics マルチモーダルタスクをネイティブにサポートします。医療画像におけるインスタンスセグメンテーションから、スポーツ分野のバイオメカニクス解析のための姿勢推定まで、単一の統合コードベースで全てを処理します。

YOLO11 を活用している産業にはYOLO11 :

ユースケースと推奨事項

YOLO11 YOLO プロジェクトの具体的な要件、デプロイメントの制約、およびエコシステムの好みにYOLO11 。

DAMO-YOLOを選択するタイミング

YOLO 以下に最適YOLO :

  • 高スループット動画解析:固定NVIDIA GPU 上で高FPS動画ストリームを処理し、バッチ1スループットを主要指標とする。
  • 産業用製造ライン:専用ハードウェア上でGPU 厳しい制約があるシナリオ。例:組立ラインにおけるリアルタイム品質検査。
  • ニューラルアーキテクチャ探索研究:自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化バックボーンが検出性能に及ぼす影響の検討。

YOLO11を選択すべき時

YOLO11 以下に推奨YOLO11 :

  • 生産環境への導入: ラズベリーパイNVIDIA などのデバイス上で動作する商用アプリケーションにおいて、信頼性と積極的なメンテナンスが最優先事項となる場合。
  • マルチタスク視覚アプリケーション:単一の統合フレームワーク内で検出セグメンテーション姿勢推定、およびOBBを必要とするプロジェクト。
  • 迅速なプロトタイピングとデプロイメント:データ収集から生産までを迅速に進める必要があるチーム向けに、Ultralytics Python 効率化されたインターフェースを提供します。

Ultralytics YOLO26)を選択すべきタイミング

ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:

  • NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
  • CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
  • 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。

次世代:YOLO26のご紹介

YOLO11 強力で信頼性の高い選択肢ですが、コンピュータビジョンの分野は急速に進化しています。新規プロジェクトを開始する開発者にとって、最新の YOLO26 モデルが新たな最先端技術を表しています。

2026年1月にリリースされたYOLO26は、いくつかの画期的な進歩をもたらします:

  • エンドツーエンドNMS:非最大抑制(NMS)後処理を排除することで、YOLO26はより高速で決定論的な推論時間を実現し、デプロイメントパイプラインを劇的に簡素化します。
  • 最大43%高速CPU :分布焦点損失(DFL)の除去により、専用GPUを持たないエッジデバイスや低消費電力デバイスに極めて適したモデルです。
  • MuSGDオプティマイザー:大規模言語モデル(LLM)のトレーニング革新(Moonshot AIに着想を得た)を統合したこのハイブリッドオプティマイザーは、トレーニング中の安定した高速収束を保証します。
  • 高度な損失関数:ProgLossとSTALを活用することで、YOLO26は航空画像やロボティクスにおいて重要な小型物体認識において顕著な改善を示す。

YOLO26についてさらに詳しく

結論

YOLO11 、高速かつ正確なコンピュータビジョンの進歩に大きくYOLO11 YOLO アーキテクチャ探索とディスティレーションに関する興味深い学術的知見YOLO 一方で、Ultralytics YOLO11 および画期的なYOLO26)は優れた開発者体験を提供する。

メモリ要件の低さ、充実したドキュメント、マルチタスク機能、そして強力なUltralytics との統合により、Ultralytics 堅牢でスケーラブルなAIソリューション構築を目指す研究者や企業エンジニアにとって、依然として最上位の推奨選択肢です。他の先進的アーキテクチャを検討している方にとって、YOLO26とRT-DETR比較は、トランスフォーマーベースの代替案に関するさらなる知見を提供します。


コメント