YOLO11 YOLO:次世代物体検出器の比較
最適なアーキテクチャの選択は、あらゆるコンピュータビジョンプロジェクトにおいて重要なステップです。この技術ガイドでは、2つの強力な物体検出モデルを包括的に比較します: Ultralytics YOLO11YOLO包括的に比較します。各モデルのアーキテクチャ上の革新点、トレーニング手法、実世界での適用可能性を詳細に検証し、導入ニーズに最適なツールの選択を支援します。
モデルの概要
Ultralytics YOLO11
UltralUltralyticsのチームによって開発された、 YOLO11YOLO の高度に洗練された進化形であり、精度と効率の両面を大幅に最適化しています。データセット管理からエッジデプロイメントまでをカバーする、統一された実運用可能なエコシステムを求める研究者やエンジニア向けに設計されています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- ドキュメント:https://docs.ultralytics.com/models/yolo11/
YOLO11 はその汎用性でYOLO11 。多くの従来モデルがバウンディングボックスのみに焦点を当てる中、YOLO11 オブジェクト検出、インスタンスセグメンテーション、画像分類、姿勢推定を YOLO11 サポートする。このマルチモーダル機能により、開発者はビジョンAIパイプラインを単一の、よく管理されたフレームワークに統合できる。
DAMO-YOLO
YOLOアリババグループの研究者によって開発されました。ニューラルアーキテクチャ検索(NAS)を活用し、GPUやその他のアクセラレータ上でのリアルタイム推論に特化した高効率なバックボーンを発見します。
- 著者: Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang、Xiuyu Sun
- 組織:Alibaba Group
- 日付: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
- ドキュメント:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
YOLO の中核となる哲学は、反復パラメータ化と自動探索にYOLO 。MAE-NAS(多目的進化型ニューラルアーキテクチャ探索)を活用することで、著者らは専用ハードウェア上での推論速度を大幅に向上させるカスタムバックボーンを設計した。さらに、遅延を最小化するため、高度に最適化された「効率的なRepGFPN」と呼ばれるネック部と簡素化されたZeroHead構造を組み込んでいる。
検討すべきその他のモデル
YOLO11 YOLO比較する際は、よりUltralytics も検討してみてください。ネイティブでエンドツーエンドNMS推論を導入し、CPU 最大43%高速化します。YOLOXや YOLOv8との比較も検討してみてください。
性能とアーキテクチャの比較
エッジAIアプリケーションを展開する際には、性能のトレードオフを理解することが極めて重要です。以下の表は、平均精度(mAP)、レイテンシ、計算量といった主要な指標をまとめたものです。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
アーキテクチャの詳細
YOLO11 パラメータ数と表現能力のバランスを完璧に保つ、高効率なカスタム設計のバックボーンに依存しています。多様なハードウェア環境で最適に動作するよう設計されており、トレーニング時と推論時双方において最小限CUDA でネイティブに優れた性能を発揮します。これにより、標準的なコンシューマー向けハードウェアやリソース制約のあるIoTデバイスにとって、卓越した選択肢となります。
一方、YOLO生成するバックボーンYOLO、GPU 微調整されている。その効率的なRepGFPN(一般化特徴ピラミッドネットワーク)は、複数のスケールを積極的に統合する。しかし、Repパラメータ化は推論を高速化する一方で、ハードウェアスタックがこれらの操作を明示的に十分にサポートしていない場合、デプロイプロセスを複雑化する可能性がある。
ユーザビリティとトレーニング効率
開発時間を考慮に入れると、モデルの使いやすさは、その生のベンチマーク値と同様に重要となる。
YOLO11 開発者アクセシビリティの原則を強く基盤として構築されています。包括的な ultralytics パッケージは、データセットの解析、拡張、ハイパーパラメータ調整といった面倒な作業を抽象化します。モデルを本番環境向けフォーマット(例:)へエクスポートします。 ONNX, TensorRT、および OpenVINO たった1つのコマンドだけで済みます。
from ultralytics import YOLO
# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")
# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)
学術研究を基盤YOLO、習得曲線がより急峻です。その最高精度を達成するには、複雑な知識蒸留パイプラインが必要となることが多く、つまりまず巨大な「教師」ネットワークを訓練し、その知識を小規模な「生徒」ネットワークに伝達しなければなりません。これにより、Ultralytics 訓練ループと比較して、GPU と全体の訓練期間が大幅に膨れ上がります。
ユースケースと推奨事項
YOLO YOLO11 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの選好によってYOLO 。
YOLO11を選択すべき時
YOLO11 以下に最適YOLO11 :
- 生産環境への導入: ラズベリーパイやNVIDIA などのデバイス上で動作する商用アプリケーションにおいて、信頼性と積極的なメンテナンスが最優先事項となる場合。
- マルチタスク視覚アプリケーション:単一の統合フレームワーク内で検出、セグメンテーション、姿勢推定、およびOBBを必要とするプロジェクト。
- 迅速なプロトタイピングとデプロイメント:データ収集から生産までを迅速に進める必要があるチーム向けに、Ultralytics Python 効率化されたインターフェースを提供します。
DAMO-YOLOを選択するタイミング
YOLO 以下の方におすすめYOLO :
- 高スループット動画解析:固定NVIDIA GPU 上で高FPS動画ストリームを処理し、バッチ1スループットを主要指標とする。
- 産業用製造ライン:専用ハードウェア上でGPU 厳しい制約があるシナリオ。例:組立ラインにおけるリアルタイム品質検査。
- ニューラルアーキテクチャ探索研究:自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化バックボーンが検出性能に及ぼす影響の検討。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
実世界でのアプリケーションとユースケース
自律システムとドローン
航空写真および無人航空機(UAV)の展開については、 YOLO11 は驚くほど優れた性能バランスを提供します。小型物体検出はドローン解析における大きな障壁ですが、YOLO11 様々なスケールをネイティブに即座にYOLO11 。さらに、低メモリ要件により、YOLO11 バリエーションは、ドローンに搭載された軽量エッジCPUやNPU上で直接実行可能です。
産業オートメーションと品質管理
スマートファクトリーでは、レイテンシーが最重要課題である。YOLORepGFPNネックにより高性能サーバー向けGPU上で堅牢な推論速度を実現するが、その硬直的な統合は過剰な場合がある。YOLO11 シンプルな追跡APIを備え、欠陥が角度のある境界認識を必要とする場合には純粋な検出から方向付き境界ボックス(OBB)タスクへシームレスに移行できるため、自動品質管理において優れた代替手段YOLO11
スマートヘルスケアと医療画像診断
医療画像データセットは比較的小規模な場合が多く、過学習を回避することは困難です。Ultralytics 整備されたエコシステムが提供する標準的な転移学習パイプラインと組み合わせた能動的拡張技術により、臨床医や開発者は正確な腫瘍検出モデルを確実に展開できます。広範なコミュニティサポートにより、医療のような複雑な分野における課題も迅速に解決されます。
YOLO26と共に未来を掴む
新規アプリケーションをゼロから構築する場合は、YOLO26の検討をお勧めします。2026年初頭にリリースされた本モデルはMuSGDオプティマイザとProgLoss関数を採用し、微小物体に対する卓越した精度を実現。さらに NMSのエンドツーエンドパイプラインを標準装備しています!
結局のところ、YOLO ニューラルアーキテクチャ検索の強力な実証例YOLO 一方で、 YOLO11 および拡張されたUltralytics 、迅速な展開、開発者の容易さ、そしてトップクラスのマルチモーダル性能を優先する実世界のコンピュータビジョンタスクにおける決定的な推奨選択肢であり続けています。