YOLOv10 YOLO11:リアルタイム物体検出アーキテクチャの徹底比較
コンピュータビジョンの分野は絶えず進化を続けており、新たなアーキテクチャがリアルタイム処理の可能性の限界を押し広げている。この急速に変化する分野をナビゲートする開発者や研究者にとって、最先端モデル間の微妙な差異を理解することは極めて重要である。本詳細比較では、 YOLOv10 と Ultralytics YOLO11という2つの高性能物体検出フレームワークについて、技術的差異、性能トレードオフ、および理想的なユースケースを詳細に比較検討します。
両モデルともベンチマークデータセットで顕著な成果を上げる一方、その基盤となる設計思想とエコシステム統合は大きく異なる。アーキテクチャを検証することで、導入上の制約やプロジェクト目標に最適なソリューションを特定できる。
YOLOv10: 先駆的なNMSのエンドツーエンド検出
2024年春に発表YOLOv10 、後処理に伴う遅延オーバーヘッドを直接的に解決することで、従来の物体検出パイプラインに新たなアプローチYOLOv10 。
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織:清華大学
- 日付: 2024年5月23日
- 研究論文:arXiv:2405.14458
- ソースコード:THU-MIG/yolov10 on GitHub
- ドキュメント:YOLOv10
YOLOv10 傑出した革新点は、一貫した二重アサインメントYOLOv10 、これによりNMSトレーニングを実現している。 従来の物体検出器は、冗長な境界ボックス予測をフィルタリングするために非最大抑制(NMS)に大きく依存している。このステップを排除することで、YOLOv10 真のエンドツーエンド検出YOLOv10 、推論遅延を低減するとともに、NMS 最適化が特に困難なニューラルプロセッシングユニット(NPU)などのハードウェアアクセラレータ上での展開を簡素化する。
YOLO11: エコシステム主導の汎用性と性能
同年後半にリリースされたYOLO11 、Ultralytics の継続的な改良をYOLO11 、速度、精度、開発者体験の最適なバランスに焦点を当てています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024年9月27日
- ソースコード:Ultralytics GitHub
- プラットフォーム統合:Ultralytics
YOLO11 実運用向けにYOLO11 。標準的な境界ボックス検出に優れる一方、真の強みは汎用性にあります。 主に物体検出に焦点を当てたYOLOv10異なり、YOLO11 統一されたアーキテクチャを用いてインスタンスセグメンテーション、姿勢推定、画像分類、オリエンテッドバウンディングボックス(OBB)タスクをYOLO11 サポートします。トレーニング時のメモリ要件が非常に低く、より重いトランスフォーマーベースのアーキテクチャと比較して、コンシューマー向けGPUを使用するチームにとって非常にアクセスしやすい特徴を備えています。
パフォーマンスとメトリクスの比較
これらのモデルを並べて比較する際には、COCO のような標準的なベンチマークにおいて、異なるスケールバリエーションでどのように動作するかを検討することが不可欠である。
以下の表は性能差を強調しています。YOLO11 、ほとんどのサイズmAP YOLOv10 YOLO11 上回りつつ、高い競争力を維持しています。 TensorRT 推論速度を維持しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
ハードウェアアクセラレーション
これらの高速推論速度をローカルで再現するには、モデルを最適化された形式(例: OpenVINO (Intel 用)やTensorRT (NVIDIA TensorRT )などの最適化された形式にエクスポートしてください。
アーキテクチャの詳細
トレーニング方法論と効率性
YOLOv10アーキテクチャYOLOv10計算上の冗長性の削減を重視している。清華大学の研究者らは、効率性と精度を統合的に追求する戦略を用いてバックボーンとネックの設計を最適化することで、中規模モデル(YOLOv10mなど)において、従来の反復モデルと比較してパラメータ数を大幅に削減することに成功した。
しかしながら、 トレーニング効率 Ultralytics 主要な特徴である。YOLO11 高度に洗練された ultralytics 複雑な処理を抽象化するPython ハイパーパラメータチューニングこのフレームワークは、高度なデータ拡張、学習率スケジューリング、GPU トレーニングを最初から自動的に処理します。YOLO11アーキテクチャは優れた勾配流れも示し、トレーニングフェーズにおける収束の高速化とVRAM使用量の削減を実現します。
使いやすさとエコシステムの優位性
企業導入における重要な要素は、整備されたエコシステムである。研究リポジトリは画期的である一方、初期の論文発表後は活動停止状態に陥りがちだ。YOLO11を支えるUltralytics 、シームレスなエンドツーエンドの開発者体験を提供する。
シームレスに統合されるツール Weights & Biases 実験追跡のためのツールや Roboflow などのツールとYOLO11 連携し、プロトタイプから本番環境への移行をYOLO11 簡素化されたAPIにより、開発者はわずか数行のコードでモデルのトレーニングとエクスポートが可能となり、その使いやすさが明らかです。
from ultralytics import YOLO
# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")
# Export to ONNX format for deployment flexibility
model.export(format="onnx")
ユースケースと推奨事項
YOLO11 具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの好みにYOLO11 。
YOLOv10を選択すべき時
YOLOv10 以下に最適YOLOv10 :
- NMSリアルタイム検出:ノンマキシマム抑制なしのエンドツーエンド検出により、導入の複雑さを軽減するアプリケーション。
- 速度と精度のバランスの取れたトレードオフ:様々なモデル規模において、推論速度と検出精度との強力なバランスを必要とするプロジェクト。
- 一貫したレイテンシを必要とするアプリケーション:予測可能な推論時間が極めて重要な展開シナリオ(例:ロボティクスや自律システム)。
YOLO11を選択すべき時
YOLO11 以下に推奨YOLO11 :
- 生産環境への導入: ラズベリーパイやNVIDIA などのデバイス上で動作する商用アプリケーションにおいて、信頼性と積極的なメンテナンスが最優先事項となる場合。
- マルチタスク視覚アプリケーション:単一の統合フレームワーク内で検出、セグメンテーション、姿勢推定、およびOBBを必要とするプロジェクト。
- 迅速なプロトタイピングとデプロイメント:データ収集から生産までを迅速に進める必要があるチーム向けに、Ultralytics Python 効率化されたインターフェースを提供します。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
他のアーキテクチャの探求
YOLOv10 YOLO11 優れた選択肢YOLO11 、特定のユースケースではドキュメントに記載されている他のアーキテクチャの方が適している場合があります。シーケンスベースの推論には、 RT-DETR は高い精度を提供しますが、通常より多くのメモリを必要とします。一方、再学習なしで新規クラスを識別するゼロショット能力が必要な場合、YOLO自然言語プロンプトによるオープンボキャブラリアプローチを提供します。
次世代:YOLO26
最先端を求めるチーム向けに、新たにUltralytics 、前述の両モデルの優れた機能を統合しています。2026年1月にリリースされたYOLO26は、現代の展開シナリオにおける究極の推奨ソリューションです。
YOLO26は先行モデルの基盤を継承しつつ、エンドツーNMS設計をネイティブに組み込み、YOLOv10 解決した後処理のボトルネックを効果的に排除。これを堅牢Ultralytics 内で実現しています。さらにDFL除去(分布焦点損失)機能により、モデルエクスポートグラフを大幅に簡素化し、エッジデバイスや低消費電力IoTデバイスとの互換性を強化しています。
MuSGDオプティマイザーの導入により、トレーニングの安定性も飛躍的な進化を遂げました。LLMトレーニング手法に着想を得たハイブリッドアプローチにより、驚異的な収束速度を実現します。ProgLoss + STALなどの高度な損失関数と組み合わせることで、YOLO26は微小物体認識において顕著な改善をもたらします。 標準的なエッジデバイスへの展開において、これらのアーキテクチャ改良により CPU 最大43%高速化され、YOLO26はあらゆるコンピュータビジョンタスクにおいて比類のない選択肢となっています。