YOLOv10 YOLO11:リアルタイム物体検出アーキテクチャの徹底比較
コンピュータビジョンの分野は絶えず進化を続けており、新たなアーキテクチャがリアルタイム処理の可能性の限界を押し広げている。この急速に変化する分野をナビゲートする開発者や研究者にとって、最先端モデル間の微妙な差異を理解することは極めて重要である。本詳細比較では、 YOLOv10 と Ultralytics YOLO11という2つの高性能物体検出フレームワークについて、技術的差異、性能トレードオフ、および理想的なユースケースを詳細に比較検討します。
両モデルともベンチマークデータセットで顕著な成果を上げる一方、その基盤となる設計思想とエコシステム統合は大きく異なる。アーキテクチャを検証することで、導入上の制約やプロジェクト目標に最適なソリューションを特定できる。
YOLOv10: 先駆的なNMSのエンドツーエンド検出
2024年春に発表YOLOv10 、後処理に伴う遅延オーバーヘッドを直接的に解決することで、従来の物体検出パイプラインに新たなアプローチYOLOv10 。
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織:清華大学
- 日付: 2024年5月23日
- 研究論文:arXiv:2405.14458
- ソースコード:THU-MIG/yolov10 on GitHub
- ドキュメンテーション:YOLOv10 ドキュメント
YOLOv10 傑出した革新点は、一貫した二重アサインメントYOLOv10 、これによりNMSトレーニングを実現している。 従来の物体検出器は、冗長な境界ボックス予測をフィルタリングするために非最大抑制(NMS)に大きく依存している。このステップを排除することで、YOLOv10 真のエンドツーエンド検出YOLOv10 、推論遅延を低減するとともに、NMS 最適化が特に困難なニューラルプロセッシングユニット(NPU)などのハードウェアアクセラレータ上での展開を簡素化する。
YOLO11: エコシステム主導の汎用性と性能
同年後半にリリースされたYOLO11 、Ultralytics の継続的な改良をYOLO11 、速度、精度、開発者体験の最適なバランスに焦点を当てています。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024年9月27日
- ソースコード:Ultralytics on GitHub
- プラットフォーム統合:Ultralytics Platform
YOLO11 実運用向けにYOLO11 。標準的な境界ボックス検出に優れる一方、真の強みは汎用性にあります。 主に物体検出に焦点を当てたYOLOv10異なり、YOLO11 統一されたアーキテクチャを用いてインスタンスセグメンテーション、姿勢推定、画像分類、オリエンテッドバウンディングボックス(OBB)タスクをYOLO11 サポートします。トレーニング時のメモリ要件が非常に低く、より重いトランスフォーマーベースのアーキテクチャと比較して、コンシューマー向けGPUを使用するチームにとって非常にアクセスしやすい特徴を備えています。
パフォーマンスとメトリクスの比較
これらのモデルを並べて比較する際には、COCO のような標準的なベンチマークにおいて、異なるスケールバリエーションでどのように動作するかを検討することが不可欠である。
以下の表は性能差を強調しています。YOLO11 、ほとんどのサイズmAP YOLOv10 YOLO11 上回りつつ、高い競争力を維持しています。 TensorRT 推論速度を維持しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
ハードウェアアクセラレーション
これらの高速推論速度をローカルで再現するには、モデルを最適化された形式(例: OpenVINO (Intel 用)やTensorRT (NVIDIA TensorRT )などの最適化された形式にエクスポートしてください。
アーキテクチャの詳細
トレーニング方法論と効率性
YOLOv10アーキテクチャYOLOv10計算上の冗長性の削減を重視している。清華大学の研究者らは、効率性と精度を統合的に追求する戦略を用いてバックボーンとネックの設計を最適化することで、中規模モデル(YOLOv10mなど)において、従来の反復モデルと比較してパラメータ数を大幅に削減することに成功した。
しかしながら、 トレーニング効率 Ultralytics 主要な特徴である。YOLO11 高度に洗練された ultralytics 複雑な処理を抽象化するPython ハイパーパラメータチューニング。このフレームワークは、高度なデータ拡張、学習率スケジューリング、およびマルチGPU分散トレーニングをすぐに自動的に処理します。YOLO11のアーキテクチャは、優れた勾配フローも示し、トレーニングフェーズ中のより速い収束と低いVRAM使用量をもたらします。
使いやすさとエコシステムの利点
企業での採用における重要な要素は、適切に維持されたエコシステムです。研究リポジトリは画期的である一方で、最初の論文発表後に休眠状態になることがよくあります。YOLO11を支えるUltralyticsエコシステムは、シームレスなエンドツーエンドの開発者エクスペリエンスを提供します。
シームレスに統合されるツール Weights & Biases 実験追跡のためのツールや Roboflow などのツールとYOLO11 連携し、プロトタイプから本番環境への移行をYOLO11 簡素化されたAPIにより、開発者はわずか数行のコードでモデルのトレーニングとエクスポートが可能となり、その使いやすさが明らかです。
from ultralytics import YOLO
# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")
# Export to ONNX format for deployment flexibility
model.export(format="onnx")
ユースケースと推奨事項
YOLOv10とYOLO11のどちらを選択するかは、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの好みに依存します。
YOLOv10を選択すべき時
YOLOv10 以下に最適YOLOv10 :
- NMSフリーのリアルタイムdetect: Non-Maximum Suppressionなしのエンドツーエンドのdetectから恩恵を受け、デプロイの複雑さを軽減するアプリケーション。
- 速度と精度のバランスの取れたトレードオフ: さまざまなモデルスケールにおいて、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
- 一貫したレイテンシが求められるアプリケーション: ロボット工学や自律システムなど、予測可能な推論時間が重要となるデプロイメントシナリオ。
YOLO11を選択すべき時
YOLO11 以下に推奨YOLO11 :
- 本番エッジデプロイ: Raspberry PiやNVIDIA Jetsonのようなデバイス上での商用アプリケーションにおいて、信頼性と継続的なメンテナンスが最重要となります。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内で、detect、segment、姿勢推定、およびOBBを必要とするプロジェクト。
- 迅速なプロトタイピングとデプロイ: 合理化されたUltralytics Python APIを使用して、データ収集から本番環境へ迅速に移行する必要があるチーム向け。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26は、パフォーマンスと開発者エクスペリエンスの最高の組み合わせを提供します。
- NMSフリーのエッジデプロイメント: Non-Maximum Suppressionの後処理の複雑さなしに、一貫した低レイテンシ推論を必要とするアプリケーション。
- CPUのみの環境: 専用のGPUアクセラレーションを持たないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な優位性をもたらします。
- 小物体detect: 航空ドローン画像やIoTセンサー分析のような困難なシナリオにおいて、ProgLossとSTALが微小なオブジェクトのAPを大幅に向上させます。
その他のアーキテクチャの探索
YOLOv10 YOLO11 優れた選択肢YOLO11 、特定のユースケースではドキュメントに記載されている他のアーキテクチャの方が適している場合があります。シーケンスベースの推論には、 RT-DETR は高い精度を提供しますが、通常より多くのメモリを必要とします。一方、再学習なしで新規クラスを識別するゼロショット能力が必要な場合、YOLO自然言語プロンプトによるオープンボキャブラリアプローチを提供します。
次世代:YOLO26
絶対的な最先端を求めるチームにとって、最近リリースされたUltralytics YOLO26は、上記で議論された両モデルの最高の機能を組み合わせています。2026年1月にリリースされたYOLO26は、現代のデプロイメントシナリオにおける究極の推奨モデルです。
その前身モデルの基盤の上に構築され、YOLO26はネイティブにエンドツーエンドのNMSフリー設計を組み込んでおり、YOLOv10が最初に対処した後処理のボトルネックを効果的に排除しつつ、堅牢なUltralyticsフレームワーク内でこれを実現しています。さらに、YOLO26はDFL除去(Distribution Focal Loss)を特徴としており、モデルのエクスポートグラフを大幅に簡素化し、エッジデバイスや低電力IoTデバイスとの互換性を向上させます。
MuSGDオプティマイザーの導入により、トレーニングの安定性も飛躍的な進化を遂げました。LLMトレーニング手法に着想を得たハイブリッドアプローチにより、驚異的な収束速度を実現します。ProgLoss + STALなどの高度な損失関数と組み合わせることで、YOLO26は微小物体認識において顕著な改善をもたらします。 標準的なエッジデバイスへの展開において、これらのアーキテクチャ改良により CPU 最大43%高速化され、YOLO26はあらゆるコンピュータビジョンタスクにおいて比類のない選択肢となっています。