Link to this sectionYOLOv10とYOLO11の比較#
コンピュータビジョンの領域は常に進化しており、新しいアーキテクチャがリアルタイム処理の可能性の限界を押し広げています。この急速に発展する分野で活動する開発者や研究者にとって、最先端モデル間の微妙な違いを理解することは極めて重要です。本稿では、極めて優れた物体検出フレームワークであるYOLOv10とUltralytics YOLO11について、その技術的な違い、パフォーマンスのトレードオフ、および理想的なユースケースを詳しく比較します。
どちらのモデルもベンチマークデータセットで優れた結果を残していますが、その設計哲学やエコシステムの統合方法には大きな違いがあります。アーキテクチャを比較検討することで、デプロイメントの制約とプロジェクトの目標に最適なソリューションを見極めることができます。
Link to this sectionYOLOv10:NMS不要のエンドツーエンド検出の先駆け#
2024年春にリリースされたYOLOv10は、後処理に関連するレイテンシのオーバーヘッドを直接解消することで、従来の物体検出パイプラインへの新しいアプローチを導入しました。
- 著者: Ao Wang, Hui Chen, Lihao Liu, 他
- 組織: 清華大学
- 日付: 2024年5月23日
- 研究論文: arXiv:2405.14458
- ソースコード: GitHubのTHU-MIG/yolov10
- ドキュメント: YOLOv10ドキュメント
YOLOv10の最大の特徴は、NMS不要のトレーニングを可能にする一貫したデュアルアサインメント戦略です。従来の物体検出器は、冗長なバウンディングボックスの予測をフィルタリングするために、非最大値抑制(NMS)に大きく依存していました。このステップを削除することで、YOLOv10は真のエンドツーエンド検出を実現し、推論レイテンシを削減しました。また、カスタムNMSオペレーションの最適化が困難なニューラルプロセッシングユニット(NPU)のようなハードウェアアクセラレータへのデプロイも簡素化しています。
Link to this sectionYOLO11:エコシステム主導の多才さとパフォーマンス#
同年の後半に登場したYOLO11は、Ultralyticsモデルファミリーの継続的な改良を象徴するものであり、速度、精度、開発者エクスペリエンスの最適なバランスに焦点を当てています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024年9月27日
- ソースコード: GitHubのUltralytics
- プラットフォーム統合: Ultralyticsプラットフォーム
YOLO11は本番環境での利用を想定して設計されています。標準的なバウンディングボックス検出に優れているだけでなく、その真の強みはその多才さにあります。主に物体検出に特化したYOLOv10とは異なり、YOLO11は統一されたアーキテクチャを使用して、インスタンスセグメンテーション、姿勢推定、画像分類、および指向性バウンディングボックス(OBB)タスクをネイティブにサポートします。トレーニング中のメモリ要件が非常に低く、transformerベースのより大規模なアーキテクチャと比較して、一般的なGPUを使用するチームにとって非常に扱いやすいモデルです。
Link to this sectionパフォーマンスと指標の比較#
これらのモデルを並べて比較する場合、COCOデータセットのような標準ベンチマークにおいて、さまざまなスケールバリエーションでどのようなパフォーマンスを示すかを確認することが不可欠です。
以下の表はパフォーマンスの違いを示しています。YOLO11は、TensorRTによる非常に競争力の高い推論速度を維持しつつ、ほとんどのサイズカテゴリにおいて、mAPでYOLOv10を上回ることがよくあります。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
これらの高速な推論速度をローカル環境で再現するには、Intel CPU向けにはOpenVINO、NVIDIA GPU向けにはTensorRTなどの最適化された形式にモデルをエクスポートしてください。
Link to this sectionアーキテクチャの深掘り#
Link to this sectionトレーニング方法論と効率性#
YOLOv10のアーキテクチャは、計算の冗長性を削減することに重点を置いています。清華大学の研究者たちは、包括的な効率と精度を重視した戦略を用いてバックボーンとネックの設計を最適化し、以前のイテレーションと比較して中規模モデル(YOLOv10mなど)のパラメータ数を大幅に削減することに成功しました。
However, Training Efficiency is a major hallmark of Ultralytics models. YOLO11 utilizes the highly refined ultralytics Python package, which abstracts away complex hyperparameter tuning. This framework automatically handles advanced data augmentations, learning rate scheduling, and multi-GPU distributed training out of the box. YOLO11's architecture also exhibits excellent gradient flow, resulting in faster convergence and lower VRAM usage during the training phase.
Link to this section使いやすさとエコシステムの利点#
エンタープライズでの採用において重要な要素となるのが、適切に保守されたエコシステムです。研究用リポジトリは革新的であっても、論文発表後に更新が止まってしまうことがよくあります。YOLO11を支えるUltralyticsエコシステムは、シームレスなエンドツーエンドの開発者体験を提供します。
Weights & Biasesによる実験トラッキングや、Roboflowによるデータセット管理などのツールとシームレスに統合することで、YOLO11はプロトタイプから本番環境への移行を加速させます。使いやすさは、わずか数行のコードでモデルのトレーニングとエクスポートを可能にする合理化されたAPIに現れています。
from ultralytics import YOLO
# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")
# Export to ONNX format for deployment flexibility
model.export(format="onnx")Link to this sectionユースケースと推奨事項#
YOLOv10とYOLO11のどちらを選択するかは、プロジェクト固有の要件、デプロイメントの制約、およびエコシステムの優先順位によって決まります。
Link to this sectionYOLOv10を選択すべき場合#
YOLOv10は以下の用途に最適です。
- NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
- バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
- 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。
Link to this sectionYOLO11を選択すべき時#
YOLO11は以下のような場合に推奨されます。
- 本番環境へのエッジ展開: Raspberry PiやNVIDIA Jetsonなどのデバイス上で動作する商業アプリケーションで、信頼性と継続的なメンテナンスが最優先される場合。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内でdetection、segmentation、pose estimation、OBBが必要なプロジェクト。
- 迅速なプロトタイピングと展開: 効率化されたUltralytics Python APIを使用して、データ収集から本番運用まで素早く移行する必要があるチーム。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this section他のアーキテクチャの検討#
YOLOv10とYOLO11はどちらも優れた選択肢ですが、ユースケースによってはドキュメントで紹介されている他のアーキテクチャが適している場合もあります。シーケンスベースの推論には、transformerモデルであるRT-DETRが高精度を提供しますが、通常はより高いメモリ要件を求めます。一方、再トレーニングなしで未知のクラスを識別するゼロショット機能が必要な場合は、自然言語プロンプトで駆動するオープンボキャブラリーアプローチのYOLO-Worldが適しています。
Link to this section次世代: YOLO26#
絶対的な最先端技術を求めるチームには、先述の2つのモデルの優れた機能を兼ね備えた、最近リリースされたUltralytics YOLO26を推奨します。2026年1月にリリースされたYOLO26は、現代のデプロイメントシナリオにおける究極の推奨モデルです。
前モデルの基盤の上に構築されたYOLO26は、エンドツーエンドのNMS不要設計をネイティブに組み込んでおり、YOLOv10が初めて取り組んだ後処理のボトルネックを、堅牢なUltralyticsフレームワーク内で効果的に解消しています。さらに、YOLO26はDFL除去(Distribution Focal Loss)を特徴としており、モデルエクスポートグラフを劇的に簡素化し、エッジデバイスや低電力IoTデバイスとの互換性を向上させています。
トレーニングの安定性も、LLMトレーニング方法論に触発されたハイブリッドアプローチであるMuSGDオプティマイザの導入により、世代を超えた飛躍を遂げました。これは非常に高速な収束を確実にします。ProgLoss + STALのような高度な損失関数と組み合わせることで、YOLO26は小物体認識において顕著な改善を実現しました。標準的なエッジデバイスへのデプロイにおいて、これらのアーキテクチャの改良によりCPU推論速度が最大43%高速化しており、あらゆるコンピュータビジョンタスクにおいてYOLO26は比類のない選択肢となっています。