Link to this sectionYOLO11とYOLOv10の比較#
リアルタイムコンピュータビジョンの状況は絶えず進化しており、新しいアーキテクチャがエッジデバイスとクラウドインフラストラクチャの両方で可能なことの境界を押し広げています。本詳細技術分析では、この分野における2つの極めて重要なモデル、Ultralytics YOLO11とYOLOv10の間のニュアンスを探ります。どちらも物体検出能力において大きな飛躍を遂げていますが、そのパフォーマンスを達成するために根本的に異なるアーキテクチャ哲学を採用しています。
Link to this sectionYOLO11アーキテクチャの解説#
YOLO11 の詳細:
- 作成者:Glenn JocherおよびJing Qiu
- 組織:Ultralytics
- 日付:2024年9月27日
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
多用途な強力モデルとして導入されたYOLO11は、コンピュータビジョンとAIにおける長年の基礎研究に基づいています。YOLO11のコア設計哲学は、豊かな特徴量と、複数のコンピュータビジョンタスクにわたる極めて高い汎用性を中心に展開されています。
YOLO11の際立った改善点の1つが、C3k2 Blockの実装です。この洗練されたボトルネックモジュールはネットワーク全体の勾配フローを最適化し、高い精度を維持しながらパラメータ効率を劇的に改善します。さらに、YOLO11は強化された空間アテンションメカニズムを採用しており、これは小さかったり一部が隠れたりしているアイテムを識別するために不可欠です。これにより、航空画像ユースケースや詳細な医療画像解析において極めて優れた選択肢となっています。
YOLO11は、ハイパーパラメータチューニングの複雑さを最小限に抑えるアンカーフリー設計を利用しており、多種多様なカスタムデータセット全体で堅牢な汎化を可能にします。さらに、トレーニング中のメモリ要件はトランスフォーマーベースのアーキテクチャと比較して大幅に低いため、研究者は標準的なコンシューマーハードウェア上で大きなモデルを効率的にトレーニングできます。
Link to this sectionYOLOv10アーキテクチャの探索#
YOLOv10の詳細:
- 著者:Ao Wang, Hui Chen, Lihao Liu 他
- 組織: 清華大学
- 日付:2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- ドキュメント: https://docs.ultralytics.com/models/yolov10/
清華大学の研究者によって開発されたYOLOv10は、YOLOファミリーにおけるエンドツーエンドのパイオニアとして注目を集めました。YOLOv10の最大の特徴は、NMS-Free Training手法です。トレーニングフェーズ中に一貫したデュアルアサインメントを採用することで、モデルは物体ごとに正確に1つのバウンディングボックスを予測します。このブレークスルーにより、推論中の非最大値抑制 (NMS)の必要性が完全になくなりました。これは従来、展開パイプラインにおいてレイテンシのボトルネックを引き起こしていたポストプロセッシングステップです。
The architecture also introduces a holistic efficiency-accuracy design strategy. It incorporates spatial-channel decoupled downsampling and rank-guided block designs that selectively reduce redundancy in the network stages. This results in fewer FLOPs and reduced computational overhead without significantly sacrificing the mean Average Precision (mAP). For real-time applications where every millisecond counts, the removal of NMS provides a deterministic inference graph highly suitable for edge AI devices.
Link to this sectionパフォーマンス指標とベンチマーク#
これら2つのモデルを評価する際、精度、パラメータ数、速度のバランスを考慮します。以下の表は、COCOデータセット上で、さまざまなスケールでどのように比較されるかを示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOパフォーマンスメトリクスで観察されるように、YOLO11は一般的に、特に大きなモデルにおいて、そのバリエーション全体でわずかに高いmAPスコアを達成します。YOLOv10のNMSフリー設計は非常に安定したエンドツーエンドの推論時間を保証しますが、YOLO11はNVIDIAハードウェア上でTensorRTを用いて最適化された場合、依然として卓越したスループットを維持します。
モデルを展開用に準備する際は、最適化された形式へのエクスポートが不可欠です。YOLO11とYOLOv10の両方は、Ultralyticsフレームワークを使用してONNXやTensorRTなどの形式にシームレスにエクスポートできます。ステップバイステップの手順については、モデル展開オプションに関するガイドを参照してください。
Link to this sectionUltralyticsエコシステムの利点#
単体のパフォーマンスメトリクスも重要ですが、機械学習プロジェクトの実用的な成功を左右するのは周辺フレームワークです。ここで、UltralyticsエコシステムのネイティブメンバーであるYOLO11が真価を発揮します。
Ultralytics Platformは、信じられないほど合理化されたユーザーエクスペリエンスを提供します。シンプルで統一されたPython APIを使用して、開発者は基本的なバウンディングボックスを超えたタスクを処理できます。YOLO11は、ネイティブなインスタンスセグメンテーション、姿勢推定、画像分類、および指向性バウンディングボックス (OBB)検出をすぐにサポートします。この極めて高い汎用性は、専門的な研究リポジトリでは欠けていることが多いものです。
さらに、このエコシステムは広範なドキュメントと活発なコミュニティサポートによって支えられています。実験トラッキングのためのWeights & Biasesや、Intelハードウェア最適化のためのOpenVINOといったツールとの統合がライブラリに直接組み込まれています。モデルのトレーニングには最小限のボイラープレートコードしか必要とせず、RT-DETRのような重いトランスフォーマーモデルよりも少ないCUDAメモリで済む、非常に効率的なトレーニングプロセスの利点を享受できます。
Link to this sectionハンズオンコード例#
Ultralyticsを使用したトレーニングと推論の実行は、可能な限り直感的になるように設計されています。同一のAPIがYOLO11とYOLOv10の両方を難なく処理します。
from ultralytics import YOLO
# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")
# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects
inference_results[0].show()Link to this sectionユースケースと推奨事項#
YOLO11とYOLOv10のどちらを選択するかは、プロジェクト固有の要件、展開の制約、およびエコシステムの好みによって異なります。
Link to this sectionYOLO11を選択すべき時#
YOLO11は以下のような場合に適しています:
- 本番環境へのエッジ展開: Raspberry PiやNVIDIA Jetsonなどのデバイス上で動作する商業アプリケーションで、信頼性と継続的なメンテナンスが最優先される場合。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内でdetection、segmentation、pose estimation、OBBが必要なプロジェクト。
- 迅速なプロトタイピングと展開: 効率化されたUltralytics Python APIを使用して、データ収集から本番運用まで素早く移行する必要があるチーム。
Link to this sectionYOLOv10を選択すべき場合#
YOLOv10は以下の場合に推奨されます。
- NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
- バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
- 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this section次世代: YOLO26#
YOLOv10が革新的なNMSフリーのパラダイムを導入し、YOLO11がマルチタスクの汎用性を完成させた一方で、AIの分野は急速に動いています。現在、新しい本番展開を開始する開発者には、Ultralytics YOLO26を探索することを強くお勧めします。
2026年1月にリリースされたYOLO26は、両方の長所を融合しています。YOLOv10によって開拓されたエンドツーエンドNMSフリー設計をネイティブに採用し、展開パイプラインを劇的に簡素化し、一貫したレイテンシを保証します。さらに、YOLO26は専門的なエッジコンピューティング最適化を組み込んでいます。DFL Removal(Distribution Focal Lossの削除)を実行することで、このアーキテクチャはより簡単なエクスポート可能性を保証し、レガシーモデルと比較して最大43%高速なCPU推論を達成しており、低消費電力のIoTデバイスやモバイルアプリケーションにとって最高の選択肢となっています。
YOLO26はまた、最先端のAI研究に触発されたハイブリッドであるMuSGD Optimizerを通じて、コンピュータビジョンに大規模言語モデル (LLM) のトレーニングの安定性をもたらします。ProgLoss + STAL損失関数と組み合わされることで、YOLO26は小さな物体に対して比類のない精度を提供し、これは詳細な交通ビデオ検出や複雑なロボット自動化に不可欠です。
Link to this section結論#
適切なビジョンモデルの選択は、特定の運用上の制約によって決まります。YOLOv10は、NMSを検出パイプラインから効果的に排除できることを証明した、学術界における重要なマイルストーンとして存在しています。しかし、パフォーマンス、包括的なタスクの汎用性、およびシームレスな展開ツールの優れたバランスを求めるなら、YOLO11が堅牢でエンタープライズ対応のソリューションを提供します。
エンドツーエンドのシンプルさと圧倒的な高速エッジパフォーマンスを組み合わせた、真の最先端を求めるエンジニアにとって、最新のYOLO26への移行が究極の推奨事項です。包括的なUltralytics Platformを活用することで、プロジェクトが適切にメンテナンスされ、非常に効率的で、将来を見据えた基盤の上に構築されていることを保証できます。