Link to this sectionYOLO11 と YOLOv8 の比較#
コンピュータビジョンの分野は、物体検出アーキテクチャの継続的な進化により、目覚ましい発展を遂げてきました。実際の運用環境へモデルを導入する際、開発者は多くの場合、Ultralytics YOLO11とその非常に成功した前身であるUltralytics YOLOv8の強みを比較検討します。どちらのモデルもスピード、精度、開発者体験において業界標準を確立していますが、プロジェクトのライフサイクルやパフォーマンスのしきい値という点では、それぞれ若干異なるニーズに対応しています。
本ガイドでは、人工知能プロジェクトに最適なソリューションを選択できるよう、両モデルのアーキテクチャ、トレーニング手法、および理想的なユースケースについて詳細な分析を提供します。
Link to this sectionアーキテクチャの革新#
YOLOv8からYOLO11への移行では、計算オーバーヘッドを最小限に抑えつつ特徴抽出効率を最大化することを目的とした、いくつかの主要なアーキテクチャ上の改良が導入されました。
Link to this sectionYOLO11 のアーキテクチャ#
YOLO11は、パラメータ使用の最適化において重要な前進を遂げています。従来のC2fモジュールを高度なC3k2ブロックに置き換えることで、パラメータ数を大幅に増加させることなく、空間的な特徴処理を強化しました。さらに、YOLO11はバックボーン内にC2PSA (Cross-Stage Partial Spatial Attention) モジュールを導入しています。このアテンションメカニズムにより、モデルは重要な対象領域に焦点を合わせることができ、小さな物体の検出の精度が劇的に向上し、複雑なオクルージョンへの対応も強化されました。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: Ultralytics リポジトリ
- ドキュメント: YOLO11 Docs
Link to this sectionYOLOv8 アーキテクチャ#
1年前にリリースされたYOLOv8は、アンカーフリーの検出ヘッドへの移行を先駆的に行い、アンカーボックスを手動で調整する必要をなくし、損失関数の定式化を簡素化しました。そのアーキテクチャはC2fブロックに大きく依存しており、ネットワークの深さと勾配フローのバランスをうまく調整した設計により、幅広いコンピュータビジョンアプリケーションにおいて驚異的な堅牢性を発揮します。
- 著者: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 組織: Ultralytics
- 日付: 2023-01-10
- GitHub: Ultralytics リポジトリ
- ドキュメント: YOLOv8 Docs
YOLOv8がUltralyticsエコシステムにおけるアンカーフリー検出の基盤を築いたのに対し、YOLO11はこのアプローチを空間アテンションメカニズムで洗練させ、より少ない計算リソースで高い精度を実現しました。
Link to this section性能とベンチマーク#
Raspberry Piのようなエッジデバイスや、NVIDIA TensorRTを実行する高性能サーバーにモデルを導入する場合、スピードと精度のトレードオフを理解することが極めて重要です。以下の表は、すべてのサイズバリエーションにおいてYOLO11がどのようにYOLOv8を安定して上回っているかを示しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Link to this sectionメトリクスの分析#
YOLO11は、パラメータ数とFloating Point Operations (FLOPs)の両方を削減しながら、より高いMean Average Precision (mAP)を実現しています。例えば、YOLO11mモデルはYOLOv8mよりも22%少ないパラメータでありながら、COCOデータセットにおいて1.3%高いmAPを達成しています。さらに、ONNX形式へエクスポートした場合のCPU推論スピードにおいても、YOLO11は大幅に高速化されており、専用のGPUアクセラレーション環境がない導入先にとっても優れた選択肢となります。
Link to this sectionUltralyticsエコシステムの利点#
YOLO11とYOLOv8のどちらを選択する場合でも、機械学習ライフサイクルを劇的に簡素化する包括的なUltralyticsエコシステムの恩恵をどちらも受けることができます。
Link to this section使いやすさとシンプルな API#
ultralytics Pythonパッケージは、エンジニアや研究者がわずか数行のコードでモデルのトレーニング、検証、エクスポートを行える合理化されたAPIを提供します。PyTorchで深層学習環境を構築する際に通常伴う複雑さを解消します。
Link to this sectionトレーニングの効率とメモリ要件#
重厚なVision Transformer(RT-DETRなど)とは異なり、Ultralytics YOLOモデルはトレーニング中のメモリ使用量が少ないことで知られています。このメモリ効率により、開発者はメモリ不足エラーに直面することなく、一般的なGPUやGoogle Colabのようなクラウド環境で最先端のネットワークをトレーニングできます。
Link to this sectionビジョンタスク全般の汎用性#
YOLO11とYOLOv8は、どちらも真のマルチタスク学習モデルです。標準的なバウンディングボックスの物体検出だけでなく、インスタンスセグメンテーション、画像分類、人間の姿勢推定、そして航空画像用のOriented Bounding Boxes (OBB)をネイティブにサポートしています。
Link to this sectionユースケースと推奨事項#
YOLO11とYOLOv8のどちらを選ぶかは、特定のプロジェクト要件、導入制約、およびエコシステムの優先順位によって決まります。
Link to this sectionYOLO11を選択すべき時#
YOLO11は以下のような場合に適しています:
- 本番環境へのエッジ展開: Raspberry PiやNVIDIA Jetsonなどのデバイス上で動作する商業アプリケーションで、信頼性と継続的なメンテナンスが最優先される場合。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内でdetection、segmentation、pose estimation、OBBが必要なプロジェクト。
- 迅速なプロトタイピングと展開: 効率化されたUltralytics Python APIを使用して、データ収集から本番運用まで素早く移行する必要があるチーム。
Link to this sectionYOLOv8を選択すべき場合#
YOLOv8は次のような場合に推奨されます:
- 汎用的なマルチタスクデプロイメント: Ultralytics エコシステム内で 検出、セグメンテーション、分類、姿勢推定 のために実績のあるモデルを必要とするプロジェクト。
- 確立された運用システム: 既にYOLOv8アーキテクチャ上で構築され、安定してテストされたデプロイメントパイプラインを持つ既存の運用環境。
- 広範なコミュニティとエコシステムのサポート: YOLOv8の広範なチュートリアル、サードパーティ統合、アクティブなコミュニティリソースを活用できるアプリケーション。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this sectionコード例:はじめに#
Ultralyticsモデルの導入とトレーニングは非常に直感的です。以下の例は、事前学習済みのYOLO11モデルを読み込み、カスタムデータセットで微調整を行い、Apple CoreMLを使用してエッジ導入向けにエクスポートする方法を示しています:
from ultralytics import YOLO
# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently with optimized memory requirements
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Evaluate the validation performance
metrics = model.val()
# Run real-time inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to CoreML for fast mobile deployment
export_path = model.export(format="coreml")Ultralytics APIは標準化されているため、レガシーパイプラインをYOLOv8からYOLO11にアップグレードする作業は、通常、重み付け文字列を "yolov8n.pt" から "yolo11n.pt" に変更するだけで完了します。
Link to this section今後の展望: YOLO26によるエッジAIの頂点へ#
YOLO11は成熟した非常に高性能なアーキテクチャですが、AIの革新のペースは止まりません。パフォーマンスの究極の最先端を必要とする新規プロジェクトを開始する開発者には、Ultralytics YOLO26(2026年1月リリース)を強く推奨します。
YOLO26は、いくつかの画期的な機能により、コンピュータビジョンの限界を押し広げます:
- エンドツーエンドのNMS不要設計: YOLOv10で探求された概念を基に、YOLO26はNon-Maximum Suppression (NMS)の後処理をネイティブに廃止し、すべての導入ハードウェアにおいてより低く予測可能なレイテンシを実現しています。
- CPU推論速度が最大43%高速化: Distribution Focal Loss (DFL)ブランチを完全に削除することにより、YOLO26は強力なGPUを搭載していないエッジコンピューティングデバイス向けに特別に最適化されています。
- MuSGDオプティマイザー: 大規模言語モデル (LLM) のトレーニング技術に着想を得たYOLO26は、ハイブリッドのMuSGDオプティマイザーを採用しており、非常に安定した迅速なトレーニング収束を保証します。
- ProgLoss + STAL: これらの高度な損失関数は、小さな物体や激しく隠れた物体の認識において顕著な改善をもたらし、自律ロボティクスやドローンベースの分析に不可欠です。
YOLOv8の確かな信頼性、YOLO11の最適化されたアーキテクチャ、あるいは次世代の能力を持つYOLO26のいずれに依存するとしても、Ultralytics Platformは、ビジョンAIアプリケーションをコンセプトから本番環境へシームレスに移行させるために必要なツールを提供します。モデルをエンタープライズワークフローや分析ダッシュボードと連携させるための広範なインテグレーションをぜひ活用してください。