Ultralytics YOLO11

概要

YOLO11は2024年9月10日にUltralyticsによってリリースされ、優れた精度、速度、効率を実現しています。これまでのYOLOバージョンの目覚ましい進歩の上に構築されたYOLO11は、アーキテクチャとトレーニング手法に大幅な改善を導入しており、幅広いコンピュータビジョンタスクに対応できる汎用性の高いモデルです。エンドツーエンドのNMSフリー推論と最適化されたエッジ展開を備えた最新のUltralyticsモデルについては、YOLO26をご覧ください。

Ultralytics YOLO11 比較プロット

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM



Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Ultralytics Platformで試す

YOLO11モデルをUltralytics Platform上で直接探索および実行できます。

主な特徴

  • 強化された特徴抽出: YOLO11は改良されたバックボーンおよびネックアーキテクチャを採用しており、より正確な物体検出と複雑なタスク性能のために特徴抽出能力を向上させています。
  • 効率と速度の最適化: YOLO11は洗練されたアーキテクチャ設計と最適化されたトレーニングパイプラインを導入しており、処理速度を向上させつつ、精度とパフォーマンスの最適なバランスを維持しています。
  • 少ないパラメータでより高い精度: モデル設計の進歩により、YOLO11mはYOLOv8mよりも22%少ないパラメータを使用しながらCOCOデータセットでより高い平均適合率(mAP)を達成しており、精度を犠牲にすることなく計算効率に優れています。
  • 環境に対する適応性: YOLO11は、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUをサポートするシステムなど、さまざまな環境にシームレスに展開可能であり、最大限の柔軟性を確保しています。
  • 広範なサポートタスク: 物体検出、インスタンスセグメンテーション、画像分類、姿勢推定、回転物体検出(OBB)など、YOLO11は多様なコンピュータビジョンの課題に対応するように設計されています。

サポートされているタスクとモード

YOLO11は、これまでのUltralytics YOLOリリースによって確立された汎用的なモデル範囲に基づいて構築されており、さまざまなコンピュータビジョンのタスク全体で強化されたサポートを提供します。

モデルファイル名タスク推論 (Inference)検証学習Export
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt検出
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptインスタンスセグメンテーション
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptポーズ/キーポイント
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt方向付き検出
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.pt分類

この表はYOLO11モデルのバリエーションの概要を示しており、特定のタスクへの適用可能性や推論、検証、トレーニング、エクスポートといった運用モードとの互換性を示しています。この柔軟性により、YOLO11はリアルタイム検出から複雑なセグメンテーションタスクまで、コンピュータビジョンの幅広いアプリケーションに適しています。

性能メトリクス

性能

See Detection Docs for usage examples with these models trained on COCO, which include 80 pretrained classes.

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

使用例

このセクションでは、YOLO11の基本的なトレーニングと推論の例を紹介します。これらやその他のモードに関する詳細なドキュメントについては、PredictTrainVal、およびExportのドキュメントページを参照してください。

Note that the example below is for YOLO11 Detect models for object detection. For additional supported tasks, see the Segment, Classify, OBB, and Pose docs.

PyTorch の事前学習済み *.pt モデルや設定用 *.yaml ファイルを YOLO() クラスに渡すことで、Pythonでモデルインスタンスを作成できます:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

引用と謝辞

Ultralytics YOLO11の公開について

Ultralyticsでは、モデルの急速な進化を考慮し、YOLO11に関する正式な研究論文を公開していません。私たちは静的なドキュメントを作成することよりも、技術を進歩させ、使いやすくすることに重点を置いています。YOLOのアーキテクチャ、機能、使用方法に関する最新情報については、GitHubリポジトリおよびドキュメントを参照してください。

YOLO11や本リポジトリのソフトウェアを研究等で使用される場合は、以下の形式で引用してください。

引用
@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOIは現在申請中であり、取得次第引用情報に追加される予定です。YOLO11モデルはAGPL-3.0およびEnterpriseライセンスの下で提供されています。

FAQ

Ultralytics YOLO11とYOLOv8を比較した場合の主な改善点は何ですか?

Ultralytics YOLO11はYOLOv8と比較して、いくつかの重要な進歩を導入しています。主な改善点は以下の通りです。

  • 高度な特徴抽出: YOLO11は改良されたバックボーンおよびネックアーキテクチャを採用しており、特徴抽出能力が向上し、より高精度な物体検出が可能になりました。
  • 効率と速度の最適化: 洗練されたアーキテクチャ設計と最適化されたトレーニングパイプラインにより、精度とパフォーマンスのバランスを維持しつつ、より高速な処理速度を実現しています。
  • 少ないパラメータで高い精度: YOLO11mは、YOLOv8mよりもパラメータ数を22%削減しながら、COCOデータセットにおいてより高い平均精度(mAP)を達成しており、精度を犠牲にすることなく計算効率を高めています。
  • 多様な環境への適応性: YOLO11は、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUをサポートするシステムなど、さまざまな環境に展開可能です。
  • 幅広いタスクのサポート: YOLO11は、物体検出、インスタンスセグメンテーション、画像分類、姿勢推定、回転物体検出(OBB)といった多岐にわたるコンピュータビジョンタスクをサポートしています。

YOLO11モデルを物体検出のためにトレーニングする方法は?

YOLO11モデルの物体検出トレーニングは、PythonまたはCLIコマンドを使用して実行できます。両方のメソッドの例を以下に示します。

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

より詳細な手順については、Trainのドキュメントを参照してください。

YOLO11モデルではどのようなタスクが実行可能ですか?

YOLO11モデルは汎用性が高く、以下を含む幅広いコンピュータビジョンタスクをサポートしています。

  • 物体検出: 画像内のオブジェクトを特定し、その位置を特定します。
  • インスタンスセグメンテーション: オブジェクトを検出し、その境界を明確にします。
  • 画像分類 画像をあらかじめ定義されたクラスに分類します。
  • 姿勢推定: 人体のキーポイントを検出し、追跡します。
  • 回転物体検出(OBB): 回転を伴うオブジェクトを検出し、より高い精度を実現します。

各タスクの詳細については、DetectionInstance SegmentationClassificationPose Estimation、およびOriented Detectionのドキュメントを参照してください。

YOLO11はどのようにして少ないパラメータで高い精度を達成しているのですか?

YOLO11は、モデル設計の進歩と最適化技術を通じて、少ないパラメータで高い精度を達成しています。改良されたアーキテクチャにより、効率的な特徴抽出と処理が可能となり、COCOのようなデータセットにおいて、YOLOv8mよりも22%少ないパラメータ数で高い平均精度(mAP)を実現しました。これにより、YOLO11は精度を損なうことなく計算効率を高めており、リソースが制限されたデバイスへのデプロイにも適しています。

YOLO11はエッジデバイスに展開できますか?

はい、YOLO11はエッジデバイスを含む様々な環境に適応できるように設計されています。その最適化されたアーキテクチャと効率的な処理能力により、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUをサポートするシステムへの展開に適しています。この柔軟性により、モバイルデバイスでのリアルタイム検出から、クラウド環境での複雑なセグメンテーションタスクまで、YOLO11は多種多様なアプリケーションで活用可能です。展開オプションの詳細については、Exportのドキュメントを参照してください。

コメント