コンテンツにスキップ

Ultralytics YOLO11

概要

YOLO11は、リアルタイムオブジェクト検出器であるUltralytics YOLOシリーズの最新版であり、最先端の精度、速度、効率で何が可能かを再定義します。YOLOの以前のバージョンの目覚ましい進歩を基に、YOLO11はアーキテクチャとトレーニング方法に大幅な改善を加え、幅広いコンピュータビジョンタスクに対応できる汎用性の高い選択肢となっています。

Ultralytics YOLO11 の比較プロット

Ultralytics YOLO11 🚀 NotebookLMによって生成されたポッドキャスト



見る: Ultralytics YOLO11を物体検出とトラッキングに使用する方法 | ベンチマーク方法 | YOLO11リリース🚀

主な特徴

  • 強化された特徴抽出: YOLO11は、改善されたバックボーンとネックアーキテクチャを採用しており、より正確な物体検出と複雑なタスクパフォーマンスのための特徴抽出機能を強化します。
  • 効率と速度の最適化: YOLO11 は、洗練されたアーキテクチャ設計と最適化されたトレーニングパイプラインを導入し、より高速な処理速度を実現し、精度とパフォーマンスの最適なバランスを維持します。
  • より少ないパラメーターでより高い精度: モデル設計の進歩により、YOLO11mはYOLOv8mよりも22%少ないパラメーターを使用しながら、COCOデータセットでより高い平均適合率(mAP)を実現し、精度を損なうことなく計算効率を高めています。
  • 環境全体での適応性: YOLO11は、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUをサポートするシステムなど、さまざまな環境にシームレスにデプロイでき、最大限の柔軟性を保証します。
  • 広範なサポート対象タスク: オブジェクト検出、インスタンスセグメンテーション、画像分類、ポーズ推定、または指向性オブジェクト検出(OBB)であれ、YOLO11は、多様なコンピュータビジョン課題に対応するように設計されています。

サポートされているタスクとモード

YOLO11 、以前のUltralytics YOLO リリースで確立された汎用性の高いモデル群に基づいて構築されており、様々なコンピュータビジョンタスクのサポートが強化されています:

モデルファイル名タスク推論検証学習エクスポート
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt検出
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptインスタンスセグメンテーション
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptポーズ/キーポイント
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt傾斜検出
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.pt分類

この表は、YOLO11モデルのバリアントの概要を示し、特定のタスクへの適用性と、推論、検証、トレーニング、エクスポートなどの動作モードとの互換性を示しています。この柔軟性により、YOLO11は、リアルタイム検出から複雑なセグメンテーションタスクまで、コンピュータビジョンの幅広いアプリケーションに適しています。

パフォーマンス指標

パフォーマンス

Detection Docsを参照してください。これらのモデルはCOCOで学習されており、80個の学習済みクラスが含まれています。使用例が記載されています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Segmentation Docsを参照してください。これらのモデルはCOCOで学習されており、80個の学習済みクラスが含まれています。使用例が記載されています。

モデルサイズ
(ピクセル)
mAPbox
50-95
mAPmask
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n-seg64038.932.065.9 ± 1.11.8 ± 0.02.99.7
YOLO11s-seg64046.637.8117.6 ± 4.92.9 ± 0.010.133.0
YOLO11m-seg64051.541.5281.6 ± 1.26.3 ± 0.122.4113.2
YOLO11l-seg64053.442.9344.2 ± 3.27.8 ± 0.227.6132.2
YOLO11x-seg64054.743.8664.5 ± 3.215.8 ± 0.762.1296.4

Classification Docsを参照してください。これらのモデルはImageNetで学習されており、1000個の学習済みクラスが含まれています。使用例が記載されています。

モデルサイズ
(ピクセル)
acc
top1
acc
top5
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B) at 224
YOLO11n-cls22470.089.45.0 ± 0.31.1 ± 0.02.80.5
YOLO11s-cls22475.492.77.9 ± 0.21.3 ± 0.06.71.6
YOLO11m-cls22477.393.917.2 ± 0.42.0 ± 0.011.64.9
YOLO11l-cls22478.394.323.2 ± 0.32.8 ± 0.014.16.2
YOLO11x-cls22479.594.941.4 ± 0.93.8 ± 0.029.613.6

Pose Estimation Docsを参照してください。これらのモデルはCOCOで学習されており、1つの学習済みクラス「person」が含まれています。使用例が記載されています。

モデルサイズ
(ピクセル)
mAPpose
50-95
mAPpose
50
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n-pose64050.081.052.4 ± 0.51.7 ± 0.02.97.4
YOLO11s-pose64058.986.390.5 ± 0.62.6 ± 0.09.923.1
YOLO11m-pose64064.989.4187.3 ± 0.84.9 ± 0.120.971.4
YOLO11l-pose64066.189.9247.7 ± 1.16.4 ± 0.126.190.3
YOLO11x-pose64069.591.1488.0 ± 13.912.1 ± 0.258.8202.8

Oriented Detection Docsを参照してください。これらのモデルはDOTAv1で学習されており、15個の学習済みクラスが含まれています。使用例が記載されています。

モデルサイズ
(ピクセル)
mAPtest
50
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n-obb102478.4117.6 ± 0.84.4 ± 0.02.716.8
YOLO11s-obb102479.5219.4 ± 4.05.1 ± 0.09.757.1
YOLO11m-obb102480.9562.8 ± 2.910.1 ± 0.420.9182.8
YOLO11l-obb102481.0712.5 ± 5.013.5 ± 0.626.1231.2
YOLO11x-obb102481.31408.6 ± 7.728.6 ± 1.058.8519.1

使用例

このセクションでは、簡単なYOLO11のトレーニングと推論の例を紹介します。これらおよびその他のモードに関する完全なドキュメントについては、PredictTrainVal、およびExportのドキュメントページを参照してください。

以下の例は、物体検出用のYOLO11 Detectモデルに関するものであることに注意してください。その他のサポートされているタスクについては、SegmentClassifyOBB、およびPoseのドキュメントを参照してください。

PyTorch 学習済み *.pt モデルおよび構成 *.yaml filesを以下に渡すことができます。 YOLO() pythonでモデルインスタンスを作成するためのclass:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

CLIコマンドは、モデルを直接実行するために利用できます。

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO11n model and run inference on the 'bus.jpg' image
yolo predict model=yolo11n.pt source=path/to/bus.jpg

引用と謝辞

Ultralytics YOLO11 の出版物

Ultralyticsは、モデルの急速な進化のため、YOLO11の正式な研究論文を発表していません。静的なドキュメントを作成するのではなく、テクノロジーを進歩させ、使いやすくすることに重点を置いています。YOLOアーキテクチャ、機能、および使用法に関する最新情報については、GitHubリポジトリおよびドキュメントを参照してください。

YOLO11 またはこのリポジトリのその他のソフトウェアを研究で使用する場合は、次の形式で引用してください。

@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOIは申請中であり、利用可能になり次第、引用に追加されます。YOLO11モデルは、AGPL-3.0およびEnterpriseライセンスの下で提供されます。

よくある質問

以前のバージョンと比較して、Ultralytics YOLO11の主な改善点は何ですか?

Ultralytics YOLO11 は、以前のバージョンに比べていくつかの重要な進歩をもたらします。主な改善点は次のとおりです。

  • 強化された特徴抽出: YOLO11は、改善されたバックボーンとネックのアーキテクチャを採用し、より正確な物体検出のために特徴抽出機能を強化します。
  • 効率と速度の最適化: 洗練されたアーキテクチャ設計と最適化されたトレーニングパイプラインにより、より高速な処理速度を実現し、精度とパフォーマンスのバランスを維持します。
  • より少ないパラメーターでより高い精度: YOLO11mは、YOLOv8mよりも22%少ないパラメーターでCOCOデータセットでより高い平均適合率(mAP)を実現し、精度を損なうことなく計算効率を高めています。
  • 環境全体での適応性: YOLO11は、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUをサポートするシステムなど、さまざまな環境にデプロイできます。
  • 広範なサポート対象タスク: YOLO11は、オブジェクト検出、インスタンスセグメンテーション、画像分類、ポーズ推定、指向性オブジェクト検出(OBB)など、多様なコンピュータビジョンタスクをサポートしています。

物体検出のために YOLO11 モデルをトレーニングするにはどうすればよいですか?

オブジェクト検出用のYOLO11モデルの学習は、PythonまたはCLIコマンドを使用して実行できます。以下は、両方のメソッドの例です。

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

詳細な手順については、Trainのドキュメントを参照してください。

YOLO11モデルはどのようなタスクを実行できますか?

YOLO11モデルは汎用性が高く、以下を含む幅広いコンピュータビジョンタスクをサポートしています。

  • 物体検出: 画像内の物体を識別して位置を特定します。
  • インスタンスセグメンテーション: オブジェクトを検出し、その境界を明確にします。
  • Image Classification(画像分類):画像を定義済みのクラスに分類します。
  • 姿勢推定: 人体上のキーポイントを検出および追跡します。
  • 傾斜物体検出 (OBB): 回転を伴う物体を検出し、精度を高めます。

各タスクの詳細については、DetectionInstance SegmentationClassificationPose Estimation、およびOriented Detectionのドキュメントをご覧ください。

YOLO11は、より少ないパラメータで、どのようにしてより高い精度を達成していますか?

YOLO11は、モデル設計と最適化技術の進歩により、より少ないパラメータでより高い精度を実現しています。改善されたアーキテクチャにより、効率的な特徴抽出と処理が可能になり、YOLOv8mよりも22%少ないパラメータを使用しながら、COCOなどのデータセットでより高い平均適合率(mAP)を実現しています。これにより、YOLO11は精度を損なうことなく計算効率が高く、リソースに制約のあるデバイスへの展開に適しています。

YOLO11をエッジデバイスにデプロイできますか?

はい、YOLO11は、エッジデバイスを含むさまざまな環境での適応性を考慮して設計されています。最適化されたアーキテクチャと効率的な処理能力により、エッジデバイス、クラウドプラットフォーム、およびNVIDIA GPUをサポートするシステムへのデプロイに適しています。この柔軟性により、YOLO11は、モバイルデバイスでのリアルタイム検出からクラウド環境での複雑なセグメンテーションタスクまで、多様なアプリケーションで使用できます。デプロイオプションの詳細については、エクスポートのドキュメントを参照してください。



📅作成:1年前 ✏️更新 5日前
glenn-jocherRizwanMunawarpderrengerY-T-GLaughing-qambitious-octopus

コメント