画像分類
画像分類は3つのタスクの中で最も単純なもので、画像全体をあらかじめ定義されたクラスのいずれかに分類する。
画像分類器の出力は、単一のクラス・ラベルと信頼度スコアです。画像分類は、画像がどのクラスに属するかだけを知る必要があり、そのクラスのオブジェクトがどこにあるか、正確な形状は何かを知る必要がない場合に便利です。
見るんだ: Ultralytics YOLO タスクの探索:Ultralytics HUBを使用した画像分類
チップ
YOLO11 Classifyモデルは -cls
サフィックス、すなわち yolo11n-cls.pt
で事前に訓練されている。 イメージネット.
モデル
YOLO11 ここでは、事前学習されたClassifyモデルを示す。Detect、Segment、PoseモデルはCOCOデータセットで事前学習され、ClassifyモデルはImageNetデータセットで事前学習されています。
モデルは、初回使用時に最新のUltralytics リリースから自動的にダウンロードされます。
モデル | サイズ (ピクセル) |
acc top1 |
acc top5 |
速度 CPU ONNX (ms) |
スピード T4TensorRT10 (ms) |
params (M) |
FLOPs (B) at 640 |
---|---|---|---|---|---|---|---|
YOLO11n-cls | 224 | 70.0 | 89.4 | 5.0 ± 0.3 | 1.1 ± 0.0 | 1.6 | 3.3 |
YOLO11s-cls | 224 | 75.4 | 92.7 | 7.9 ± 0.2 | 1.3 ± 0.0 | 5.5 | 12.1 |
YOLO11m-cls | 224 | 77.3 | 93.9 | 17.2 ± 0.4 | 2.0 ± 0.0 | 10.4 | 39.3 |
YOLO11l-cls | 224 | 78.3 | 94.3 | 23.2 ± 0.3 | 2.8 ± 0.0 | 12.9 | 49.4 |
YOLO11x-cls | 224 | 79.5 | 94.9 | 41.4 ± 0.9 | 3.8 ± 0.0 | 28.4 | 110.4 |
- acc のモデル精度である。 イメージネット データセットの検証セット。
複製するyolo val classify data=path/to/ImageNet device=0
- スピード を使用してImageNetのval画像を平均化した。 アマゾンEC2 P4d インスタンスだ。
複製するyolo val classify data=path/to/ImageNet batch=1 device=0|cpu
電車
YOLO11n-clsをMNIST160データセットに画像サイズ64で100エポック学習させる。利用可能な引数の全リストは設定ページを参照。
例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.yaml") # build a new model from YAML
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n-cls.yaml").load("yolo11n-cls.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="mnist160", epochs=100, imgsz=64)
# Build a new model from YAML and start training from scratch
yolo classify train data=mnist160 model=yolo11n-cls.yaml epochs=100 imgsz=64
# Start training from a pretrained *.pt model
yolo classify train data=mnist160 model=yolo11n-cls.pt epochs=100 imgsz=64
# Build a new model from YAML, transfer pretrained weights to it and start training
yolo classify train data=mnist160 model=yolo11n-cls.yaml pretrained=yolo11n-cls.pt epochs=100 imgsz=64
データセット形式
YOLO 分類データセットのフォーマットについては、「データセットガイド」を参照してください。
バル
学習済みYOLO11n-clsモデルの検証 精度 を MNIST160 データセットに適用した。引数は必要ありません。 model
トレーニング data
と引数をモデル属性として使用する。
例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
metrics.top1 # top1 accuracy
metrics.top5 # top5 accuracy
予測する
訓練されたYOLO11n-clsモデルを使って、画像の予測を実行する。
例
詳細を見る predict
モードの詳細は 予測する ページを参照されたい。
輸出
YOLO11n-clsモデルを、ONNX 、CoreML などの異なるフォーマットにエクスポートします。
例
利用可能なYOLO11-cls エクスポート形式は以下の表の通りです。どのフォーマットでも format
引数、すなわち format='onnx'
または format='engine'
.エクスポートされたモデルを直接予測または検証することができます。 yolo predict model=yolo11n-cls.onnx
.使用例は、エクスポート完了後に表示されます。
フォーマット | format 議論 |
モデル | メタデータ | 議論 |
---|---|---|---|---|
PyTorch | - | yolo11n-cls.pt |
✅ | - |
TorchScript | torchscript |
yolo11n-cls.torchscript |
✅ | imgsz , optimize , batch |
ONNX | onnx |
yolo11n-cls.onnx |
✅ | imgsz , half , dynamic , simplify , opset , batch |
OpenVINO | openvino |
yolo11n-cls_openvino_model/ |
✅ | imgsz , half , dynamic , int8 , batch |
TensorRT | engine |
yolo11n-cls.engine |
✅ | imgsz , half , dynamic , simplify , workspace , int8 , batch |
CoreML | coreml |
yolo11n-cls.mlpackage |
✅ | imgsz , half , int8 , nms , batch |
TF SavedModel | saved_model |
yolo11n-cls_saved_model/ |
✅ | imgsz , keras , int8 , batch |
TF GraphDef | pb |
yolo11n-cls.pb |
❌ | imgsz , batch |
TF ライト | tflite |
yolo11n-cls.tflite |
✅ | imgsz , half , int8 , batch |
TF エッジTPU | edgetpu |
yolo11n-cls_edgetpu.tflite |
✅ | imgsz |
TF.js | tfjs |
yolo11n-cls_web_model/ |
✅ | imgsz , half , int8 , batch |
PaddlePaddle | paddle |
yolo11n-cls_paddle_model/ |
✅ | imgsz , batch |
MNN | mnn |
yolo11n-cls.mnn |
✅ | imgsz , batch , int8 , half |
NCNN | ncnn |
yolo11n-cls_ncnn_model/ |
✅ | imgsz , half , batch |
IMX500 | imx |
yolo11n-cls_imx_model/ |
✅ | imgsz , int8 |
詳細を見る export
詳細は 輸出 ページを参照されたい。
よくあるご質問
画像分類におけるYOLO11 の目的は?
YOLO11 などのモデルがある。 yolo11n-cls.pt
は、効率的な画像分類のために設計されている。これは、信頼度スコアとともに画像全体に単一のクラス・ラベルを割り当てる。これは、画像内のオブジェクトの位置や形状を特定するのではなく、画像の特定のクラスを知るだけで十分なアプリケーションに特に有用である。
画像分類のためのYOLO11 モデルの学習方法は?
YOLO11 モデルをトレーニングするには、Python またはCLI のいずれかのコマンドを使用する。たとえば yolo11n-cls
モデルをMNIST160データセットに適用し、画像サイズ64で100エポック行った:
例
その他の設定オプションについては、設定のページをご覧ください。
事前に訓練されたYOLO11 分類モデルはどこで手に入りますか?
事前に訓練されたYOLO11 の分類モデルは、次の場所で見つけることができる。 モデル セクションをご覧ください。以下のようなモデル yolo11n-cls.pt
, yolo11s-cls.pt
, yolo11m-cls.pt
などは イメージネット データセットは簡単にダウンロードでき、様々な画像分類タスクに使用できる。
学習させたYOLO11 モデルをさまざまな形式にエクスポートするには?
Python 、CLI コマンドを使って、学習済みのYOLO11 モデルをさまざまな形式にエクスポートすることができます。例えば、ONNX フォーマットにモデルをエクスポートする:
例
詳細なエクスポートオプションについては、エクスポートのページを参照してください。
学習したYOLO11 分類モデルを検証するにはどうすればよいですか?
MNIST160のようなデータセットで学習済みモデルの精度を検証するには、以下のPython またはCLI コマンドを使用できます:
例
詳しくはValidateセクションをご覧ください。