Meet YOLO26: next-gen vision AI.

Link to this section画像分類#

YOLO image classification of objects and scenes

画像分類は、サポートされているタスクの中で最もシンプルで、画像全体を事前に定義されたクラスセットのいずれかに分類するものです。

画像分類器の出力は、単一のクラスラベルと信頼度スコアです。画像分類は、画像がどのクラスに属しているかを知る必要があり、そのクラスのオブジェクトがどこに配置されているか、あるいは正確な形状がどのようなものかを知る必要がない場合に役立ちます。



Watch: Explore Ultralytics YOLO Tasks: Image Classification using Ultralytics Platform
ヒント

YOLO26 Classifyモデルは-clsサフィックス(例:yolo26n-cls.pt)を使用し、ImageNetで事前学習されています。

Link to this sectionモデル#

YOLO26の事前学習済みClassifyモデルを以下に示します。Detect、Segment、PoseモデルはCOCOデータセットで、SemanticモデルはCityscapesで、ClassifyモデルはImageNetデータセットでそれぞれ事前学習されています。

モデルは、初回使用時に最新のUltralyticsリリースから自動的にダウンロードされます。

モデルサイズ
(ピクセル)
精度
top1
精度
top5
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B) at 224
YOLO26n-cls22471.490.15.0 ± 0.31.1 ± 0.02.80.5
YOLO26s-cls22476.092.97.9 ± 0.21.3 ± 0.06.71.6
YOLO26m-cls22478.194.217.2 ± 0.42.0 ± 0.011.64.9
YOLO26l-cls22479.094.623.2 ± 0.32.8 ± 0.014.16.2
YOLO26x-cls22479.995.041.4 ± 0.93.8 ± 0.029.613.6
  • accの値はImageNetデータセット検証セットにおけるモデルの精度です。
    再現手順: yolo val classify data=path/to/ImageNet device=0
  • Speed(速度)は、Amazon EC2 P4dインスタンスを使用してImageNet検証用画像で平均化されたものです。
    再現手順: yolo val classify data=path/to/ImageNet batch=1 device=0|cpu
  • Params(パラメータ)およびFLOPsの値は、Conv層とBatchNorm層を結合するmodel.fuse()実行後のフューズ済みモデルに対するものです。事前学習済みチェックポイントは、学習時の全アーキテクチャを保持しており、より高い数値を示す場合があります。

Link to this sectionトレーニング#

YOLO26n-clsをMNIST160データセットで、画像サイズ64、100エポックで学習させます。利用可能な引数の全リストについては、設定ページを参照してください。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.yaml")  # build a new model from YAML
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-cls.yaml").load("yolo26n-cls.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="mnist160", epochs=100, imgsz=64)
ヒント

Ultralytics YOLO分類では、学習用にtorchvision.transforms.RandomResizedCrop、検証および推論用にtorchvision.transforms.CenterCropを使用します。これらのクロップベースの変換は正方形の入力を前提としており、アスペクト比が極端な画像では重要な領域が意図せず切り取られ、学習中に重要な視覚情報が失われる可能性があります。画像全体をその比率を維持したまま保持するには、クロップ変換の代わりにtorchvision.transforms.Resizeの使用を検討してください。

これは、カスタムのClassificationDatasetおよびClassificationTrainerを通じてオーグメンテーションパイプラインをカスタマイズすることで実装できます。

import torch
import torchvision.transforms as T

from ultralytics import YOLO
from ultralytics.data.dataset import ClassificationDataset
from ultralytics.models.yolo.classify import ClassificationTrainer, ClassificationValidator

class CustomizedDataset(ClassificationDataset):
    """A customized dataset class for image classification with enhanced data augmentation transforms."""

    def __init__(self, root: str, args, augment: bool = False, prefix: str = ""):
        """Initialize a customized classification dataset with enhanced data augmentation transforms."""
        super().__init__(root, args, augment, prefix)

        # Add your custom training transforms here
        train_transforms = T.Compose(
            [
                T.Resize((args.imgsz, args.imgsz)),
                T.RandomHorizontalFlip(p=args.fliplr),
                T.RandomVerticalFlip(p=args.flipud),
                T.RandAugment(interpolation=T.InterpolationMode.BILINEAR),
                T.ColorJitter(brightness=args.hsv_v, contrast=args.hsv_v, saturation=args.hsv_s, hue=args.hsv_h),
                T.ToTensor(),
                T.Normalize(mean=torch.tensor(0), std=torch.tensor(1)),
                T.RandomErasing(p=args.erasing, inplace=True),
            ]
        )

        # Add your custom validation transforms here
        val_transforms = T.Compose(
            [
                T.Resize((args.imgsz, args.imgsz)),
                T.ToTensor(),
                T.Normalize(mean=torch.tensor(0), std=torch.tensor(1)),
            ]
        )
        self.torch_transforms = train_transforms if augment else val_transforms

class CustomizedTrainer(ClassificationTrainer):
    """A customized trainer class for YOLO classification models with enhanced dataset handling."""

    def build_dataset(self, img_path: str, mode: str = "train", batch=None):
        """Build a customized dataset for classification training and the validation during training."""
        return CustomizedDataset(root=img_path, args=self.args, augment=mode == "train", prefix=mode)

class CustomizedValidator(ClassificationValidator):
    """A customized validator class for YOLO classification models with enhanced dataset handling."""

    def build_dataset(self, img_path: str):
        """Build a customized dataset for classification standalone validation (no augmentation)."""
        return CustomizedDataset(root=img_path, args=self.args, augment=False, prefix=self.args.split)

model = YOLO("yolo26n-cls.pt")
model.train(data="imagenet1000", trainer=CustomizedTrainer, epochs=10, imgsz=224, batch=64)
model.val(data="imagenet1000", validator=CustomizedValidator, imgsz=224, batch=64)

Link to this sectionデータセット形式#

YOLO分類のデータセット形式の詳細については、データセットガイドをご覧ください。分類用データセットは、Ultralytics Platformで管理およびラベル付けすることも可能です。

Link to this section検証#

MNIST160データセットで、学習済みYOLO26n-clsモデルの精度を検証します。modelが学習時のdataと引数を属性として保持しているため、引数は不要です。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val()  # no arguments needed, dataset and settings remembered
metrics.top1  # top1 accuracy
metrics.top5  # top5 accuracy
ヒント

As mentioned in the training section, you can handle extreme aspect ratios during training by using a custom ClassificationTrainer. You need to apply the same approach for consistent validation results by implementing a custom ClassificationValidator when calling the val() method. Refer to the complete code example in the training section for implementation details.

Link to this section予測#

学習済みYOLO26n-clsモデルを使用して画像に対する予測を実行します。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg")  # predict on an image

# Access the results
for result in results:
    top1 = result.probs.top1  # top predicted class ID
    top1_conf = result.probs.top1conf  # top prediction confidence
    top1_name = result.names[top1]  # top predicted class name

predictモードの詳細については、予測(Predict)ページを参照してください。

Link to this section結果の出力#

画像分類では、画像ごとに1つのResultsオブジェクトが返されます。主要な予測フィールドはresult.probsで、クラス確率ベクトルとトップ予測用のヘルパーが含まれています。

属性タイプ形状説明
result.probsProbs(C,)クラス確率。
result.probs.datatorch.float32(C,)クラスごとの確率。
result.probs.top1int()トップクラスID。
result.probs.top1conftorch.float32()トップの信頼度。
result.probs.top5list[int](<=5)トップ5クラスID。

すべてのタスクにわたるタスク固有のResultsフィールドについては、タスク別予測結果(Predict Results by Task)セクションを参照してください。

Link to this sectionエクスポート#

YOLO26n-clsモデルをONNXやCoreMLなどの異なる形式にエクスポートします。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom-trained model

# Export the model
model.export(format="onnx")

利用可能なYOLO26-clsのエクスポート形式は以下の表の通りです。format引数を使用して任意の形式(例:format='onnx'format='engine')にエクスポートできます。エクスポートされたモデルで直接予測や検証を行うことも可能です(例:yolo predict model=yolo26n-cls.onnx)。エクスポート完了後、モデルの使用例が表示されます。

形式format引数モデルメタデータ引数
PyTorch-yolo26n-cls.pt-
TorchScripttorchscriptyolo26n-cls.torchscriptimgsz, half, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-cls.onnximgsz, half, int8, dynamic, simplify, opset, nms, batch, data, fraction, device
OpenVINOopenvinoyolo26n-cls_openvino_model/imgsz, half, dynamic, int8, nms, batch, data, fraction, device
TensorRTengineyolo26n-cls.engineimgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-cls.mlpackageimgsz, dynamic, half, int8, nms, batch, device
TF SavedModelsaved_modelyolo26n-cls_saved_model/imgsz, keras, int8, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-cls.pbimgsz, batch, device
TF Litetfliteyolo26n-cls.tfliteimgsz, half, int8, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n-cls_edgetpu.tfliteimgsz, int8, data, fraction, device
TF.jstfjsyolo26n-cls_web_model/imgsz, half, int8, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n-cls_paddle_model/imgsz, batch, device
MNNmnnyolo26n-cls.mnnimgsz, batch, int8, half, device
NCNNncnnyolo26n-cls_ncnn_model/imgsz, half, batch, device
IMX500imxyolo26n-cls_imx_model/imgsz, int8, data, fraction, nms, device
RKNNrknnyolo26n-cls_rknn_model/imgsz, batch, name, int8, data, fraction, device
ExecuTorchexecutorchyolo26n-cls_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-cls_axelera_model/imgsz, batch, int8, data, fraction, device
DEEPXdeepxyolo26n-cls_deepx_model/imgsz, int8, data, optimize, device
Qualcomm QNNqnnyolo26n-cls_qnn_model/imgsz, batch, name, int8, data, fraction, device

exportの詳細については、Exportページを参照してください。

Link to this sectionよくある質問 (FAQ)#

Link to this section画像分類におけるYOLO26の目的は何ですか?#

yolo26n-cls.ptのようなYOLO26モデルは、効率的な画像分類のために設計されています。画像全体に対して単一のクラスラベルと信頼度スコアを割り当てます。これは、画像内のオブジェクトの場所や形状を特定するよりも、画像がどのクラスに属しているかを知るだけで十分なアプリケーションに特に役立ちます。

Link to this section画像分類のためにYOLO26モデルを学習させるにはどうすればよいですか?#

YOLO26モデルの学習には、PythonまたはCLIコマンドを使用できます。例えば、MNIST160データセットで画像サイズ64、100エポックでyolo26n-clsモデルを学習させるには:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist160", epochs=100, imgsz=64)

その他の設定オプションについては、設定ページをご覧ください。

Link to this section事前学習済みのYOLO26分類モデルはどこにありますか?#

事前学習済みのYOLO26分類モデルはモデルセクションにあります。yolo26n-cls.ptyolo26s-cls.ptyolo26m-cls.ptなどのモデルはImageNetデータセットで事前学習されており、簡単にダウンロードして様々な画像分類タスクに使用できます。

Link to this section学習済みYOLO26モデルを異なる形式にエクスポートするにはどうすればよいですか?#

学習済みYOLO26モデルは、PythonまたはCLIコマンドを使用して様々な形式にエクスポートできます。例えば、ONNX形式にモデルをエクスポートするには:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load the trained model

# Export the model to ONNX
model.export(format="onnx")

詳細なエクスポートオプションについては、エクスポートページを参照してください。

Link to this section学習済みYOLO26分類モデルを検証するにはどうすればよいですか?#

MNIST160のようなデータセットで学習済みモデルの精度を検証するには、以下のPythonまたはCLIコマンドを使用できます:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load the trained model

# Validate the model
metrics = model.val()  # no arguments needed, uses the dataset and settings from training
metrics.top1  # top1 accuracy
metrics.top5  # top5 accuracy

詳細については、検証(Validate)セクションを参照してください。

コメント