Meet YOLO26: next-gen vision AI.

Link to this sectionClassification d'images#

YOLO image classification of objects and scenes

La classification d'images est la plus simple des tâches prises en charge et consiste à classifier une image entière dans l'une des classes prédéfinies.

La sortie d'un classificateur d'images est une étiquette de classe unique et un score de confiance. La classification d'images est utile lorsque tu as seulement besoin de connaître la classe à laquelle appartient une image et que tu n'as pas besoin de savoir où se trouvent les objets de cette classe ni quelle est leur forme exacte.



Watch: Explore Ultralytics YOLO Tasks: Image Classification using Ultralytics Platform
Astuce

Les modèles YOLO26 Classify utilisent le suffixe -cls, par ex. yolo26n-cls.pt, et sont pré-entraînés sur ImageNet.

Link to this sectionModèles#

Les modèles de classification YOLO26 pré-entraînés sont présentés ici. Les modèles Detect, Segment et Pose sont pré-entraînés sur le jeu de données COCO, les modèles Semantic sont pré-entraînés sur Cityscapes, et les modèles Classify sont pré-entraînés sur le jeu de données ImageNet.

Les modèles sont téléchargés automatiquement depuis la dernière version Ultralytics lors de leur première utilisation.

Modèletaille
(pixels)
acc
top1
acc
top5
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B) à 224
YOLO26n-cls22471.490.15.0 ± 0.31.1 ± 0.02.80.5
YOLO26s-cls22476.092.97.9 ± 0.21.3 ± 0.06.71.6
YOLO26m-cls22478.194.217.2 ± 0.42.0 ± 0.011.64.9
YOLO26l-cls22479.094.623.2 ± 0.32.8 ± 0.014.16.2
YOLO26x-cls22479.995.041.4 ± 0.93.8 ± 0.029.613.6
  • Les valeurs acc sont les précisions des modèles sur le jeu de validation ImageNet.
    Reproduis cela avec yolo val classify data=path/to/ImageNet device=0
  • Vitesse calculée en moyenne sur les images de validation ImageNet en utilisant une instance Amazon EC2 P4d.
    Reproduis cela avec yolo val classify data=path/to/ImageNet batch=1 device=0|cpu
  • Les valeurs Params et FLOPs correspondent au modèle fusionné après model.fuse(), qui combine les couches Conv et BatchNorm. Les points de contrôle pré-entraînés conservent l'architecture d'entraînement complète et peuvent afficher des nombres plus élevés.

Link to this sectionEntraîner (Train)#

Entraîne YOLO26n-cls sur le jeu de données MNIST160 pendant 100 époques avec une taille d'image de 64. Pour une liste complète des arguments disponibles, consulte la page Configuration.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.yaml")  # build a new model from YAML
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-cls.yaml").load("yolo26n-cls.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="mnist160", epochs=100, imgsz=64)
Astuce

La classification YOLO d'Ultralytics utilise torchvision.transforms.RandomResizedCrop pour l'entraînement et torchvision.transforms.CenterCrop pour la validation et l'inférence. Ces transformations basées sur le recadrage supposent des entrées carrées et peuvent par inadvertance supprimer des régions importantes d'images avec des rapports d'aspect extrêmes, provoquant potentiellement une perte d'informations visuelles critiques pendant l'entraînement. Pour préserver l'image entière tout en conservant ses proportions, envisage d'utiliser torchvision.transforms.Resize au lieu des transformations de recadrage.

Tu peux implémenter cela en personnalisant ton pipeline d'augmentation via un ClassificationDataset et un ClassificationTrainer personnalisés.

import torch
import torchvision.transforms as T

from ultralytics import YOLO
from ultralytics.data.dataset import ClassificationDataset
from ultralytics.models.yolo.classify import ClassificationTrainer, ClassificationValidator

class CustomizedDataset(ClassificationDataset):
    """A customized dataset class for image classification with enhanced data augmentation transforms."""

    def __init__(self, root: str, args, augment: bool = False, prefix: str = ""):
        """Initialize a customized classification dataset with enhanced data augmentation transforms."""
        super().__init__(root, args, augment, prefix)

        # Add your custom training transforms here
        train_transforms = T.Compose(
            [
                T.Resize((args.imgsz, args.imgsz)),
                T.RandomHorizontalFlip(p=args.fliplr),
                T.RandomVerticalFlip(p=args.flipud),
                T.RandAugment(interpolation=T.InterpolationMode.BILINEAR),
                T.ColorJitter(brightness=args.hsv_v, contrast=args.hsv_v, saturation=args.hsv_s, hue=args.hsv_h),
                T.ToTensor(),
                T.Normalize(mean=torch.tensor(0), std=torch.tensor(1)),
                T.RandomErasing(p=args.erasing, inplace=True),
            ]
        )

        # Add your custom validation transforms here
        val_transforms = T.Compose(
            [
                T.Resize((args.imgsz, args.imgsz)),
                T.ToTensor(),
                T.Normalize(mean=torch.tensor(0), std=torch.tensor(1)),
            ]
        )
        self.torch_transforms = train_transforms if augment else val_transforms

class CustomizedTrainer(ClassificationTrainer):
    """A customized trainer class for YOLO classification models with enhanced dataset handling."""

    def build_dataset(self, img_path: str, mode: str = "train", batch=None):
        """Build a customized dataset for classification training and the validation during training."""
        return CustomizedDataset(root=img_path, args=self.args, augment=mode == "train", prefix=mode)

class CustomizedValidator(ClassificationValidator):
    """A customized validator class for YOLO classification models with enhanced dataset handling."""

    def build_dataset(self, img_path: str):
        """Build a customized dataset for classification standalone validation (no augmentation)."""
        return CustomizedDataset(root=img_path, args=self.args, augment=False, prefix=self.args.split)

model = YOLO("yolo26n-cls.pt")
model.train(data="imagenet1000", trainer=CustomizedTrainer, epochs=10, imgsz=224, batch=64)
model.val(data="imagenet1000", validator=CustomizedValidator, imgsz=224, batch=64)

Link to this sectionFormat de jeu de données#

Le format de jeu de données de classification YOLO est détaillé dans le Guide des jeux de données. Les jeux de données de classification peuvent également être gérés et étiquetés sur la plateforme Ultralytics.

Link to this sectionValider (Val)#

Valide la précision du modèle YOLO26n-cls entraîné sur le jeu de données MNIST160. Aucun argument n'est nécessaire car le model conserve ses data d'entraînement et ses arguments en tant qu'attributs du modèle.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val()  # no arguments needed, dataset and settings remembered
metrics.top1  # top1 accuracy
metrics.top5  # top5 accuracy
Astuce

Comme mentionné dans la section entraînement, tu peux gérer les rapports d'aspect extrêmes pendant l'entraînement en utilisant un ClassificationTrainer personnalisé. Tu dois appliquer la même approche pour obtenir des résultats de validation cohérents en implémentant un ClassificationValidator personnalisé lors de l'appel à la méthode val(). Reporte-toi à l'exemple de code complet dans la section entraînement pour les détails d'implémentation.

Link to this sectionPrédire (Predict)#

Utilise un modèle YOLO26n-cls entraîné pour exécuter des prédictions sur des images.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg")  # predict on an image

# Access the results
for result in results:
    top1 = result.probs.top1  # top predicted class ID
    top1_conf = result.probs.top1conf  # top prediction confidence
    top1_name = result.names[top1]  # top predicted class name

Voir les détails complets du mode predict sur la page Predict.

Link to this sectionSortie des résultats#

La classification d'images renvoie un objet Results par image. Le champ de prédiction principal est result.probs, qui contient le vecteur de probabilité de classe et des aides pour les meilleures prédictions.

AttributTypeFormeDescription
result.probsProbs(C,)Probabilités de classe.
result.probs.datatorch.float32(C,)Probabilité par classe.
result.probs.top1int()ID de la classe principale.
result.probs.top1conftorch.float32()Confiance principale.
result.probs.top5list[int](<=5)ID des 5 meilleures classes.

Pour les champs Results spécifiques à chaque tâche, consulte la section Predict Results by Task.

Link to this sectionExporter (Export)#

Exporte un modèle YOLO26n-cls vers un format différent tel que ONNX, CoreML, etc.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom-trained model

# Export the model
model.export(format="onnx")

Les formats d'exportation disponibles pour YOLO26-cls sont dans le tableau ci-dessous. Tu peux exporter vers n'importe quel format en utilisant l'argument format, par ex. format='onnx' ou format='engine'. Tu peux prédire ou valider directement sur les modèles exportés, par ex. yolo predict model=yolo26n-cls.onnx. Des exemples d'utilisation sont affichés pour ton modèle une fois l'exportation terminée.

FormatArgument formatModèleMétadonnéesArguments
PyTorch-yolo26n-cls.pt-
TorchScripttorchscriptyolo26n-cls.torchscriptimgsz, half, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-cls.onnximgsz, half, int8, dynamic, simplify, opset, nms, batch, data, fraction, device
OpenVINOopenvinoyolo26n-cls_openvino_model/imgsz, half, dynamic, int8, nms, batch, data, fraction, device
TensorRTengineyolo26n-cls.engineimgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-cls.mlpackageimgsz, dynamic, half, int8, nms, batch, device
TF SavedModelsaved_modelyolo26n-cls_saved_model/imgsz, keras, int8, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-cls.pbimgsz, batch, device
TF Litetfliteyolo26n-cls.tfliteimgsz, half, int8, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n-cls_edgetpu.tfliteimgsz, int8, data, fraction, device
TF.jstfjsyolo26n-cls_web_model/imgsz, half, int8, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n-cls_paddle_model/imgsz, batch, device
MNNmnnyolo26n-cls.mnnimgsz, batch, int8, half, device
NCNNncnnyolo26n-cls_ncnn_model/imgsz, half, batch, device
IMX500imxyolo26n-cls_imx_model/imgsz, int8, data, fraction, nms, device
RKNNrknnyolo26n-cls_rknn_model/imgsz, batch, name, int8, data, fraction, device
ExecuTorchexecutorchyolo26n-cls_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-cls_axelera_model/imgsz, batch, int8, data, fraction, device
DEEPXdeepxyolo26n-cls_deepx_model/imgsz, int8, data, optimize, device
Qualcomm QNNqnnyolo26n-cls_qnn.onnximgsz, batch, name, int8, data, fraction, device

Consulte les détails complets de export sur la page Export.

Link to this sectionFAQ#

Link to this sectionQuel est l'objectif de YOLO26 dans la classification d'images ?#

Les modèles YOLO26, tels que yolo26n-cls.pt, sont conçus pour une classification d'images efficace. Ils attribuent une seule étiquette de classe à une image entière ainsi qu'un score de confiance. Cela est particulièrement utile pour les applications où il suffit de connaître la classe spécifique d'une image plutôt que d'identifier l'emplacement ou la forme des objets dans l'image.

Link to this sectionComment entraîner un modèle YOLO26 pour la classification d'images ?#

Pour entraîner un modèle YOLO26, tu peux utiliser Python ou des commandes CLI. Par exemple, pour entraîner un modèle yolo26n-cls sur le jeu de données MNIST160 pendant 100 époques avec une taille d'image de 64 :

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist160", epochs=100, imgsz=64)

Pour plus d'options de configuration, visite la page Configuration.

Link to this sectionOù puis-je trouver des modèles de classification YOLO26 pré-entraînés ?#

Les modèles de classification YOLO26 pré-entraînés se trouvent dans la section Modèles. Des modèles comme yolo26n-cls.pt, yolo26s-cls.pt, yolo26m-cls.pt, etc., sont pré-entraînés sur le jeu de données ImageNet et peuvent être facilement téléchargés et utilisés pour diverses tâches de classification d'images.

Link to this sectionComment puis-je exporter un modèle YOLO26 entraîné vers différents formats ?#

Tu peux exporter un modèle YOLO26 entraîné vers divers formats en utilisant Python ou des commandes CLI. Par exemple, pour exporter un modèle au format ONNX :

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load the trained model

# Export the model to ONNX
model.export(format="onnx")

Pour des options d'exportation détaillées, reporte-toi à la page Export.

Link to this sectionComment valider un modèle de classification YOLO26 entraîné ?#

Pour valider la précision d'un modèle entraîné sur un jeu de données comme MNIST160, tu peux utiliser les commandes Python ou CLI suivantes :

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load the trained model

# Validate the model
metrics = model.val()  # no arguments needed, uses the dataset and settings from training
metrics.top1  # top1 accuracy
metrics.top5  # top5 accuracy

Pour plus d'informations, visite la section Validate.

Commentaires