Meet YOLO26: next-gen vision AI.

Link to this sectionSegmentation sémantique#

Semantic segmentation examples

La segmentation sémantique attribue une étiquette de classe à chaque pixel d'une image, produisant une carte de classe dense qui couvre toute la scène. Contrairement à la segmentation d'instance, qui sépare les objets individuels, la segmentation sémantique groupe tous les pixels d'une même classe ensemble, quel que soit le nombre d'objets distincts présents.



Watch: How to Train Ultralytics YOLO26 Semantic Segmentation Model on Custom Dataset | Ultralytics Platform

La sortie d'un modèle de segmentation sémantique est une carte de classe unique hauteur par largeur où chaque valeur de pixel correspond à un ID de classe prédit. Cela rend la segmentation sémantique idéale pour les tâches d'analyse de scène telles que la conduite autonome, l'imagerie médicale et la cartographie de l'occupation des sols.

Astuce

Utilise task=semantic ou la tâche CLI yolo semantic pour la segmentation sémantique. Les fichiers de modèle de segmentation sémantique YOLO26 utilisent le suffixe -sem, comme yolo26n-sem.pt.

Link to this sectionModèles#

Les modèles de segmentation sémantique YOLO26 pré-entraînés sur le jeu de données Cityscapes sont présentés ci-dessous.

Les modèles se téléchargent automatiquement depuis la dernière version d'Ultralytics lors de la première utilisation.

Modèletaille
(pixels)
mIoUvalVitesse
RTX3090 PyTorch
(ms)
params
(M)
FLOPs
(B)
YOLO26n-sem1024 × 204878.34.4 ± 0.01.622.7
YOLO26s-sem1024 × 204880.88.4 ± 0.06.588.8
YOLO26m-sem1024 × 204882.019.9 ± 0.114.3304.5
YOLO26l-sem1024 × 204882.926.5 ± 0.117.9384.7
YOLO26x-sem1024 × 204883.648.9 ± 0.240.2861.7
  • mIoUval les valeurs sont pour un modèle unique à échelle unique sur le jeu de validation Cityscapes.
    Reproduis avec yolo semantic val data=cityscapes.yaml device=0 imgsz=2048
  • Les métriques de Vitesse sont moyennées sur les images de validation de Cityscapes en utilisant une instance RTX3090.
    Reproduis avec yolo semantic val data=cityscapes.yaml batch=1 device=0|cpu imgsz=2048
  • Les valeurs Params et FLOPs correspondent au modèle fusionné après model.fuse(), qui combine les couches Conv et BatchNorm. Les points de contrôle pré-entraînés conservent l'architecture d'entraînement complète et peuvent afficher des nombres plus élevés.

Les modèles de segmentation sémantique YOLO26 pré-entraînés sur le jeu de données ADE20K sont présentés ci-dessous.

Les modèles se téléchargent automatiquement depuis la dernière version d'Ultralytics lors de la première utilisation.

Modèletaille
(pixels)
mIoUvalVitesse
RTX3090 PyTorch
(ms)
params
(M)
FLOPs
(B)
YOLO26n-sem-ade20k64038.83,9 ± 0,21.64,4
YOLO26s-sem-ade20k64045.64,2 ± 0,36.517,4
YOLO26m-sem-ade20k64047,44,7 ± 0,314.359,5
YOLO26l-sem-ade20k64049.78,3 ± 0,217.975,0
YOLO26x-sem-ade20k64051.59,9 ± 0,340.2168,1
  • Les valeurs mIoUval sont calculées pour un modèle unique et une échelle unique sur l'ensemble de validation ADE20K.
    Reproduis avec yolo semantic val model=yolo26n-sem-ade20k.pt data=ade20k.yaml device=0 imgsz=640, en remplaçant yolo26n-sem-ade20k.pt par le point de contrôle yolo26*-sem-ade20k.pt souhaité.
  • Les mesures de vitesse sont calculées en moyenne sur les images de validation ADE20K en utilisant une instance RTX3090.
    Reproduis avec yolo semantic val model=yolo26n-sem-ade20k.pt data=ade20k.yaml batch=1 device=0|cpu imgsz=640, en remplaçant yolo26n-sem-ade20k.pt par le point de contrôle yolo26*-sem-ade20k.pt souhaité.
  • Les valeurs Params et FLOPs correspondent au modèle fusionné après model.fuse(), qui combine les couches Conv et BatchNorm. Les points de contrôle pré-entraînés conservent l'architecture d'entraînement complète et peuvent afficher des nombres plus élevés.

Link to this sectionEntraîner (Train)#

Entraîne YOLO26n-sem sur le jeu de données Cityscapes8 pendant 100 époques avec une taille d'image de 1024. Pour une liste complète des arguments disponibles, consulte la page Configuration.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.yaml")  # build a new model from YAML
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-sem.yaml").load("yolo26n-sem.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Consulte les détails complets du mode train sur la page Entraînement.

Link to this sectionFormat de jeu de données#

Les jeux de données de segmentation sémantique utilisent des images de masque à canal unique, généralement PNG, où chaque valeur de pixel représente un ID de classe. Les pixels avec une valeur de 255 sont traités comme "ignorés" et exclus du calcul de la perte. Le fichier YAML du jeu de données doit spécifier les chemins vers les images et leurs répertoires de masques correspondants. Consulte le Guide du jeu de données de segmentation sémantique pour les détails sur le format. Les jeux de données pris en charge incluent Cityscapes et ADE20K.

Link to this sectionValider (Val)#

Valide la précision d'un modèle YOLO26n-sem entraîné sur un jeu de données de segmentation sémantique. Passe data explicitement afin que la validation utilise le YAML du jeu de données prévu.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val(data="cityscapes.yaml")
metrics.miou  # mean Intersection over Union
metrics.pixel_accuracy  # overall pixel accuracy

Link to this sectionPrédire (Predict)#

Utilise un modèle YOLO26n-sem entraîné pour effectuer des prédictions sur des images.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg")  # predict on an image

# Access the results
for result in results:
    semantic_mask = result.semantic_mask.data  # class map, shape (H,W), integer dtype selected by class count

Voir les détails complets du mode predict sur la page Predict.

Link to this sectionSortie des résultats#

La segmentation sémantique YOLO renvoie un objet Results par image. Chaque résultat stocke une carte de classe dense pour l'image entière au lieu d'une liste de masques d'objets. Les pixels ayant la même classe prédite partagent le même ID de classe, même lorsqu'ils appartiennent à des objets distincts.

AttributTypeFormeDescription
result.semantic_maskSemanticMask(H,W)Carte de classe dense.
result.semantic_mask.datatorch.uint8
torch.int16
torch.int32
(H,W)IDs de classe ; dtype sélectionné selon le nombre de classes.
result.masks--Aucun masque d'instance.
result.boxes--Aucune boîte/confiance d'instance.
result.masks.xy--Aucun polygone par défaut.

Pour les champs Results spécifiques à chaque tâche, consulte la section Predict Results by Task.

Link to this sectionSegmentation d'instance vs Sémantique#

AspectSegmentation d'instance (task="segment")Segmentation sémantique (task="semantic")
Objectif de prédictionSegmenter chaque objet détecté séparémentAttribuer un ID de classe à chaque pixel
Champ de sortieresult.masksresult.semantic_mask
Données principalesresult.masks.dataresult.semantic_mask.data
Forme(N,H,W)(H,W)
Valeurs de pixelValeurs de masque binaire : 0 ou 1IDs de classe : 0, 1, 2, ...
Dtypetorch.uint8torch.uint8
torch.int16
torch.int32
Objets de même classeConservés comme instances séparéesFusionnés dans la même région de classe
PolygonesOui, via result.masks.xy et result.masks.xynAucune sortie de polygone par défaut
Boîtes et confianceOui, via result.boxesAucune boîte ou score de confiance par instance
Utilisation typiqueComptage, suivi, découpage, mesure au niveau de l'objetÉtiquetage de scène dense, zone roulable, occupation des sols, régions médicales

Link to this sectionExporter (Export)#

Exporte un modèle YOLO26n-sem vers un format différent comme ONNX, CoreML, etc.

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Export the model
model.export(format="onnx")

Les formats d'exportation de segmentation sémantique YOLO26 disponibles sont dans le tableau ci-dessous. Tu peux exporter vers n'importe quel format en utilisant l'argument format, par exemple format='onnx' ou format='engine'. Tu peux prédire ou valider directement sur les modèles exportés, par exemple yolo predict model=yolo26n-sem.onnx. Des exemples d'utilisation sont montrés pour ton modèle une fois l'exportation terminée.

FormatArgument formatModèleMétadonnéesArguments
PyTorch-yolo26n-sem.pt-
TorchScripttorchscriptyolo26n-sem.torchscriptimgsz, quantize, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-sem.onnximgsz, quantize, dynamic, simplify, opset, nms, batch, data, fraction, device
OpenVINOopenvinoyolo26n-sem_openvino_model/imgsz, quantize, dynamic, nms, batch, data, fraction, device
TensorRTengineyolo26n-sem.engineimgsz, quantize, dynamic, simplify, workspace, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-sem.mlpackageimgsz, dynamic, quantize, nms, batch, device
TF SavedModelsaved_modelyolo26n-sem_saved_model/imgsz, keras, quantize, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-sem.pbimgsz, batch, device
TF Litetfliteyolo26n-sem.tfliteimgsz, quantize, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n-sem_edgetpu.tfliteimgsz, quantize, data, fraction, device
TF.jstfjsyolo26n-sem_web_model/imgsz, quantize, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n-sem_paddle_model/imgsz, batch, device
MNNmnnyolo26n-sem.mnnimgsz, batch, quantize, device
NCNNncnnyolo26n-sem_ncnn_model/imgsz, quantize, batch, device
IMX500imxyolo26n-sem_imx_model/imgsz, quantize, data, fraction, nms, device
RKNNrknnyolo26n-sem_rknn_model/imgsz, batch, name, quantize, data, fraction, device
ExecuTorchexecutorchyolo26n-sem_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-sem_axelera_model/imgsz, batch, quantize, data, fraction, device
DEEPXdeepxyolo26n-sem_deepx_model/imgsz, quantize, data, optimize, device
Qualcomm QNNqnnyolo26n-sem_qnn.onnximgsz, batch, name, quantize, data, fraction, device

Consulte les détails complets de export sur la page Export.

Link to this sectionFAQ#

Link to this sectionComment entraîner un modèle de segmentation sémantique YOLO26 sur un jeu de données personnalisé ?#

Pour entraîner un modèle de segmentation sémantique YOLO26 sur un jeu de données personnalisé, tu dois préparer des images de masque PNG où chaque valeur de pixel représente un ID de classe (0, 1, 2, ...) et les pixels avec une valeur de 255 sont ignorés pendant l'entraînement. Crée un fichier YAML de jeu de données pointant vers tes répertoires d'images et de masques, puis entraîne le modèle :

Exemple
from ultralytics import YOLO

# Load a pretrained YOLO26 semantic segmentation model
model = YOLO("yolo26n-sem.pt")

# Train the model
results = model.train(data="path/to/your_dataset.yaml", epochs=100, imgsz=512)

Consulte la page Configuration pour plus d'arguments disponibles.

Link to this sectionQuelle est la différence entre la segmentation d'instance et la segmentation sémantique ?#

La segmentation d'instance et la segmentation sémantique sont toutes deux des tâches au niveau du pixel, mais diffèrent de manière clé :

  • La segmentation sémantique attribue une étiquette de classe à chaque pixel mais ne distingue pas les objets individuels de la même classe. Par exemple, toutes les voitures dans une scène partagent la même étiquette de classe.
  • La segmentation d'instance identifie chaque objet individuel séparément, produisant des masques distincts pour chaque objet même s'ils appartiennent à la même classe.

La segmentation sémantique est la mieux adaptée aux tâches de compréhension de scène comme la conduite autonome et la cartographie de l'occupation des sols, tandis que la segmentation d'instance est préférée lorsque le comptage ou le suivi d'objets individuels est important.

Link to this sectionPuis-je utiliser des données de segmentation d'instance pour entraîner la segmentation sémantique ?#

Oui. Si ton jeu de données utilise des étiquettes de polygone Ultralytics YOLO (un .txt par image), omets masks_dir du YAML du jeu de données et le chargeur convertira automatiquement les polygones en masques sémantiques par image à la volée. Pour les jeux de données multi-classes (N > 1), une classe supplémentaire background est ajoutée automatiquement aux names. Pour les jeux de données à classe unique (N == 1), l'entraînement reste à 1 classe — ta classe déclarée devient 1 dans le masque et les pixels non couverts deviennent 0. Consulte le Guide du jeu de données de segmentation sémantique pour plus de détails.

Link to this sectionQuels jeux de données sont pris en charge pour la segmentation sémantique ?#

Ultralytics YOLO26 fournit des configurations intégrées pour plusieurs jeux de données de segmentation sémantique :

  • Cityscapes : Scènes de rue urbaines avec 19 classes, largement utilisées pour la recherche en conduite autonome.
  • ADE20K : Un jeu de données d'analyse de scène à grande échelle avec 150 classes.

Tu peux également utiliser tout jeu de données personnalisé fournissant des annotations de masque PNG où les valeurs de pixel correspondent aux IDs de classe.

Link to this sectionComment valider un modèle de segmentation sémantique YOLO26 pré-entraîné ?#

Valide un modèle de segmentation sémantique YOLO26 pré-entraîné avec le YAML de jeu de données utilisé pour l'évaluation :

Exemple
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-sem.pt")

# Validate the model
metrics = model.val(data="cityscapes.yaml")
print("Mean IoU:", metrics.miou)
print("Pixel Accuracy:", metrics.pixel_accuracy)

Ces étapes te fourniront des métriques de validation telles que l'intersection sur union moyenne (mIoU) et la précision par pixel, qui sont des mesures standard pour évaluer les performances de la segmentation sémantique.

Link to this sectionComment exporter un modèle de segmentation sémantique YOLO26 au format ONNX ?#

Exporte un modèle de segmentation sémantique YOLO26 au format ONNX avec Python ou des commandes CLI :

Exemple
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-sem.pt")

# Export the model to ONNX format
model.export(format="onnx")

Pour plus de détails sur l'exportation vers divers formats, reporte-toi à la page Export.

Commentaires