Jeu de données Cityscapes8

Introduction

Le jeu de données Cityscapes8 d'Ultralytics est un jeu de données compact de segmentation sémantique comprenant 8 images échantillonnées à partir du jeu de données Cityscapes : 4 pour l'entraînement et 4 pour la validation. Il est conçu pour le test rapide, le débogage et l'expérimentation avec les modèles de segmentation sémantique YOLO et les pipelines d'entraînement. Son contenu composé de scènes urbaines offre une vérification de pipeline utile avant de passer à l'échelle sur le jeu de données Cityscapes complet.

Cityscapes8 utilise les 19 mêmes classes d'évaluation et le même comportement de label_mapping que le jeu de données Cityscapes complet, et est entièrement compatible avec les workflows de segmentation sémantique YOLO26.

YAML du jeu de données

La configuration du jeu de données Cityscapes8 est définie dans un fichier YAML de jeu de données, qui précise les chemins d'accès aux données, les noms des classes et d'autres métadonnées essentielles. Tu peux consulter le fichier cityscapes8.yaml officiel dans le dépôt GitHub d'Ultralytics. Le YAML inclut une URL de téléchargement pour le petit sous-ensemble packagé.

ultralytics/cfg/datasets/cityscapes8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Cityscapes semantic segmentation dataset (19 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/cityscapes8/
# Example usage: yolo semantic train data=cityscapes8.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
#     └── cityscapes8 ← downloads here (small subset)
#         └── images
#         └── masks

# Dataset root directory
path: cityscapes8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

masks_dir: masks # semantic mask directory

# Cityscapes 19-class labels
names:
  0: road
  1: sidewalk
  2: building
  3: wall
  4: fence
  5: pole
  6: traffic light
  7: traffic sign
  8: vegetation
  9: terrain
  10: sky
  11: person
  12: rider
  13: car
  14: truck
  15: bus
  16: train
  17: motorcycle
  18: bicycle

# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
  -1: ignore_label
  0: ignore_label
  1: ignore_label
  2: ignore_label
  3: ignore_label
  4: ignore_label
  5: ignore_label
  6: ignore_label
  7: 0
  8: 1
  9: ignore_label
  10: ignore_label
  11: 2
  12: 3
  13: 4
  14: ignore_label
  15: ignore_label
  16: ignore_label
  17: 5
  18: ignore_label
  19: 6
  20: 7
  21: 8
  22: 9
  23: 10
  24: 11
  25: 12
  26: 13
  27: 14
  28: 15
  29: ignore_label
  30: ignore_label
  31: 16
  32: 17
  33: 18

# Download URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/cityscapes8.zip

Utilisation

Pour entraîner un modèle YOLO26n-sem sur le jeu de données Cityscapes8 pendant 100 époques avec une taille d'image de 1024, utilise les exemples suivants. Pour une liste complète des options d'entraînement, consulte la documentation sur l'entraînement YOLO.

Exemple d'entraînement
from ultralytics import YOLO

# Load a pretrained YOLO26n-sem model
model = YOLO("yolo26n-sem.pt")

# Train the model on Cityscapes8
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Citations et remerciements

Si tu utilises le jeu de données Cityscapes dans tes recherches ou ton développement, merci de citer l'article suivant :

Citation
@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

Un grand merci à l'équipe Cityscapes pour ses contributions continues aux communautés de la conduite autonome et de la vision par ordinateur.

FAQ

À quoi sert le jeu de données Ultralytics Cityscapes8 ?

Le jeu de données Ultralytics Cityscapes8 est conçu pour le test et le débogage rapides des modèles de segmentation sémantique. Avec seulement 8 images (4 pour l'entraînement, 4 pour la validation), il est idéal pour vérifier les pipelines de segmentation sémantique YOLO, y compris le chargement des masques, les augmentations, la validation et les chemins d'exportation, avant de passer à l'échelle sur le jeu de données Cityscapes complet. Explore la configuration YAML de Cityscapes8 pour plus de détails.

Comment entraîner un modèle YOLO26 en utilisant le jeu de données Cityscapes8 ?

Tu peux entraîner un modèle de segmentation sémantique YOLO26 sur Cityscapes8 en utilisant Python ou l'interface CLI :

Exemple d'entraînement
from ultralytics import YOLO

# Load a pretrained YOLO26n-sem model
model = YOLO("yolo26n-sem.pt")

# Train the model on Cityscapes8
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Pour des options d'entraînement supplémentaires, réfère-toi à la documentation sur l'entraînement YOLO.

Dois-je utiliser Cityscapes8 pour le benchmarking ?

Non. Cityscapes8 est trop petit pour une comparaison significative des modèles et est destiné aux vérifications de pipeline d'entraînement et d'évaluation. Utilise l'ensemble de validation Cityscapes complet quand tu as besoin de résultats de benchmark représentatifs pour la segmentation sémantique.

Commentaires