Dataset Cityscapes8

Introducción

El conjunto de datos Cityscapes8 de Ultralytics es un conjunto de datos compacto de segmentación semántica con 8 imágenes muestreadas del conjunto de datos Cityscapes: 4 para entrenamiento y 4 para validación. Está diseñado para pruebas rápidas, depuración y experimentación con modelos de segmentación semántica YOLO y flujos de trabajo de entrenamiento. Su contenido de escenas urbanas proporciona una comprobación útil del flujo de trabajo antes de escalar al conjunto de datos Cityscapes completo.

Cityscapes8 utiliza las mismas 19 clases de evaluación y el mismo comportamiento de label_mapping que el conjunto de datos Cityscapes completo, y es totalmente compatible con los flujos de trabajo de segmentación semántica de YOLO26.

YAML del dataset

La configuración del conjunto de datos Cityscapes8 se define en un archivo YAML de conjunto de datos, que especifica las rutas del conjunto de datos, los nombres de las clases y otros metadatos esenciales. Puedes revisar el archivo cityscapes8.yaml oficial en el repositorio de GitHub de Ultralytics. El YAML incluye una URL de descarga para el pequeño subconjunto empaquetado.

ultralytics/cfg/datasets/cityscapes8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Cityscapes semantic segmentation dataset (19 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/cityscapes8/
# Example usage: yolo semantic train data=cityscapes8.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
#     └── cityscapes8 ← downloads here (small subset)
#         └── images
#         └── masks

# Dataset root directory
path: cityscapes8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

masks_dir: masks # semantic mask directory

# Cityscapes 19-class labels
names:
  0: road
  1: sidewalk
  2: building
  3: wall
  4: fence
  5: pole
  6: traffic light
  7: traffic sign
  8: vegetation
  9: terrain
  10: sky
  11: person
  12: rider
  13: car
  14: truck
  15: bus
  16: train
  17: motorcycle
  18: bicycle

# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
  -1: ignore_label
  0: ignore_label
  1: ignore_label
  2: ignore_label
  3: ignore_label
  4: ignore_label
  5: ignore_label
  6: ignore_label
  7: 0
  8: 1
  9: ignore_label
  10: ignore_label
  11: 2
  12: 3
  13: 4
  14: ignore_label
  15: ignore_label
  16: ignore_label
  17: 5
  18: ignore_label
  19: 6
  20: 7
  21: 8
  22: 9
  23: 10
  24: 11
  25: 12
  26: 13
  27: 14
  28: 15
  29: ignore_label
  30: ignore_label
  31: 16
  32: 17
  33: 18

# Download URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/cityscapes8.zip

Uso

Para entrenar un modelo YOLO26n-sem en el conjunto de datos Cityscapes8 durante 100 epochs con un tamaño de imagen de 1024, utiliza los siguientes ejemplos. Para obtener una lista completa de las opciones de entrenamiento, consulta la documentación de entrenamiento de YOLO.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a pretrained YOLO26n-sem model
model = YOLO("yolo26n-sem.pt")

# Train the model on Cityscapes8
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Citas y agradecimientos

Si utilizas el conjunto de datos Cityscapes en tu investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

Un agradecimiento especial al equipo de Cityscapes por sus contribuciones continuas a las comunidades de conducción autónoma y visión artificial.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos Ultralytics Cityscapes8?

El conjunto de datos Ultralytics Cityscapes8 está diseñado para realizar pruebas rápidas y depuración de modelos de segmentación semántica. Con solo 8 imágenes (4 para entrenamiento, 4 para validación), es ideal para verificar los flujos de trabajo de segmentación semántica de YOLO, incluyendo la carga de máscaras, aumentos, validación y rutas de exportación, antes de escalar al conjunto de datos Cityscapes completo. Explora la configuración YAML de Cityscapes8 para más detalles.

¿Cómo entreno un modelo YOLO26 utilizando el conjunto de datos Cityscapes8?

Puedes entrenar un modelo de segmentación semántica YOLO26 en Cityscapes8 utilizando Python o la CLI:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a pretrained YOLO26n-sem model
model = YOLO("yolo26n-sem.pt")

# Train the model on Cityscapes8
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Para opciones de entrenamiento adicionales, consulta la documentación de entrenamiento de YOLO.

¿Debería utilizar Cityscapes8 para evaluación comparativa?

No. Cityscapes8 es demasiado pequeño para una comparación de modelos significativa y está destinado a la comprobación de los flujos de trabajo de entrenamiento y evaluación. Utiliza el conjunto de validación completo de Cityscapes cuando necesites resultados de referencia representativos para la segmentación semántica.

Comentarios