Conjunto de dados Cityscapes8

Introdução

O conjunto de dados Cityscapes8 da Ultralytics é um conjunto de dados compacto de segmentação semântica com 8 imagens retiradas do conjunto de dados Cityscapes: 4 para treino e 4 para validação. Foi concebido para testes rápidos, depuração e experimentação com modelos de segmentação semântica YOLO e pipelines de treino. O seu conteúdo de cenas urbanas proporciona uma verificação útil do pipeline antes de escalar para o conjunto de dados Cityscapes completo.

O Cityscapes8 utiliza as mesmas 19 classes de avaliação e o mesmo comportamento de label_mapping que o conjunto de dados Cityscapes completo, sendo totalmente compatível com os fluxos de trabalho de segmentação semântica do YOLO26.

YAML do conjunto de dados

A configuração do conjunto de dados Cityscapes8 está definida num ficheiro YAML de conjunto de dados, que especifica caminhos, nomes de classes e outros metadados essenciais. Podes consultar o ficheiro oficial cityscapes8.yaml no repositório GitHub da Ultralytics. O YAML inclui um URL de transferência para o pequeno subconjunto empacotado.

ultralytics/cfg/datasets/cityscapes8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Cityscapes semantic segmentation dataset (19 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/cityscapes8/
# Example usage: yolo semantic train data=cityscapes8.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
#     └── cityscapes8 ← downloads here (small subset)
#         └── images
#         └── masks

# Dataset root directory
path: cityscapes8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

masks_dir: masks # semantic mask directory

# Cityscapes 19-class labels
names:
  0: road
  1: sidewalk
  2: building
  3: wall
  4: fence
  5: pole
  6: traffic light
  7: traffic sign
  8: vegetation
  9: terrain
  10: sky
  11: person
  12: rider
  13: car
  14: truck
  15: bus
  16: train
  17: motorcycle
  18: bicycle

# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
  -1: ignore_label
  0: ignore_label
  1: ignore_label
  2: ignore_label
  3: ignore_label
  4: ignore_label
  5: ignore_label
  6: ignore_label
  7: 0
  8: 1
  9: ignore_label
  10: ignore_label
  11: 2
  12: 3
  13: 4
  14: ignore_label
  15: ignore_label
  16: ignore_label
  17: 5
  18: ignore_label
  19: 6
  20: 7
  21: 8
  22: 9
  23: 10
  24: 11
  25: 12
  26: 13
  27: 14
  28: 15
  29: ignore_label
  30: ignore_label
  31: 16
  32: 17
  33: 18

# Download URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/cityscapes8.zip

Uso

Para treinar um modelo YOLO26n-sem no conjunto de dados Cityscapes8 durante 100 épocas com um tamanho de imagem de 1024, utiliza os seguintes exemplos. Para uma lista completa de opções de treino, consulta a documentação de Treino YOLO.

Exemplo de treinamento
from ultralytics import YOLO

# Load a pretrained YOLO26n-sem model
model = YOLO("yolo26n-sem.pt")

# Train the model on Cityscapes8
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Citações e Agradecimentos

Se utilizares o conjunto de dados Cityscapes na tua investigação ou desenvolvimento, por favor cita o seguinte artigo:

Citação
@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

Um agradecimento especial à equipa Cityscapes pelas suas contribuições contínuas para as comunidades de condução autónoma e visão computacional.

Perguntas Frequentes

Para que serve o conjunto de dados Ultralytics Cityscapes8?

O conjunto de dados Ultralytics Cityscapes8 foi concebido para testes rápidos e depuração de modelos de segmentação semântica. Com apenas 8 imagens (4 para treino, 4 para validação), é ideal para verificar pipelines de segmentação semântica YOLO, incluindo o carregamento de máscaras, aumentações, validação e caminhos de exportação, antes de escalar para o conjunto de dados Cityscapes completo. Explora a configuração YAML do Cityscapes8 para mais detalhes.

Como posso treinar um modelo YOLO26 usando o conjunto de dados Cityscapes8?

Podes treinar um modelo de segmentação semântica YOLO26 no Cityscapes8 usando Python ou a CLI:

Exemplo de treinamento
from ultralytics import YOLO

# Load a pretrained YOLO26n-sem model
model = YOLO("yolo26n-sem.pt")

# Train the model on Cityscapes8
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Para opções de treino adicionais, consulta a documentação de Treino YOLO.

Devo usar o Cityscapes8 para benchmarking?

Não. O Cityscapes8 é demasiado pequeno para uma comparação significativa de modelos e destina-se a verificações de pipelines de treino e avaliação. Usa o conjunto de validação completo Cityscapes quando precisares de resultados de referência representativos para segmentação semântica.

Comentários