Link to this sectionНабор данных Cityscapes#
Набор данных Cityscapes — это масштабный эталонный тест для семантической сегментации, сфокусированный на городских уличных сценах, снятых в 50 европейских городах. Он предоставляет высококачественные аннотации на уровне пикселей и является одним из самых широко используемых наборов данных для исследований в области беспилотного вождения и понимания городских сцен с помощью моделей Ultralytics YOLO.
Link to this sectionОсновные характеристики#
- Детальные аннотации Cityscapes включают 2 975 обучающих изображений, 500 валидационных и 1 525 тестовых изображений.
- Набор данных охватывает 19 оценочных классов, включая категории дорог, транспортных средств, людей, строений, объектов, природы и неба.
- Cityscapes предоставляет стандартизированные метрики оценки, такие как среднее пересечение по объединению (mIoU) для семантической сегментации, что позволяет эффективно сравнивать производительность моделей.
Link to this sectionСтруктура набора данных#
Конфигурация Ultralytics ожидает следующую структуру после подготовки:
cityscapes/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
└── masks/
├── train/
├── val/
└── test/Семантические маски представляют собой одноканальные PNG-файлы. Исходные идентификаторы меток Cityscapes преобразуются в стандартные 19 обучающих идентификаторов через раздел label_mapping, а игнорируемые или пустые метки сопоставляются с 255, чтобы они исключались из обучения и оценки. Загрузи официальные архивы leftImg8bit и gtFine с веб-сайта Cityscapes и распакуй их в корневую папку набора данных; затем блок подготовки в cityscapes.yaml организует изображения и маски в эту структуру.
Link to this sectionПрименение#
Cityscapes широко используется для обучения и оценки моделей глубинного обучения в семантической сегментации, особенно для беспилотного вождения, передовых систем помощи водителю (ADAS) и городской робототехники.
Его изображения высокого разрешения и детальные аннотации также делают его ценным для исследований в области анализа сцен в реальном времени, распознавания полос и препятствий, а также для любой задачи, требующей плотного понимания сложных городских сред на уровне пикселей.
Link to this sectionYAML набора данных#
YAML-файл набора данных определяет пути, классы, каталог масок и сопоставление меток Cityscapes. Файл cityscapes.yaml поддерживается по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/cityscapes.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Cityscapes semantic segmentation dataset (19 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/cityscapes/
# Example usage: yolo semantic train data=cityscapes.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
# └── cityscapes ← downloads here (11 GB)
# └── images
# └── masks
# Dataset root directory
path: cityscapes # dataset root dir
train: images/train # train images (relative to 'path') 2975 images
val: images/val # val images (relative to 'path') 500 images
test: images/test # test images (relative to 'path') 1525 images
masks_dir: masks # semantic mask directory
# Cityscapes 19-class labels
names:
0: road
1: sidewalk
2: building
3: wall
4: fence
5: pole
6: traffic light
7: traffic sign
8: vegetation
9: terrain
10: sky
11: person
12: rider
13: car
14: truck
15: bus
16: train
17: motorcycle
18: bicycle
# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
-1: ignore_label
0: ignore_label
1: ignore_label
2: ignore_label
3: ignore_label
4: ignore_label
5: ignore_label
6: ignore_label
7: 0
8: 1
9: ignore_label
10: ignore_label
11: 2
12: 3
13: 4
14: ignore_label
15: ignore_label
16: ignore_label
17: 5
18: ignore_label
19: 6
20: 7
21: 8
22: 9
23: 10
24: 11
25: 12
26: 13
27: 14
28: 15
29: ignore_label
30: ignore_label
31: 16
32: 17
33: 18
# Preparation script (requires manual Cityscapes download)
download: |
from pathlib import Path
from shutil import copy2
cityscapes_dir = Path(yaml["path"]) # dataset root dir
# Download and extract the official Cityscapes leftImg8bit and gtFine archives into cityscapes_dir first.
leftimg8bit_dir = cityscapes_dir / "leftImg8bit"
gtfine_dir = cityscapes_dir / "gtFine"
for split in ("train", "val", "test"):
print(f"Processing {split} set")
src_image_dir = leftimg8bit_dir / split
dst_image_dir = cityscapes_dir / "images" / split
dst_mask_dir = cityscapes_dir / "masks" / split
dst_image_dir.mkdir(parents=True, exist_ok=True)
dst_mask_dir.mkdir(parents=True, exist_ok=True)
image_paths = sorted(src_image_dir.rglob("*_leftImg8bit.png"))
for image_path in image_paths:
relative_path = image_path.relative_to(src_image_dir)
mask_path = gtfine_dir / split / relative_path.parent / image_path.name.replace(
"_leftImg8bit.png", "_gtFine_labelIds.png"
)
if not mask_path.exists():
raise FileNotFoundError(f"Mask not found for {image_path}: {mask_path}")
image_name = image_path.name.replace("_leftImg8bit", "")
mask_name = mask_path.name.replace("_gtFine_labelIds", "")
copy2(image_path, dst_image_dir / image_name)
copy2(mask_path, dst_mask_dir / mask_name)Link to this sectionИспользование#
Чтобы обучить модель YOLO26n-sem на наборе данных Cityscapes в течение 100 эпох с размером изображения 1024, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице обучения моделей.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-sem.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cityscapes.yaml", epochs=100, imgsz=1024)Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных Cityscapes в своей исследовательской или проектной работе, пожалуйста, сошлися на следующую публикацию:
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}Мы хотели бы выразить признательность команде Cityscapes за создание и поддержку этого ценного ресурса для сообществ, занимающихся беспилотным вождением и компьютерным зрением. Для получения дополнительной информации о наборе данных Cityscapes и его создателях посети веб-сайт набора данных Cityscapes.
Link to this sectionЧасто задаваемые вопросы#
Link to this sectionЧто такое набор данных Cityscapes и почему он важен для компьютерного зрения?#
Набор данных Cityscapes — это масштабный эталонный тест для семантической сегментации, сфокусированный на городских уличных сценах, снятых в 50 европейских городах. Он содержит 5 000 детально аннотированных изображений по 19 оценочным классам, что делает его фундаментальным ресурсом для исследований в области беспилотного вождения и понимания городских сцен. Изображения высокого разрешения, плотные аннотации и стандартизированная метрика среднего пересечения по объединению (mIoU) делают его идеальным для бенчмаркинга моделей плотного прогнозирования.
Link to this sectionКак я могу обучить модель YOLO, используя набор данных Cityscapes?#
Чтобы обучить модель YOLO26n-sem на наборе данных Cityscapes в течение 100 эпох с размером изображения 1024, ты можешь использовать следующие фрагменты кода. Подробный список доступных аргументов смотри на странице обучения модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-sem.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cityscapes.yaml", epochs=100, imgsz=1024)Link to this sectionКак структурирован набор данных Cityscapes?#
После подготовки набор данных организуется в каталоги images/{train,val,test}/ и masks/{train,val,test}/, где каждое изображение связано с одноканальной PNG-маской. YAML-файл Ultralytics связывает каждое изображение с его маской через поле masks_dir: masks и использует label_mapping для преобразования исходных идентификаторов меток Cityscapes в стандартные 19 непрерывных обучающих идентификаторов, сопоставляя игнорируемые и пустые метки с 255.
Link to this sectionНужно ли мне скачивать Cityscapes вручную?#
Да. Cityscapes требует принятия условий использования на официальном сайте. Скачай и распакуй leftImg8bit и gtFine в корень набора данных cityscapes перед использованием блока подготовки в cityscapes.yaml для создания требуемой структуры images/ и masks/.
Link to this sectionПочему Cityscapes использует label_mapping?#
Исходные маски Cityscapes содержат оригинальные идентификаторы меток, которые отличаются от 19 обучающих идентификаторов, используемых для оценки. Раздел label_mapping преобразует действительные метки в непрерывные идентификаторы классов от 0 до 18 и присваивает 255 игнорируемым и пустым меткам, чтобы они исключались из функции потерь и метрик во время обучения и валидации.