Link to this sectionADE20K-Datensatz#

Name: ADE20K Segmentierungsdatensatz
Creator: MIT CSAIL
License: https://ade20k.csail.mit.edu/terms
Keywords: ADE20K-Datensatz, semantische Segmentierung, Szenenanalyse, Ultralytics YOLO, YOLO26, ADEChallengeData2016, Computer Vision, Deep Learning

Das ADE20K Datenset ist ein groß angelegter semantic segmentation Benchmark vom MIT CSAIL mit 20.210 Trainings- und 2.000 Validierungsbildern, die dicht in 150 Innen-, Außen-, Objekt- und Stoffkategorien annotiert sind. Es ist eine Standardressource für das Training und die Evaluierung von Modellen zum dichten Szenenverständnis mit Ultralytics YOLO.

Link to this sectionHauptfunktionen#

Der vollständige SceneParsing-Benchmark von ADE20K umfasst insgesamt 25.562 Bilder: 20.210 für das Training, 2.000 für die Validierung und 3.352 für Tests. Da die Annotationen der Testbilder nicht öffentlich zugänglich sind, verwenden das herunterladbare ADEChallengeData2016-Archiv und die Ultralytics ade20k.yaml-Konfigurationsdatei nur die Trainings- und Validierungs-Splits.
Der Datensatz umfasst 150 semantische Klassen, die sich über Innen-, Außen-, Objekt- und Materialkategorien erstrecken.
Bei den Annotationen handelt es sich um dichte, pixelebene Segmentierungsmasken, die sich für das Szenen-Parsing eignen.

Link to this sectionDatensatzstruktur#

Die Ultralytics-Konfiguration erwartet das offizielle ADEChallengeData2016-Layout:

ADEChallengeData2016/
├── images/
│   ├── training/
│   └── validation/
└── annotations/
    ├── training/
    └── validation/

Manueller Download erforderlich

ADE20K verfügt über kein automatisches Download-Skript. Lade das ~1 GB große ADEChallengeData2016.zip Archiv herunter und entpacke es direkt in deinen datasets/ Ordner. Da der übergeordnete Ordner des Archivs bereits ADEChallengeData2016/ heißt, wird dadurch der Pfad datasets/ADEChallengeData2016/ erzeugt, der dem obigen Layout entspricht — erstelle keinen eigenen ADEChallengeData2016 Ordner, in den du das Archiv entpackst, da du sonst ein verschachteltes datasets/ADEChallengeData2016/ADEChallengeData2016/ Verzeichnis erhältst, das von der YAML-Datei nicht gefunden wird.

Das Feld masks_dir ist auf annotations eingestellt, sodass jedes Bild unter images/ mit seiner entsprechenden Maske unter annotations/ verknüpft ist. Die ursprünglichen ADE20K-Masken verwenden Quell-Label-IDs, bei denen 0 ignoriert wird, und der label_mapping-Abschnitt konvertiert gültige Labels von 1 bis 150 in zusammenhängende Trainings-IDs von 0 bis 149, wobei ignorierte Pixel auf 255 abgebildet werden.

Link to this sectionAnwendungen#

ADE20K wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen in den Bereichen semantische Segmentierung und Szenenanalyse verwendet. Seine vielfältigen Kategorien und komplexen Szenen machen ihn wertvoll für Anwendungen wie autonomes Navigieren, Robotik, Augmented Reality und Bildbearbeitung.

Die Vielfalt an Innen- und Außenaufnahmen macht ADE20K auch zu einem starken Benchmark für die Bewertung der Modellgeneralisierung über verschiedene Domänen hinweg. Vortrainierte YOLO26 Semantic Segmentation-Modelle erreichen bis zu 51,5 mIoU auf dem ADE20K-Validierungsset — siehe die Seite semantic segmentation models für die vollständige Benchmark-Tabelle. Datensätze im ADE20K-Format sind zudem vollständig mit der Ultralytics Platform für Datensatzmanagement und Training kompatibel.

Link to this sectionDatensatz-YAML#

Eine YAML-Datei für den Datensatz definiert die ADE20K-Pfade, Klassen, das Maskenverzeichnis und das Label-Mapping. Die ade20k.yaml-Datei wird unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/ade20k.yaml gepflegt.

ultralytics/cfg/datasets/ade20k.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# ADE20K semantic segmentation dataset (150 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/ade20k
# Example usage: yolo semantic train data=ade20k.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
#     └── ADEChallengeData2016 ← downloads here (1 GB)
#         └── images
#         └── annotations

# Dataset root directory
path: ADEChallengeData2016
train: images/training
val: images/validation

masks_dir: annotations # semantic mask directory

# ADE20K 150-class labels
names:
  0: wall
  1: building
  2: sky
  3: floor
  4: tree
  5: ceiling
  6: road
  7: bed
  8: windowpane
  9: grass
  10: cabinet
  11: sidewalk
  12: person
  13: earth
  14: door
  15: table
  16: mountain
  17: plant
  18: curtain
  19: chair
  20: car
  21: water
  22: painting
  23: sofa
  24: shelf
  25: house
  26: sea
  27: mirror
  28: rug
  29: field
  30: armchair
  31: seat
  32: fence
  33: desk
  34: rock
  35: wardrobe
  36: lamp
  37: bathtub
  38: railing
  39: cushion
  40: base
  41: box
  42: column
  43: signboard
  44: chest of drawers
  45: counter
  46: sand
  47: sink
  48: skyscraper
  49: fireplace
  50: refrigerator
  51: grandstand
  52: path
  53: stairs
  54: runway
  55: case
  56: pool table
  57: pillow
  58: screen door
  59: stairway
  60: river
  61: bridge
  62: bookcase
  63: blind
  64: coffee table
  65: toilet
  66: flower
  67: book
  68: hill
  69: bench
  70: countertop
  71: stove
  72: palm
  73: kitchen island
  74: computer
  75: swivel chair
  76: boat
  77: bar
  78: arcade machine
  79: hovel
  80: bus
  81: towel
  82: light
  83: truck
  84: tower
  85: chandelier
  86: awning
  87: streetlight
  88: booth
  89: television receiver
  90: airplane
  91: dirt track
  92: apparel
  93: pole
  94: land
  95: bannister
  96: escalator
  97: ottoman
  98: bottle
  99: buffet
  100: poster
  101: stage
  102: van
  103: ship
  104: fountain
  105: conveyor belt
  106: canopy
  107: washer
  108: plaything
  109: swimming pool
  110: stool
  111: barrel
  112: basket
  113: waterfall
  114: tent
  115: bag
  116: minibike
  117: cradle
  118: oven
  119: ball
  120: food
  121: step
  122: tank
  123: trade name
  124: microwave
  125: pot
  126: animal
  127: bicycle
  128: lake
  129: dishwasher
  130: screen
  131: blanket
  132: sculpture
  133: hood
  134: sconce
  135: vase
  136: traffic light
  137: tray
  138: ashcan
  139: fan
  140: pier
  141: crt screen
  142: plate
  143: monitor
  144: bulletin board
  145: shower
  146: radiator
  147: glass
  148: clock
  149: flag

# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
  0: ignore_label
  1: 0
  2: 1
  3: 2
  4: 3
  5: 4
  6: 5
  7: 6
  8: 7
  9: 8
  10: 9
  11: 10
  12: 11
  13: 12
  14: 13
  15: 14
  16: 15
  17: 16
  18: 17
  19: 18
  20: 19
  21: 20
  22: 21
  23: 22
  24: 23
  25: 24
  26: 25
  27: 26
  28: 27
  29: 28
  30: 29
  31: 30
  32: 31
  33: 32
  34: 33
  35: 34
  36: 35
  37: 36
  38: 37
  39: 38
  40: 39
  41: 40
  42: 41
  43: 42
  44: 43
  45: 44
  46: 45
  47: 46
  48: 47
  49: 48
  50: 49
  51: 50
  52: 51
  53: 52
  54: 53
  55: 54
  56: 55
  57: 56
  58: 57
  59: 58
  60: 59
  61: 60
  62: 61
  63: 62
  64: 63
  65: 64
  66: 65
  67: 66
  68: 67
  69: 68
  70: 69
  71: 70
  72: 71
  73: 72
  74: 73
  75: 74
  76: 75
  77: 76
  78: 77
  79: 78
  80: 79
  81: 80
  82: 81
  83: 82
  84: 83
  85: 84
  86: 85
  87: 86
  88: 87
  89: 88
  90: 89
  91: 90
  92: 91
  93: 92
  94: 93
  95: 94
  96: 95
  97: 96
  98: 97
  99: 98
  100: 99
  101: 100
  102: 101
  103: 102
  104: 103
  105: 104
  106: 105
  107: 106
  108: 107
  109: 108
  110: 109
  111: 110
  112: 111
  113: 112
  114: 113
  115: 114
  116: 115
  117: 116
  118: 117
  119: 118
  120: 119
  121: 120
  122: 121
  123: 122
  124: 123
  125: 124
  126: 125
  127: 126
  128: 127
  129: 128
  130: 129
  131: 130
  132: 131
  133: 132
  134: 133
  135: 134
  136: 135
  137: 136
  138: 137
  139: 138
  140: 139
  141: 140
  142: 141
  143: 142
  144: 143
  145: 144
  146: 145
  147: 146
  148: 147
  149: 148
  150: 149
# Download URL (manual): http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

Link to this sectionVerwendung#

Um ein YOLO26n-sem-Modell auf dem ADE20K-Datensatz für 100 Epochen mit einer Bildgröße von 512 zu trainieren, kannst du die folgenden Code-Schnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)

Link to this sectionZitate, Lizenz und Danksagungen#

ADE20K-Bilder sind nur für die nicht-kommerzielle Forschung und Bildungszwecke freigegeben; die Annotationssoftware des Datensatzes ist separat unter BSD-3 lizenziert. Eine kommerzielle Nutzung erfordert die Genehmigung durch das MIT CSAIL.

Wenn du den ADE20K-Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

Zitat

@inproceedings{zhou2017scene,
  title={Scene Parsing through ADE20K Dataset},
  author={Zhou, Bolei and Zhao, Hang and Puig, Xavier and Fidler, Sanja and Barriuso, Adela and Torralba, Antonio},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}

Wir möchten der MIT CSAIL Computer Vision Group dafür danken, dass sie diese wertvolle Ressource für die Computer-Vision-Community erstellt und gepflegt hat. Weitere Informationen über den ADE20K-Datensatz und seine Ersteller findest du auf der ADE20K-Dataset-Website.

Link to this sectionFAQ#

Link to this sectionWas ist der ADE20K-Datensatz und warum ist er wichtig für Computer Vision?#

Das ADE20K Datenset ist ein groß angelegter Benchmark für das Szenen-Parsing, der für semantic segmentation verwendet wird. Er enthält 20.210 Trainings- und 2.000 Validierungsbilder, die in 150 Kategorien unterteilt sind, welche Innen-, Außen-, Objekt- und Stoffklassen abdecken. Forscher nutzen ADE20K aufgrund seiner vielfältigen Szenen, des fein granulierten Kategoriesets und standardisierter Bewertungsmetriken wie mean Intersection over Union (mIoU), was es ideal für das Benchmarking von Modellen zur dichten Vorhersage macht.

Link to this sectionWie kann ich ein YOLO-Modell mit dem ADE20K-Datensatz trainieren?#

Um ein YOLO26n-sem-Modell auf dem ADE20K-Datensatz für 100 Epochen mit einer Bildgröße von 512 zu trainieren, kannst du die folgenden Code-Schnipsel verwenden. Eine detaillierte Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)

Link to this sectionWie ist der ADE20K-Datensatz strukturiert?#

Der ADE20K-Datensatz folgt dem offiziellen ADEChallengeData2016-Layout, wobei die Bilder unter images/training/ und images/validation/ sowie die entsprechenden Masken unter annotations/training/ und annotations/validation/ organisiert sind. Die Ultralytics-YAML-Datei verknüpft jedes Bild über das Feld masks_dir: annotations mit seiner Maske und verwendet label_mapping, um Quell-Label-IDs von 1 bis 150 in zusammenhängende Trainings-IDs von 0 bis 149 umzuwandeln, wobei das Ignore-Label auf 255 abgebildet wird.

Link to this sectionMuss ich ADE20K manuell herunterladen?#

Ja. Lade das ADEChallengeData2016.zip Archiv (~1 GB) herunter und entpacke es vor dem Training direkt in deinen datasets/ Ordner — der übergeordnete Ordner des Archivs heißt bereits ADEChallengeData2016/. Wenn du es dort entpackst (und nicht in einen separaten, selbst erstellten ADEChallengeData2016 Ordner), erhältst du das images/ und annotations/ Layout, das ade20k.yaml erwartet.

Link to this sectionWarum verwendet ADE20K `label_mapping`?#

ADE20K-Annotationsmasken speichern Quell-Label-IDs, wobei 0 die Ignore- oder Hintergrundklasse bezeichnet. Der label_mapping-Abschnitt bildet gültige Labels von 1 bis 150 auf zusammenhängende Trainings-IDs von 0 bis 149 ab und weist ignorierten Pixeln den Wert 255 zu, sodass sie während des Trainings und der Validierung von der Verlustberechnung und den Metriken ausgeschlossen werden.

Link to this sectionIst das ADE20K-Datenset für die kommerzielle Nutzung kostenlos?#

Nein. Die ADE20K-Bilder wurden unter Bedingungen veröffentlicht, die die Nutzung auf nicht-kommerzielle Forschung und Bildung beschränken; die dazugehörige Annotationssoftware ist separat unter BSD-3 lizenziert. Kontaktiere das MIT CSAIL für Optionen zur kommerziellen Lizenzierung.

Mitwirkende

GLglenn-jocher³ RAraimbekovm² LALaughing-q¹

Erstellt vor 2 MonatenAktualisiert vor 3 Tagen