Link to this sectionADE20K 데이터셋#

Name: ADE20K 세그멘테이션 데이터셋
Creator: MIT CSAIL
License: https://ade20k.csail.mit.edu/terms
Keywords: ADE20K 데이터셋, 시맨틱 세그멘테이션, 장면 파싱, Ultralytics YOLO, YOLO26, ADEChallengeData2016, 컴퓨터 비전, 딥러닝

ADE20K 데이터셋은 MIT CSAIL에서 제공하는 대규모 semantic segmentation 벤치마크로, 150개의 실내, 실외, 객체 및 사물 카테고리에 걸쳐 20,210개의 학습 이미지와 2,000개의 검증 이미지가 조밀하게 주석 처리되어 있습니다. 이 데이터셋은 Ultralytics YOLO를 사용하여 조밀한 장면 이해(dense scene-understanding) 모델을 학습하고 평가하기 위한 표준 리소스입니다.

Link to this section주요 특징#

ADE20K의 전체 SceneParsing 벤치마크는 총 25,562개의 이미지로 구성되며, 학습용 20,210개, 검증용 2,000개, 테스트용 3,352개입니다. 테스트 이미지 주석은 공개되지 않으므로, 다운로드 가능한 ADEChallengeData2016 아카이브와 Ultralytics ade20k.yaml 구성 파일은 학습 및 검증 분할 데이터만 사용합니다.
이 데이터셋은 실내, 실외, 객체 및 사물 카테고리에 걸쳐 150개의 의미론적 클래스를 포함합니다.
주석은 장면 파싱(scene parsing)에 적합한 조밀한 픽셀 수준의 segmentation 마스크입니다.

Link to this section데이터셋 구조#

Ultralytics 구성은 공식 ADEChallengeData2016 레이아웃을 사용합니다:

ADEChallengeData2016/
├── images/
│   ├── training/
│   └── validation/
└── annotations/
    ├── training/
    └── validation/

수동 다운로드 필요

ADE20K는 자동 다운로드 스크립트를 제공하지 않습니다. ~1 GB 크기의 ADEChallengeData2016.zip 아카이브를 다운로드하여 datasets/ 폴더에 직접 압축을 해제하십시오. 아카이브의 최상위 폴더 이름이 이미 ADEChallengeData2016/이므로, 이 과정을 통해 datasets/ADEChallengeData2016/ 구조가 생성되며 이는 위의 레이아웃과 일치합니다. 직접 ADEChallengeData2016 폴더를 생성하고 그 안에 압축을 풀지 마십시오. 그렇지 않으면 중첩된 datasets/ADEChallengeData2016/ADEChallengeData2016/ 디렉토리가 생성되어 YAML 파일이 이를 찾을 수 없게 됩니다.

masks_dir 필드는 annotations로 설정되어 있어 images/ 하위의 각 이미지는 annotations/ 하위의 해당 마스크와 쌍을 이룹니다. 원본 ADE20K 마스크는 0이 무시되는 소스 레이블 ID를 사용하며, label_mapping 섹션은 유효한 레이블 1부터 150까지를 연속적인 학습 ID 0부터 149로 변환하고 무시되는 픽셀을 255로 매핑합니다.

Link to this section응용 분야#

ADE20K는 semantic segmentation 및 장면 파싱 분야의 deep learning 모델을 학습하고 평가하는 데 널리 사용됩니다. 다양한 카테고리와 복잡한 장면 덕분에 자율 주행, 로봇 공학, 증강 현실 및 이미지 편집과 같은 응용 분야에서 가치가 높습니다.

다양한 실내외 장면 덕분에 ADE20K는 도메인 전반에 걸쳐 모델의 일반화 능력을 평가하기 위한 강력한 벤치마크이기도 합니다. 사전 학습된 YOLO26 semantic segmentation 모델은 ADE20K 검증 세트에서 최대 51.5 mIoU를 달성합니다. 자세한 전체 벤치마크 표는 semantic segmentation models 페이지를 참조하십시오. ADE20K 형식의 데이터셋은 데이터셋 관리 및 학습을 위해 Ultralytics Platform과도 완벽하게 호환됩니다.

Link to this section데이터셋 YAML#

데이터셋 YAML 파일은 ADE20K 경로, 클래스, 마스크 디렉토리 및 레이블 매핑을 정의합니다. ade20k.yaml 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/ade20k.yaml에서 유지 관리됩니다.

ultralytics/cfg/datasets/ade20k.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# ADE20K semantic segmentation dataset (150 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/ade20k
# Example usage: yolo semantic train data=ade20k.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
#     └── ADEChallengeData2016 ← downloads here (1 GB)
#         └── images
#         └── annotations

# Dataset root directory
path: ADEChallengeData2016
train: images/training
val: images/validation

masks_dir: annotations # semantic mask directory

# ADE20K 150-class labels
names:
  0: wall
  1: building
  2: sky
  3: floor
  4: tree
  5: ceiling
  6: road
  7: bed
  8: windowpane
  9: grass
  10: cabinet
  11: sidewalk
  12: person
  13: earth
  14: door
  15: table
  16: mountain
  17: plant
  18: curtain
  19: chair
  20: car
  21: water
  22: painting
  23: sofa
  24: shelf
  25: house
  26: sea
  27: mirror
  28: rug
  29: field
  30: armchair
  31: seat
  32: fence
  33: desk
  34: rock
  35: wardrobe
  36: lamp
  37: bathtub
  38: railing
  39: cushion
  40: base
  41: box
  42: column
  43: signboard
  44: chest of drawers
  45: counter
  46: sand
  47: sink
  48: skyscraper
  49: fireplace
  50: refrigerator
  51: grandstand
  52: path
  53: stairs
  54: runway
  55: case
  56: pool table
  57: pillow
  58: screen door
  59: stairway
  60: river
  61: bridge
  62: bookcase
  63: blind
  64: coffee table
  65: toilet
  66: flower
  67: book
  68: hill
  69: bench
  70: countertop
  71: stove
  72: palm
  73: kitchen island
  74: computer
  75: swivel chair
  76: boat
  77: bar
  78: arcade machine
  79: hovel
  80: bus
  81: towel
  82: light
  83: truck
  84: tower
  85: chandelier
  86: awning
  87: streetlight
  88: booth
  89: television receiver
  90: airplane
  91: dirt track
  92: apparel
  93: pole
  94: land
  95: bannister
  96: escalator
  97: ottoman
  98: bottle
  99: buffet
  100: poster
  101: stage
  102: van
  103: ship
  104: fountain
  105: conveyor belt
  106: canopy
  107: washer
  108: plaything
  109: swimming pool
  110: stool
  111: barrel
  112: basket
  113: waterfall
  114: tent
  115: bag
  116: minibike
  117: cradle
  118: oven
  119: ball
  120: food
  121: step
  122: tank
  123: trade name
  124: microwave
  125: pot
  126: animal
  127: bicycle
  128: lake
  129: dishwasher
  130: screen
  131: blanket
  132: sculpture
  133: hood
  134: sconce
  135: vase
  136: traffic light
  137: tray
  138: ashcan
  139: fan
  140: pier
  141: crt screen
  142: plate
  143: monitor
  144: bulletin board
  145: shower
  146: radiator
  147: glass
  148: clock
  149: flag

# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
  0: ignore_label
  1: 0
  2: 1
  3: 2
  4: 3
  5: 4
  6: 5
  7: 6
  8: 7
  9: 8
  10: 9
  11: 10
  12: 11
  13: 12
  14: 13
  15: 14
  16: 15
  17: 16
  18: 17
  19: 18
  20: 19
  21: 20
  22: 21
  23: 22
  24: 23
  25: 24
  26: 25
  27: 26
  28: 27
  29: 28
  30: 29
  31: 30
  32: 31
  33: 32
  34: 33
  35: 34
  36: 35
  37: 36
  38: 37
  39: 38
  40: 39
  41: 40
  42: 41
  43: 42
  44: 43
  45: 44
  46: 45
  47: 46
  48: 47
  49: 48
  50: 49
  51: 50
  52: 51
  53: 52
  54: 53
  55: 54
  56: 55
  57: 56
  58: 57
  59: 58
  60: 59
  61: 60
  62: 61
  63: 62
  64: 63
  65: 64
  66: 65
  67: 66
  68: 67
  69: 68
  70: 69
  71: 70
  72: 71
  73: 72
  74: 73
  75: 74
  76: 75
  77: 76
  78: 77
  79: 78
  80: 79
  81: 80
  82: 81
  83: 82
  84: 83
  85: 84
  86: 85
  87: 86
  88: 87
  89: 88
  90: 89
  91: 90
  92: 91
  93: 92
  94: 93
  95: 94
  96: 95
  97: 96
  98: 97
  99: 98
  100: 99
  101: 100
  102: 101
  103: 102
  104: 103
  105: 104
  106: 105
  107: 106
  108: 107
  109: 108
  110: 109
  111: 110
  112: 111
  113: 112
  114: 113
  115: 114
  116: 115
  117: 116
  118: 117
  119: 118
  120: 119
  121: 120
  122: 121
  123: 122
  124: 123
  125: 124
  126: 125
  127: 126
  128: 127
  129: 128
  130: 129
  131: 130
  132: 131
  133: 132
  134: 133
  135: 134
  136: 135
  137: 136
  138: 137
  139: 138
  140: 139
  141: 140
  142: 141
  143: 142
  144: 143
  145: 144
  146: 145
  147: 146
  148: 147
  149: 148
  150: 149
# Download URL (manual): http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

Link to this section사용법#

이미지 크기 512로 100 epochs 동안 ADE20K 데이터셋에서 YOLO26n-sem 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 전체 목록은 모델 Training 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)

Link to this section인용, 라이선스 및 감사의 글#

ADE20K 이미지는 비영리 연구 및 교육 목적으로만 공개되었습니다. 데이터셋의 주석 소프트웨어는 별도로 BSD-3 라이선스가 적용됩니다. 상업적 용도로 사용하려면 MIT CSAIL의 허가가 필요합니다.

연구 또는 개발 작업에 ADE20K 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:

인용

@inproceedings{zhou2017scene,
  title={Scene Parsing through ADE20K Dataset},
  author={Zhou, Bolei and Zhao, Hang and Puig, Xavier and Fidler, Sanja and Barriuso, Adela and Torralba, Antonio},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}

컴퓨터 비전 커뮤니티를 위해 이 귀중한 자원을 만들고 유지 관리해 준 MIT CSAIL 컴퓨터 비전 그룹에 감사를 표합니다. ADE20K 데이터셋과 제작자에 대한 자세한 정보는 ADE20K 데이터셋 웹사이트를 방문하십시오.

Link to this sectionFAQ#

Link to this sectionADE20K 데이터셋이란 무엇이며 컴퓨터 비전 분야에서 왜 중요한가요?#

ADE20K 데이터셋은 semantic segmentation에 사용되는 대규모 장면 파싱 벤치마크이며, 실내, 실외, 객체 및 사물 클래스를 포함하는 150개 카테고리에 대해 총 20,210개의 학습 이미지와 2,000개의 검증 이미지가 공개되어 있습니다. 연구자들은 다양한 장면, 세분화된 카테고리 구성, 그리고 mean Intersection over Union(mIoU)과 같은 표준화된 평가 지표 때문에 ADE20K를 사용하며, 이는 조밀한 예측 모델을 벤치마킹하는 데 이상적입니다.

Link to this sectionADE20K 데이터셋을 사용하여 YOLO 모델을 어떻게 학습합니까?#

이미지 크기 512로 100 epochs 동안 ADE20K 데이터셋에서 YOLO26n-sem 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 자세한 목록은 모델 Training 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)

Link to this sectionADE20K 데이터셋은 어떻게 구성되어 있나요?#

ADE20K 데이터셋은 공식 ADEChallengeData2016 레이아웃을 따르며, 이미지는 images/training/ 및 images/validation/ 아래에 정리되어 있고 해당 마스크는 annotations/training/ 및 annotations/validation/ 아래에 있습니다. Ultralytics YAML 파일은 masks_dir: annotations 필드를 통해 각 이미지를 마스크와 쌍으로 연결하며, label_mapping을 사용하여 소스 레이블 ID 1–150을 연속적인 학습 ID 0–149로 변환하고 무시 레이블을 255로 매핑합니다.

Link to this sectionADE20K를 수동으로 다운로드해야 합니까?#

Yes. Download the ADEChallengeData2016.zip archive (~1 GB) and extract it directly into your datasets/ folder before training — the archive's own top-level folder is already named ADEChallengeData2016/, so extracting it there (not into a separate ADEChallengeData2016 folder you create yourself) produces the images/ and annotations/ layout that ade20k.yaml expects.

Link to this sectionADE20K는 왜 `label_mapping`을 사용하나요?#

ADE20K 주석 마스크는 0이 무시 또는 배경 클래스를 나타내는 소스 레이블 ID를 저장합니다. label_mapping 섹션은 유효한 레이블 1부터 150까지를 연속적인 학습 ID 0부터 149로 매핑하고, 무시되는 픽셀에 255를 할당하여 학습 및 검증 중에 손실 및 지표 계산에서 제외되도록 합니다.

Link to this sectionADE20K 데이터셋은 상업적 용도로 무료로 사용할 수 있습니까?#

아니요. ADE20K 이미지는 비영리 연구 및 교육용으로 제한하는 약관에 따라 공개되었습니다. 포함된 주석 소프트웨어는 별도로 BSD-3 라이선스가 적용됩니다. 상업적 라이선스 옵션은 MIT CSAIL에 문의하십시오.

기여자

GLglenn-jocher³ RAraimbekovm² LALaughing-q¹

생성됨 2개월 전업데이트됨 3일 전