Link to this sectionمجموعة بيانات ADE20K#
مجموعة بيانات ADE20K هي معيار واسع النطاق لـ التجزئة الدلالية وتحليل المشاهد، أصدرته مختبرات MIT CSAIL. توفر المجموعة صوراً مشروحة بكثافة تغطي مجموعة واسعة من الفئات الداخلية والخارجية والأشياء والمكونات، مما يجعلها مورداً أساسياً للباحثين والمطورين العاملين على مهام فهم المشاهد الكثيفة باستخدام نماذج Ultralytics YOLO.
Link to this sectionالميزات الرئيسية#
- تحتوي مجموعة بيانات ADE20K على 20,210 صورة للتدريب، و2,000 صورة للتحقق من الصحة، و3,352 صورة للاختبار.
- تغطي مجموعة البيانات 150 فئة دلالية تشمل فئات الأماكن الداخلية والخارجية والأشياء والعناصر.
- التعليقات التوضيحية عبارة عن أقنعة تجزئة على مستوى البكسل مناسبة لتحليل المشاهد الكثيفة.
Link to this sectionهيكل مجموعة البيانات#
يتوقع إعداد Ultralytics تخطيط ADEChallengeData2016 الرسمي:
ADEChallengeData2016/
├── images/
│ ├── training/
│ └── validation/
└── annotations/
├── training/
└── validation/تم ضبط حقل masks_dir على annotations، بحيث يتم إقران كل صورة تحت images/ بالقناع المقابل لها تحت annotations/. تستخدم أقنعة ADE20K الأصلية معرفات التسميات المصدرية حيث يتم تجاهل 0، ويقوم قسم label_mapping بتحويل التسميات الصالحة من 1 إلى 150 إلى معرفات تدريب متتالية من 0 إلى 149، مع تعيين البكسلات التي تم تجاهلها إلى 255.
Link to this sectionالتطبيقات#
تُستخدم ADE20K على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في التجزئة الدلالية وتحليل المشاهد. إن مجموعتها المتنوعة من الفئات والمشاهد المعقدة تجعلها قيّمة لتطبيقات مثل الملاحة الذاتية، والروبوتات، والواقع المعزز، وتحرير الصور.
تجعل سعة المشاهد الداخلية والخارجية من ADE20K معياراً قوياً لتقييم تعميم النموذج عبر المجالات المختلفة.
Link to this sectionYAML مجموعة البيانات#
يحدد ملف YAML لمجموعة البيانات مسارات ADE20K والفئات ودليل القناع وتعيين التسميات. يتم الاحتفاظ بملف ade20k.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/ade20k.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# ADE20K semantic segmentation dataset (150 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/ade20k
# Example usage: yolo semantic train data=ade20k.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
# └── ADEChallengeData2016 ← downloads here (1 GB)
# └── images
# └── annotations
# Dataset root directory
path: ADEChallengeData2016
train: images/training
val: images/validation
masks_dir: annotations # semantic mask directory
# ADE20K 150-class labels
names:
0: wall
1: building
2: sky
3: floor
4: tree
5: ceiling
6: road
7: bed
8: windowpane
9: grass
10: cabinet
11: sidewalk
12: person
13: earth
14: door
15: table
16: mountain
17: plant
18: curtain
19: chair
20: car
21: water
22: painting
23: sofa
24: shelf
25: house
26: sea
27: mirror
28: rug
29: field
30: armchair
31: seat
32: fence
33: desk
34: rock
35: wardrobe
36: lamp
37: bathtub
38: railing
39: cushion
40: base
41: box
42: column
43: signboard
44: chest of drawers
45: counter
46: sand
47: sink
48: skyscraper
49: fireplace
50: refrigerator
51: grandstand
52: path
53: stairs
54: runway
55: case
56: pool table
57: pillow
58: screen door
59: stairway
60: river
61: bridge
62: bookcase
63: blind
64: coffee table
65: toilet
66: flower
67: book
68: hill
69: bench
70: countertop
71: stove
72: palm
73: kitchen island
74: computer
75: swivel chair
76: boat
77: bar
78: arcade machine
79: hovel
80: bus
81: towel
82: light
83: truck
84: tower
85: chandelier
86: awning
87: streetlight
88: booth
89: television receiver
90: airplane
91: dirt track
92: apparel
93: pole
94: land
95: bannister
96: escalator
97: ottoman
98: bottle
99: buffet
100: poster
101: stage
102: van
103: ship
104: fountain
105: conveyor belt
106: canopy
107: washer
108: plaything
109: swimming pool
110: stool
111: barrel
112: basket
113: waterfall
114: tent
115: bag
116: minibike
117: cradle
118: oven
119: ball
120: food
121: step
122: tank
123: trade name
124: microwave
125: pot
126: animal
127: bicycle
128: lake
129: dishwasher
130: screen
131: blanket
132: sculpture
133: hood
134: sconce
135: vase
136: traffic light
137: tray
138: ashcan
139: fan
140: pier
141: crt screen
142: plate
143: monitor
144: bulletin board
145: shower
146: radiator
147: glass
148: clock
149: flag
# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
0: ignore_label
1: 0
2: 1
3: 2
4: 3
5: 4
6: 5
7: 6
8: 7
9: 8
10: 9
11: 10
12: 11
13: 12
14: 13
15: 14
16: 15
17: 16
18: 17
19: 18
20: 19
21: 20
22: 21
23: 22
24: 23
25: 24
26: 25
27: 26
28: 27
29: 28
30: 29
31: 30
32: 31
33: 32
34: 33
35: 34
36: 35
37: 36
38: 37
39: 38
40: 39
41: 40
42: 41
43: 42
44: 43
45: 44
46: 45
47: 46
48: 47
49: 48
50: 49
51: 50
52: 51
53: 52
54: 53
55: 54
56: 55
57: 56
58: 57
59: 58
60: 59
61: 60
62: 61
63: 62
64: 63
65: 64
66: 65
67: 66
68: 67
69: 68
70: 69
71: 70
72: 71
73: 72
74: 73
75: 74
76: 75
77: 76
78: 77
79: 78
80: 79
81: 80
82: 81
83: 82
84: 83
85: 84
86: 85
87: 86
88: 87
89: 88
90: 89
91: 90
92: 91
93: 92
94: 93
95: 94
96: 95
97: 96
98: 97
99: 98
100: 99
101: 100
102: 101
103: 102
104: 103
105: 104
106: 105
107: 106
108: 107
109: 108
110: 109
111: 110
112: 111
113: 112
114: 113
115: 114
116: 115
117: 116
118: 117
119: 118
120: 119
121: 120
122: 121
123: 122
124: 123
125: 124
126: 125
127: 126
128: 127
129: 128
130: 129
131: 130
132: 131
133: 132
134: 133
135: 134
136: 135
137: 136
138: 137
139: 138
140: 139
141: 140
142: 141
143: 142
144: 143
145: 144
146: 145
147: 146
148: 147
149: 148
150: 149
# Download URL (manual): http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zipLink to this sectionالاستخدام#
لتدريب نموذج YOLO26n-sem على مجموعة بيانات ADE20K لمدة 100 دورة تدريبية بحجم صورة 512، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-sem.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)Link to this sectionالاقتباسات والشكر#
إذا كنت تستخدم مجموعة بيانات ADE20K في عملك البحثي أو التطويري، فيرجى الاستشهاد بالورقة البحثية التالية:
@inproceedings{zhou2017scene,
title={Scene Parsing through ADE20K Dataset},
author={Zhou, Bolei and Zhao, Hang and Puig, Xavier and Fidler, Sanja and Barriuso, Adela and Torralba, Antonio},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
year={2017}
}نود أن نعرب عن تقديرنا لمجموعة رؤية الكمبيوتر في MIT CSAIL لإنشاء هذا المورد القيّم وصيانته لمجتمع رؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ADE20K ومبتكريها، قم بزيارة موقع مجموعة بيانات ADE20K.
Link to this sectionالأسئلة الشائعة#
Link to this sectionما هي مجموعة بيانات ADE20K ولماذا تعد مهمة لرؤية الكمبيوتر؟#
تُعد مجموعة بيانات ADE20K معياراً واسع النطاق لتحليل المشاهد يُستخدم لـ التجزئة الدلالية. وهي تحتوي على 25,562 صورة مشروحة بكثافة عبر 150 فئة تغطي فئات الأماكن الداخلية والخارجية والأشياء والعناصر. يستخدم الباحثون ADE20K بسبب مشاهدها المتنوعة، ومجموعة الفئات الدقيقة، ومقاييس التقييم الموحدة مثل متوسط تقاطع الاتحاد (mIoU)، مما يجعلها مثالية لقياس أداء نماذج التنبؤ الكثيفة.
Link to this sectionكيف يمكنني تدريب نموذج YOLO باستخدام مجموعة بيانات ADE20K؟#
لتدريب نموذج YOLO26n-sem على مجموعة بيانات ADE20K لمدة 100 دورة تدريبية بحجم صورة 512، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة مفصلة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-sem.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)Link to this sectionكيف يتم هيكلة مجموعة بيانات ADE20K؟#
تتبع مجموعة بيانات ADE20K تخطيط ADEChallengeData2016 الرسمي، مع تنظيم الصور تحت images/training/ و images/validation/، والأقنعة المقابلة تحت annotations/training/ و annotations/validation/. يقوم ملف YAML الخاص بـ Ultralytics بإقران كل صورة بقناعها عبر حقل masks_dir: annotations، ويستخدم label_mapping لتحويل معرفات التسميات المصدرية من 1 إلى 150 إلى معرفات تدريب متتالية من 0 إلى 149، مع تعيين تسمية التجاهل إلى 255.
Link to this sectionلماذا تستخدم ADE20K خاصية label_mapping؟#
تخزن أقنعة التعليقات التوضيحية لـ ADE20K معرفات التسميات المصدرية حيث يشير 0 إلى فئة التجاهل أو الخلفية. يقوم قسم label_mapping بتعيين التسميات الصالحة من 1 إلى 150 إلى معرفات تدريب متتالية من 0 إلى 149، ويخصص 255 للبكسلات التي تم تجاهلها بحيث يتم استبعادها من الخسارة والمقاييس أثناء التدريب والتحقق من الصحة.