Link to this sectionمجموعة بيانات ADE20K#

Name: مجموعة بيانات التجزئة ADE20K
Creator: MIT CSAIL
License: https://ade20k.csail.mit.edu/terms
Keywords: مجموعة بيانات ADE20K, التجزئة الدلالية, تحليل المشهد, Ultralytics YOLO, YOLO26, ADEChallengeData2016, الرؤية الحاسوبية, التعلم العميق

تعد مجموعة بيانات ADE20K معياراً واسع النطاق لـ التقسيم الدلالي من مختبر MIT CSAIL، وتحتوي على 20,210 صورة للتدريب و2,000 صورة للتحقق من الصحة، مصنفة بكثافة عبر 150 فئة من الأماكن الداخلية والخارجية والأشياء والمواد. وهي مورد قياسي لتدريب وتقييم نماذج فهم المشهد الكثيف باستخدام Ultralytics YOLO.

Link to this sectionالميزات الرئيسية#

يبلغ إجمالي معيار SceneParsing في ADE20K حوالي 25,562 صورة: 20,210 للتدريب، و2,000 للتحقق، و3,352 للاختبار. لم يتم إصدار تعليقات صور الاختبار للعامة، لذا فإن أرشيف ADEChallengeData2016 القابل للتنزيل وملف تهيئة Ultralytics ade20k.yaml يستخدمان فقط مجموعات التدريب والتحقق.
تغطي مجموعة البيانات 150 فئة دلالية تشمل فئات الأماكن الداخلية والخارجية والأشياء والعناصر.
التعليقات التوضيحية عبارة عن أقنعة تجزئة كثيفة على مستوى البكسل مناسبة لتحليل المشاهد.

Link to this sectionهيكل مجموعة البيانات#

يتوقع إعداد Ultralytics تخطيط ADEChallengeData2016 الرسمي:

ADEChallengeData2016/
├── images/
│   ├── training/
│   └── validation/
└── annotations/
    ├── training/
    └── validation/

يتطلب تنزيلاً يدويًا

لا تحتوي ADE20K على برنامج نصي للتنزيل التلقائي. قم بتنزيل الأرشيف ADEChallengeData2016.zip (بحجم ~1 غيغابايت) واستخرجه مباشرة في مجلد datasets/ الخاص بك. المجلد الرئيسي للأرشيف مسمى بالفعل ADEChallengeData2016/، لذا فإن هذا سينشئ datasets/ADEChallengeData2016/ مما يطابق التخطيط أعلاه — لا تقم بإنشاء مجلد ADEChallengeData2016 بنفسك والاستخراج فيه، وإلا سينتهي بك الأمر بمسار متداخل datasets/ADEChallengeData2016/ADEChallengeData2016/ لن يتمكن ملف YAML من العثور عليه.

تم ضبط حقل masks_dir على annotations، بحيث يتم إقران كل صورة تحت images/ بالقناع المقابل لها تحت annotations/. تستخدم أقنعة ADE20K الأصلية معرفات التسميات المصدرية حيث يتم تجاهل 0، ويقوم قسم label_mapping بتحويل التسميات الصالحة من 1 إلى 150 إلى معرفات تدريب متتالية من 0 إلى 149، مع تعيين البكسلات التي تم تجاهلها إلى 255.

Link to this sectionالتطبيقات#

تُستخدم ADE20K على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في التجزئة الدلالية وتحليل المشاهد. إن مجموعتها المتنوعة من الفئات والمشاهد المعقدة تجعلها قيّمة لتطبيقات مثل الملاحة الذاتية، والروبوتات، والواقع المعزز، وتحرير الصور.

إن تنوع المشاهد الداخلية والخارجية يجعل ADE20K معياراً قوياً لتقييم تعميم النماذج عبر النطاقات المختلفة. تصل نماذج التجزئة الدلالية المدربة مسبقاً من YOLO26 إلى 51.5 في مقياس mIoU على مجموعة التحقق ADE20K — راجع صفحة نماذج التجزئة الدلالية للحصول على جدول القياس الكامل. مجموعات البيانات بتنسيق ADE20K متوافقة أيضاً بالكامل مع منصة Ultralytics لإدارة مجموعات البيانات والتدريب.

Link to this sectionYAML مجموعة البيانات#

يحدد ملف YAML لمجموعة البيانات مسارات ADE20K والفئات ودليل القناع وتعيين التسميات. يتم الاحتفاظ بملف ade20k.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/ade20k.yaml.

ultralytics/cfg/datasets/ade20k.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# ADE20K semantic segmentation dataset (150 classes)
# Documentation: https://docs.ultralytics.com/datasets/semantic/ade20k
# Example usage: yolo semantic train data=ade20k.yaml model=yolo26n-sem.pt
# parent
# ├── ultralytics
# └── datasets
#     └── ADEChallengeData2016 ← downloads here (1 GB)
#         └── images
#         └── annotations

# Dataset root directory
path: ADEChallengeData2016
train: images/training
val: images/validation

masks_dir: annotations # semantic mask directory

# ADE20K 150-class labels
names:
  0: wall
  1: building
  2: sky
  3: floor
  4: tree
  5: ceiling
  6: road
  7: bed
  8: windowpane
  9: grass
  10: cabinet
  11: sidewalk
  12: person
  13: earth
  14: door
  15: table
  16: mountain
  17: plant
  18: curtain
  19: chair
  20: car
  21: water
  22: painting
  23: sofa
  24: shelf
  25: house
  26: sea
  27: mirror
  28: rug
  29: field
  30: armchair
  31: seat
  32: fence
  33: desk
  34: rock
  35: wardrobe
  36: lamp
  37: bathtub
  38: railing
  39: cushion
  40: base
  41: box
  42: column
  43: signboard
  44: chest of drawers
  45: counter
  46: sand
  47: sink
  48: skyscraper
  49: fireplace
  50: refrigerator
  51: grandstand
  52: path
  53: stairs
  54: runway
  55: case
  56: pool table
  57: pillow
  58: screen door
  59: stairway
  60: river
  61: bridge
  62: bookcase
  63: blind
  64: coffee table
  65: toilet
  66: flower
  67: book
  68: hill
  69: bench
  70: countertop
  71: stove
  72: palm
  73: kitchen island
  74: computer
  75: swivel chair
  76: boat
  77: bar
  78: arcade machine
  79: hovel
  80: bus
  81: towel
  82: light
  83: truck
  84: tower
  85: chandelier
  86: awning
  87: streetlight
  88: booth
  89: television receiver
  90: airplane
  91: dirt track
  92: apparel
  93: pole
  94: land
  95: bannister
  96: escalator
  97: ottoman
  98: bottle
  99: buffet
  100: poster
  101: stage
  102: van
  103: ship
  104: fountain
  105: conveyor belt
  106: canopy
  107: washer
  108: plaything
  109: swimming pool
  110: stool
  111: barrel
  112: basket
  113: waterfall
  114: tent
  115: bag
  116: minibike
  117: cradle
  118: oven
  119: ball
  120: food
  121: step
  122: tank
  123: trade name
  124: microwave
  125: pot
  126: animal
  127: bicycle
  128: lake
  129: dishwasher
  130: screen
  131: blanket
  132: sculpture
  133: hood
  134: sconce
  135: vase
  136: traffic light
  137: tray
  138: ashcan
  139: fan
  140: pier
  141: crt screen
  142: plate
  143: monitor
  144: bulletin board
  145: shower
  146: radiator
  147: glass
  148: clock
  149: flag

# Map source label IDs to train IDs; ignore_label is converted to 255.
label_mapping:
  0: ignore_label
  1: 0
  2: 1
  3: 2
  4: 3
  5: 4
  6: 5
  7: 6
  8: 7
  9: 8
  10: 9
  11: 10
  12: 11
  13: 12
  14: 13
  15: 14
  16: 15
  17: 16
  18: 17
  19: 18
  20: 19
  21: 20
  22: 21
  23: 22
  24: 23
  25: 24
  26: 25
  27: 26
  28: 27
  29: 28
  30: 29
  31: 30
  32: 31
  33: 32
  34: 33
  35: 34
  36: 35
  37: 36
  38: 37
  39: 38
  40: 39
  41: 40
  42: 41
  43: 42
  44: 43
  45: 44
  46: 45
  47: 46
  48: 47
  49: 48
  50: 49
  51: 50
  52: 51
  53: 52
  54: 53
  55: 54
  56: 55
  57: 56
  58: 57
  59: 58
  60: 59
  61: 60
  62: 61
  63: 62
  64: 63
  65: 64
  66: 65
  67: 66
  68: 67
  69: 68
  70: 69
  71: 70
  72: 71
  73: 72
  74: 73
  75: 74
  76: 75
  77: 76
  78: 77
  79: 78
  80: 79
  81: 80
  82: 81
  83: 82
  84: 83
  85: 84
  86: 85
  87: 86
  88: 87
  89: 88
  90: 89
  91: 90
  92: 91
  93: 92
  94: 93
  95: 94
  96: 95
  97: 96
  98: 97
  99: 98
  100: 99
  101: 100
  102: 101
  103: 102
  104: 103
  105: 104
  106: 105
  107: 106
  108: 107
  109: 108
  110: 109
  111: 110
  112: 111
  113: 112
  114: 113
  115: 114
  116: 115
  117: 116
  118: 117
  119: 118
  120: 119
  121: 120
  122: 121
  123: 122
  124: 123
  125: 124
  126: 125
  127: 126
  128: 127
  129: 128
  130: 129
  131: 130
  132: 131
  133: 132
  134: 133
  135: 134
  136: 135
  137: 136
  138: 137
  139: 138
  140: 139
  141: 140
  142: 141
  143: 142
  144: 143
  145: 144
  146: 145
  147: 146
  148: 147
  149: 148
  150: 149
# Download URL (manual): http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

Link to this sectionالاستخدام#

لتدريب نموذج YOLO26n-sem على مجموعة بيانات ADE20K لمدة 100 دورة تدريبية بحجم صورة 512، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)

Link to this sectionالاقتباسات، والترخيص، والتقديرات#

تم إصدار صور ADE20K للاستخدام البحثي والتعليمي غير التجاري فقط؛ برنامج التعليقات التوضيحية الخاص بمجموعة البيانات مرخص بشكل منفصل بموجب BSD-3. يتطلب الاستخدام التجاري إذناً من MIT CSAIL.

إذا كنت تستخدم مجموعة بيانات ADE20K في عملك البحثي أو التطويري، فيرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@inproceedings{zhou2017scene,
  title={Scene Parsing through ADE20K Dataset},
  author={Zhou, Bolei and Zhao, Hang and Puig, Xavier and Fidler, Sanja and Barriuso, Adela and Torralba, Antonio},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}

نود أن نعرب عن تقديرنا لمجموعة رؤية الكمبيوتر في MIT CSAIL لإنشاء هذا المورد القيّم وصيانته لمجتمع رؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ADE20K ومبتكريها، قم بزيارة موقع مجموعة بيانات ADE20K.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعة بيانات ADE20K ولماذا تعد مهمة لرؤية الكمبيوتر؟#

مجموعة بيانات ADE20K هي معيار ضخم لتحليل المشاهد يُستخدم في التجزئة الدلالية، مع 20,210 صورة للتدريب و2,000 صورة للتحقق تم إصدارها علناً عبر 150 فئة تغطي المشاهد الداخلية والخارجية والأشياء والعناصر. يستخدم الباحثون ADE20K بسبب مشاهدها المتنوعة، ومجموعة الفئات الدقيقة، ومقاييس التقييم الموحدة مثل متوسط تقاطع الاتحاد (mIoU)، مما يجعلها مثالية لقياس أداء نماذج التنبؤ الكثيفة.

Link to this sectionكيف يمكنني تدريب نموذج YOLO باستخدام مجموعة بيانات ADE20K؟#

لتدريب نموذج YOLO26n-sem على مجموعة بيانات ADE20K لمدة 100 دورة تدريبية بحجم صورة 512، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة مفصلة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="ade20k.yaml", epochs=100, imgsz=512)

Link to this sectionكيف يتم هيكلة مجموعة بيانات ADE20K؟#

تتبع مجموعة بيانات ADE20K تخطيط ADEChallengeData2016 الرسمي، مع تنظيم الصور تحت images/training/ و images/validation/، والأقنعة المقابلة تحت annotations/training/ و annotations/validation/. يقوم ملف YAML الخاص بـ Ultralytics بإقران كل صورة بقناعها عبر حقل masks_dir: annotations، ويستخدم label_mapping لتحويل معرفات التسميات المصدرية من 1 إلى 150 إلى معرفات تدريب متتالية من 0 إلى 149، مع تعيين تسمية التجاهل إلى 255.

Link to this sectionهل أحتاج إلى تنزيل ADE20K يدوياً؟#

نعم. قم بتنزيل الأرشيف ADEChallengeData2016.zip (بحجم ~1 غيغابايت) واستخرجه مباشرة في مجلد datasets/ قبل التدريب — المجلد الرئيسي للأرشيف مسمى بالفعل ADEChallengeData2016/، لذا فإن استخراجه هناك (وليس في مجلد ADEChallengeData2016 منفصل تنشئه بنفسك) سينتج تخطيط images/ وannotations/ الذي يتوقعه ade20k.yaml.

Link to this sectionلماذا تستخدم ADE20K خاصية `label_mapping`؟#

تخزن أقنعة التعليقات التوضيحية لـ ADE20K معرفات التسميات المصدرية حيث يشير 0 إلى فئة التجاهل أو الخلفية. يقوم قسم label_mapping بتعيين التسميات الصالحة من 1 إلى 150 إلى معرفات تدريب متتالية من 0 إلى 149، ويخصص 255 للبكسلات التي تم تجاهلها بحيث يتم استبعادها من الخسارة والمقاييس أثناء التدريب والتحقق من الصحة.

Link to this sectionهل مجموعة بيانات ADE20K مجانية للاستخدام التجاري؟#

لا. تم إصدار صور ADE20K بموجب شروط تقصر الاستخدام على الأبحاث والتعليم غير التجاري؛ برنامج التعليقات التوضيحية المصاحب مرخص بشكل منفصل بموجب BSD-3. اتصل بـ MIT CSAIL للحصول على خيارات الترخيص التجاري.

المساهمون

GLglenn-jocher³ RAraimbekovm² LALaughing-q¹

تم الإنشاء قبل شهرينتم التحديث قبل 3 أيام