सामग्री पर जाएं

COCO8-पोज़ डेटासेट

परिचय

Ultralytics COCO8-Pose एक छोटा, लेकिन बहुमुखी पोज़ डिटेक्शन डेटासेट है जो COCO ट्रेन 2017 सेट की पहली 8 छवियों, प्रशिक्षण के लिए 4 और सत्यापन के लिए 4 से बना है। यह डेटासेट ऑब्जेक्ट डिटेक्शन मॉडल के परीक्षण और डिबगिंग के लिए, या नए पहचान दृष्टिकोणों के साथ प्रयोग करने के लिए आदर्श है। 8 छवियों के साथ, यह आसानी से प्रबंधनीय होने के लिए काफी छोटा है, फिर भी त्रुटियों के लिए प्रशिक्षण पाइपलाइनों का परीक्षण करने और बड़े डेटासेट को प्रशिक्षित करने से पहले एक विवेक जांच के रूप में कार्य करने के लिए पर्याप्त विविध है।

यह डेटासेट उपयोग के लिए अभिप्रेत है Ultralytics HUB और YOLOv8.

डेटासेट YAML

डेटासेट कॉन्फ़िगरेशन को परिभाषित करने के लिए एक YAML (अभी तक एक और मार्कअप भाषा) फ़ाइल का उपयोग किया जाता है। इसमें डेटासेट के पथ, कक्षाओं और अन्य प्रासंगिक जानकारी के बारे में जानकारी होती है। COCO8-Pose डेटासेट के मामले में, coco8-pose.yaml फ़ाइल पर बनाए रखा जाता है https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml.

ultralytics/cfg/datasets/coco8-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8-pose dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/coco8-pose/
# Example usage: yolo train data=coco8-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-pose  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes
names:
  0: person

# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8-pose.zip

उपयोग

एक प्रशिक्षित करने के लिए YOLOv8n-POSE मॉडल COCO8 पर 640 के छवि आकार के साथ 100 युगों के लिए डेटासेट, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco8-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

नमूना छवियाँ और एनोटेशन

यहां COCO8-Pose डेटासेट से छवियों के कुछ उदाहरण दिए गए हैं, साथ ही उनके संबंधित एनोटेशन के साथ:

डेटासेट नमूना छवि

  • मोज़ेड छवि: यह छवि मोज़ेक डेटासेट छवियों से बना एक प्रशिक्षण बैच प्रदर्शित करती है। मोज़ेसिंग प्रशिक्षण के दौरान उपयोग की जाने वाली एक तकनीक है जो प्रत्येक प्रशिक्षण बैच के भीतर वस्तुओं और दृश्यों की विविधता को बढ़ाने के लिए कई छवियों को एक ही छवि में जोड़ती है। यह विभिन्न ऑब्जेक्ट आकारों, पहलू अनुपात और संदर्भों को सामान्यीकृत करने की मॉडल की क्षमता को बेहतर बनाने में मदद करता है।

उदाहरण COCO8-Pose डेटासेट में छवियों की विविधता और जटिलता और प्रशिक्षण प्रक्रिया के दौरान मोज़ेकिंग का उपयोग करने के लाभों को प्रदर्शित करता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में COCO डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

हम कंप्यूटर दृष्टि समुदाय के लिए इस मूल्यवान संसाधन को बनाने और बनाए रखने के लिए कोको कंसोर्टियम को स्वीकार करना चाहते हैं। COCO डेटासेट और इसके रचनाकारों के बारे में अधिक जानकारी के लिए, COCO डेटासेट वेबसाइट पर जाएँ।



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), Laughing-q (1)

टिप्पणियाँ