सामग्री पर जाएं

टाइगर-पोज़ डेटासेट

परिचय

Ultralytics टाइगर-पोज़ डेटासेट का परिचय देता है, जो मुद्रा अनुमान कार्यों के लिए डिज़ाइन किया गया एक बहुमुखी संग्रह है। इस डेटासेट में YouTube वीडियो से प्राप्त 263 छवियां शामिल हैं, जिसमें 210 चित्र प्रशिक्षण के लिए और 53 सत्यापन के लिए आवंटित हैं। यह परीक्षण और समस्या निवारण मुद्रा अनुमान एल्गोरिथ्म के लिए एक उत्कृष्ट संसाधन के रूप में कार्य करता है।

210 छवियों के अपने प्रबंधनीय आकार के बावजूद, टाइगर-पोज़ डेटासेट विविधता प्रदान करता है, जो इसे प्रशिक्षण पाइपलाइनों का आकलन करने, संभावित त्रुटियों की पहचान करने और मुद्रा अनुमान के लिए बड़े डेटासेट के साथ काम करने से पहले एक मूल्यवान प्रारंभिक कदम के रूप में सेवा करने के लिए उपयुक्त बनाता है।

यह डेटासेट उपयोग के लिए अभिप्रेत है Ultralytics HUB और YOLOv8.



सतर्कता: रेलगाड़ी YOLOv8 टाइगर-पोज़ डेटासेट का उपयोग करके पोज़ मॉडल Ultralytics HUB

डेटासेट YAML

एक YAML (अभी तक एक और मार्कअप भाषा) फ़ाइल डेटासेट के कॉन्फ़िगरेशन विवरण को निर्दिष्ट करने के साधन के रूप में कार्य करती है। इसमें महत्वपूर्ण डेटा जैसे फ़ाइल पथ, वर्ग परिभाषाएँ और अन्य प्रासंगिक जानकारी शामिल हैं। विशेष रूप से, के लिए tiger-pose.yaml फ़ाइल, आप जांच सकते हैं Ultralytics टाइगर-पोज़ डेटासेट कॉन्फ़िगरेशन फ़ाइल.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

उपयोग

एक प्रशिक्षित करने के लिए YOLOv8n-पोज़ मॉडल 640 के छवि आकार के साथ 100 युगों के लिए टाइगर-पोज़ डेटासेट पर, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

नमूना छवियाँ और एनोटेशन

टाइगर-पोज़ डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं, साथ ही उनके संबंधित एनोटेशन के साथ:

डेटासेट नमूना छवि

  • मोज़ेड छवि: यह छवि मोज़ेक डेटासेट छवियों से बना एक प्रशिक्षण बैच प्रदर्शित करती है। मोज़ेसिंग प्रशिक्षण के दौरान उपयोग की जाने वाली एक तकनीक है जो प्रत्येक प्रशिक्षण बैच के भीतर वस्तुओं और दृश्यों की विविधता को बढ़ाने के लिए कई छवियों को एक ही छवि में जोड़ती है। यह विभिन्न ऑब्जेक्ट आकारों, पहलू अनुपात और संदर्भों को सामान्यीकृत करने की मॉडल की क्षमता को बेहतर बनाने में मदद करता है।

उदाहरण टाइगर-पोज़ डेटासेट में छवियों की विविधता और जटिलता और प्रशिक्षण प्रक्रिया के दौरान मोज़ेकिंग का उपयोग करने के लाभों को प्रदर्शित करता है।

अनुमान उदाहरण

अनुमान उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

प्रशंसा पत्र और पावती

डेटासेट के तहत उपलब्ध जारी किया गया है AGPL-3.0 लाइसेंस



2023-11-12 बनाया गया, अपडेट किया गया 2024-02-03
लेखक: ग्लेन-जोचर (5), रिज़वानमुनव्वर (1)

टिप्पणियाँ