सामग्री पर जाएं

डेटासेट अवलोकन

Ultralytics कंप्यूटर दृष्टि कार्यों जैसे कि पहचान, उदाहरण विभाजन, मुद्रा अनुमान, वर्गीकरण और बहु-वस्तु ट्रैकिंग की सुविधा के लिए विभिन्न डेटासेट के लिए समर्थन प्रदान करता है। नीचे मुख्य की एक सूची है Ultralytics डेटासेट, प्रत्येक कंप्यूटर विज़न कार्य और संबंधित डेटासेट का सारांश के बाद।



सतर्कता: Ultralytics डेटासेट अवलोकन

नया 🚀 Ultralytics खोजयात्री

अपने डेटासेट के लिए एम्बेडिंग बनाएं, समान छवियों की खोज करें, SQL क्वेरी चलाएं, सिमेंटिक खोज करें और यहां तक कि प्राकृतिक भाषा का उपयोग करके खोज भी करें! आप हमारे जीयूआई ऐप के साथ शुरुआत कर सकते हैं या एपीआई का उपयोग करके अपना खुद का निर्माण कर सकते हैं। यहां और जानें।

Ultralytics एक्सप्लोरर स्क्रीनशॉट

वस्तु का पता लगाना

बाउंडिंग बॉक्स ऑब्जेक्ट डिटेक्शन एक कंप्यूटर विज़न तकनीक है जिसमें प्रत्येक ऑब्जेक्ट के चारों ओर एक बाउंडिंग बॉक्स खींचकर एक छवि में वस्तुओं का पता लगाना और स्थानीयकरण करना शामिल है।

  • Argoverse: एक डेटासेट जिसमें समृद्ध एनोटेशन के साथ शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है।
  • COCO: कॉमन ऑब्जेक्ट्स इन कॉन्टेक्स्ट (COCO) 80 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट है।
  • LVIS: 1203 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट।
  • COCO8: COCO ट्रेन और COCO वैल से पहली 4 छवियों का एक छोटा सबसेट, त्वरित परीक्षणों के लिए उपयुक्त है।
  • ग्लोबल व्हीट 2020: ग्लोबल व्हीट चैलेंज 2020 के लिए गेहूं के सिर की छवियों वाला एक डेटासेट।
  • Objects365: 365 ऑब्जेक्ट श्रेणियों और 600K से अधिक एनोटेट की गई छवियों के साथ ऑब्जेक्ट डिटेक्शन के लिए एक उच्च-गुणवत्ता, बड़े पैमाने पर डेटासेट।
  • OpenImagesV7: 1.7M ट्रेन छवियों और 42k सत्यापन छवियों के साथ Google द्वारा एक व्यापक डेटासेट।
  • SKU-110K: 11K से अधिक छवियों और 1.7 मिलियन बाउंडिंग बॉक्स के साथ खुदरा वातावरण में घने ऑब्जेक्ट डिटेक्शन की विशेषता वाला डेटासेट।
  • VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।
  • VOC: पास्कल विज़ुअल ऑब्जेक्ट क्लासेस (VOC) डेटासेट ऑब्जेक्ट डिटेक्शन और 20 ऑब्जेक्ट क्लासेस और 11K से अधिक छवियों के साथ सेगमेंटेशन के लिए।
  • xView: 60 ऑब्जेक्ट श्रेणियों और 1 मिलियन से अधिक एनोटेट किए गए ऑब्जेक्ट्स के साथ ओवरहेड इमेजरी में ऑब्जेक्ट डिटेक्शन के लिए एक डेटासेट।
  • Roboflow 100: व्यापक मॉडल मूल्यांकन के लिए सात इमेजरी डोमेन में फैले 100 डेटासेट के साथ एक विविध ऑब्जेक्ट डिटेक्शन बेंचमार्क।
  • ब्रेन-ट्यूमर: ब्रेन ट्यूमर का पता लगाने के लिए एक डेटासेट में ट्यूमर की उपस्थिति, स्थान और विशेषताओं के विवरण के साथ एमआरआई या सीटी स्कैन छवियां शामिल हैं।
  • अफ्रीकी-वन्यजीव: भैंस, हाथी, गैंडे और ज़ेबरा सहित अफ्रीकी वन्यजीवों की छवियों की विशेषता वाला डेटासेट।
  • हस्ताक्षर: एनोटेट किए गए हस्ताक्षरों के साथ विभिन्न दस्तावेजों की छवियों की विशेषता वाला एक डेटासेट, दस्तावेज़ सत्यापन और धोखाधड़ी का पता लगाने के अनुसंधान का समर्थन करना।

इंस्टेंस सेगमेंटेशन

इंस्टेंस सेगमेंटेशन एक कंप्यूटर विज़न तकनीक है जिसमें पिक्सेल स्तर पर एक छवि में वस्तुओं की पहचान करना और स्थानीयकरण करना शामिल है।

  • COCO: 200K से अधिक लेबल वाली छवियों के साथ ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग कार्यों के लिए डिज़ाइन किया गया एक बड़े पैमाने का डेटासेट।
  • COCO8-seg: उदाहरण विभाजन कार्यों के लिए एक छोटा डेटासेट, जिसमें विभाजन एनोटेशन के साथ 8 COCO छवियों का सबसेट होता है।
  • क्रैक-सेग: सड़कों और दीवारों पर दरारों का पता लगाने के लिए विशेष रूप से तैयार किया गया डेटासेट, ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन कार्यों दोनों के लिए लागू होता है।
  • पैकेज-सेग: गोदामों या औद्योगिक सेटिंग्स में पैकेज की पहचान करने के लिए अनुरूप डेटासेट, ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन एप्लिकेशन दोनों के लिए उपयुक्त है।
  • Carparts-seg: वाहन भागों की पहचान करने, डिजाइन, निर्माण और अनुसंधान आवश्यकताओं के लिए खानपान के लिए उद्देश्य-निर्मित डेटासेट। यह ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन दोनों कार्यों के लिए कार्य करता है।

पोज़ अनुमान

पोज़ अनुमान एक तकनीक है जिसका उपयोग कैमरे या विश्व समन्वय प्रणाली के सापेक्ष वस्तु की मुद्रा को निर्धारित करने के लिए किया जाता है।

  • COCO: मुद्रा अनुमान कार्यों के लिए डिज़ाइन किए गए मानव मुद्रा एनोटेशन के साथ एक बड़े पैमाने पर डेटासेट।
  • COCO8-POSE: मुद्रा अनुमान कार्यों के लिए एक छोटा डेटासेट, जिसमें मानव मुद्रा एनोटेशन के साथ 8 COCO छवियों का सबसेट होता है।
  • टाइगर-पोज़: बाघों पर केंद्रित 263 छवियों से युक्त एक कॉम्पैक्ट डेटासेट, मुद्रा अनुमान कार्यों के लिए प्रति बाघ 12 कीपॉइंट के साथ एनोटेट।

वर्गीकरण

छवि वर्गीकरण एक कंप्यूटर दृष्टि कार्य है जिसमें एक छवि को उसकी दृश्य सामग्री के आधार पर एक या अधिक पूर्वनिर्धारित वर्गों या श्रेणियों में वर्गीकृत करना शामिल है।

  • कैलटेक 101: एक डेटासेट जिसमें छवि वर्गीकरण कार्यों के लिए 101 ऑब्जेक्ट श्रेणियों की छवियां होती हैं।
  • Caltech 256: 256 ऑब्जेक्ट श्रेणियों और अधिक चुनौतीपूर्ण छवियों के साथ Caltech 101 का एक विस्तारित संस्करण।
  • CIFAR-10: 10 वर्गों में 60K 32x10 रंग छवियों का डेटासेट, प्रति वर्ग 6K छवियों के साथ।
  • CIFAR-100: CIFAR-10 का एक विस्तारित संस्करण जिसमें 100 ऑब्जेक्ट श्रेणियां और प्रति वर्ग 600 छवियां हैं।
  • फैशन-MNIST: छवि वर्गीकरण कार्यों के लिए 70,000 फैशन श्रेणियों की 10 ग्रेस्केल छवियों से युक्त एक डेटासेट।
  • इमेजनेट: 14 मिलियन से अधिक छवियों और 20,000 श्रेणियों के साथ ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण के लिए एक बड़े पैमाने पर डेटासेट।
  • इमेजनेट -10: तेजी से प्रयोग और परीक्षण के लिए 10 श्रेणियों के साथ इमेजनेट का एक छोटा सबसेट।
  • इमेजनेट: इमेजनेट का एक छोटा सबसेट जिसमें त्वरित प्रशिक्षण और परीक्षण के लिए 10 आसानी से अलग-अलग कक्षाएं शामिल हैं।
  • Imagewoof: छवि वर्गीकरण कार्यों के लिए 10 कुत्ते नस्ल श्रेणियों वाले इमेजनेट का एक अधिक चुनौतीपूर्ण सबसेट।
  • MNIST: छवि वर्गीकरण कार्यों के लिए हस्तलिखित अंकों की 70,000 ग्रेस्केल छवियों का डेटासेट।

ओरिएंटेड बाउंडिंग बॉक्स (OBB)

ओरिएंटेड बाउंडिंग बॉक्स (OBB) घुमाए गए बाउंडिंग बॉक्स का उपयोग करके छवियों में कोण वाली वस्तुओं का पता लगाने के लिए कंप्यूटर दृष्टि में एक विधि है, जिसे अक्सर हवाई और उपग्रह इमेजरी पर लागू किया जाता है।

  • DOTA-v2: 1.7 मिलियन उदाहरणों और 11,268 छवियों के साथ एक लोकप्रिय OBB हवाई इमेजरी डेटासेट।

मल्टी-ऑब्जेक्ट ट्रैकिंग

मल्टी-ऑब्जेक्ट ट्रैकिंग एक कंप्यूटर विज़न तकनीक है जिसमें वीडियो अनुक्रम में समय के साथ कई वस्तुओं का पता लगाना और ट्रैक करना शामिल है।

  • Argoverse: एक डेटासेट जिसमें शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है, जिसमें मल्टी-ऑब्जेक्ट ट्रैकिंग कार्यों के लिए समृद्ध एनोटेशन होते हैं।
  • VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।

नए डेटासेट का योगदान करें

एक नए डेटासेट में योगदान करने में यह सुनिश्चित करने के लिए कई चरण शामिल हैं कि यह मौजूदा बुनियादी ढांचे के साथ अच्छी तरह से संरेखित हो। नीचे आवश्यक कदम दिए गए हैं:

नए डेटासेट में योगदान करने के चरण

  1. छवियाँ एकत्र करें: डेटासेट से संबंधित छवियों को इकट्ठा करें। इन्हें विभिन्न स्रोतों से एकत्र किया जा सकता है, जैसे कि सार्वजनिक डेटाबेस या आपका अपना संग्रह।
  2. छवियों को एनोटेट करें: कार्य के आधार पर इन छवियों को बाउंडिंग बॉक्स, सेगमेंट या कीपॉइंट के साथ एनोटेट करें।
  3. निर्यात एनोटेशन: इन एनोटेशन को YOLO *.txt फ़ाइल स्वरूप जो Ultralytics समर्थन।
  4. डेटासेट व्यवस्थित करें: अपने डेटासेट को सही फ़ोल्डर संरचना में व्यवस्थित करें। आपके पास होना चाहिए train/ और val/ शीर्ष-स्तरीय निर्देशिका, और प्रत्येक के भीतर, एक images/ और labels/ subdirectory का उपयोग करें।

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. एक बनाएँ data.yaml रेती: अपने डेटासेट की रूट डायरेक्टरी में, data.yaml फ़ाइल जो डेटासेट, कक्षाओं और अन्य आवश्यक जानकारी का वर्णन करती है।

  6. छवियों का अनुकूलन करें (वैकल्पिक): यदि आप अधिक कुशल प्रसंस्करण के लिए डेटासेट के आकार को कम करना चाहते हैं, तो आप नीचे दिए गए कोड का उपयोग करके छवियों को अनुकूलित कर सकते हैं। यह आवश्यक नहीं है, लेकिन छोटे डेटासेट आकार और तेज डाउनलोड गति के लिए अनुशंसित है।
  7. ज़िप डेटासेट: संपूर्ण डेटासेट फ़ोल्डर को ज़िप फ़ाइल में संपीड़ित करें।
  8. दस्तावेज़ और पीआर: अपने डेटासेट का वर्णन करने वाला एक प्रलेखन पृष्ठ बनाएं और यह मौजूदा ढांचे में कैसे फिट बैठता है। उसके बाद, एक पुल अनुरोध (पीआर) जमा करें। संदर्भ लें Ultralytics पीआर जमा करने के तरीके के बारे में अधिक जानकारी के लिए योगदान दिशानिर्देश।

डेटासेट को ऑप्टिमाइज़ और ज़िप करने के लिए उदाहरण कोड

डेटासेट को ऑप्टिमाइज़ और ज़िप करें

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

इन चरणों का पालन करके, आप एक नए डेटासेट का योगदान कर सकते हैं जो अच्छी तरह से एकीकृत होता है Ultralytics' मौजूदा संरचना।



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (9), RizwanMunawar (2), Burhan-Q (1), Laughing-q (1), abirami-vina (1), AyushExel (2)

टिप्पणियाँ