सामग्री पर जाएं

डेटासेट अवलोकन

Ultralytics कंप्यूटर दृष्टि कार्यों जैसे कि पहचान, उदाहरण विभाजन, मुद्रा अनुमान, वर्गीकरण और बहु-वस्तु ट्रैकिंग की सुविधा के लिए विभिन्न डेटासेट के लिए समर्थन प्रदान करता है। नीचे मुख्य की एक सूची है Ultralytics डेटासेट, प्रत्येक कंप्यूटर विज़न कार्य और संबंधित डेटासेट का सारांश के बाद।

नया 🚀 Ultralytics खोजयात्री

अपने डेटासेट के लिए एम्बेडिंग बनाएं, समान छवियों की खोज करें, SQL क्वेरी चलाएं, सिमेंटिक खोज करें और यहां तक कि प्राकृतिक भाषा का उपयोग करके खोज भी करें! आप हमारे जीयूआई ऐप के साथ शुरुआत कर सकते हैं या एपीआई का उपयोग करके अपना खुद का निर्माण कर सकते हैं। यहां और जानें।

Ultralytics एक्सप्लोरर स्क्रीनशॉट

डिटेक्शन डेटासेट

बाउंडिंग बॉक्स ऑब्जेक्ट डिटेक्शन एक कंप्यूटर विज़न तकनीक है जिसमें प्रत्येक ऑब्जेक्ट के चारों ओर एक बाउंडिंग बॉक्स खींचकर एक छवि में वस्तुओं का पता लगाना और स्थानीयकरण करना शामिल है।

  • Argoverse: एक डेटासेट जिसमें समृद्ध एनोटेशन के साथ शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है।
  • COCO: 200K से अधिक लेबल वाली छवियों के साथ ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग के लिए डिज़ाइन किया गया एक बड़े पैमाने पर डेटासेट।
  • COCO8: इसमें COCO ट्रेन और COCO val की पहली 4 छवियां शामिल हैं, जो त्वरित परीक्षणों के लिए उपयुक्त हैं।
  • ग्लोबल व्हीट 2020: ऑब्जेक्ट डिटेक्शन और स्थानीयकरण कार्यों के लिए दुनिया भर से एकत्र की गई गेहूं के सिर की छवियों का एक डेटासेट।
  • Objects365: 365 ऑब्जेक्ट श्रेणियों और 600K से अधिक एनोटेट की गई छवियों के साथ ऑब्जेक्ट डिटेक्शन के लिए एक उच्च-गुणवत्ता, बड़े पैमाने पर डेटासेट।
  • OpenImagesV7: 1.7M ट्रेन छवियों और 42k सत्यापन छवियों के साथ Google द्वारा एक व्यापक डेटासेट।
  • SKU-110K: 11K से अधिक छवियों और 1.7 मिलियन बाउंडिंग बॉक्स के साथ खुदरा वातावरण में घने ऑब्जेक्ट डिटेक्शन की विशेषता वाला डेटासेट।
  • VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।
  • VOC: पास्कल विज़ुअल ऑब्जेक्ट क्लासेस (VOC) डेटासेट ऑब्जेक्ट डिटेक्शन और 20 ऑब्जेक्ट क्लासेस और 11K से अधिक छवियों के साथ सेगमेंटेशन के लिए।
  • xView: 60 ऑब्जेक्ट श्रेणियों और 1 मिलियन से अधिक एनोटेट किए गए ऑब्जेक्ट्स के साथ ओवरहेड इमेजरी में ऑब्जेक्ट डिटेक्शन के लिए एक डेटासेट।
  • Roboflow 100: व्यापक मॉडल मूल्यांकन के लिए सात इमेजरी डोमेन में फैले 100 डेटासेट के साथ एक विविध ऑब्जेक्ट डिटेक्शन बेंचमार्क।

आवृत्ति विभाजन डेटासेट

इंस्टेंस सेगमेंटेशन एक कंप्यूटर विज़न तकनीक है जिसमें पिक्सेल स्तर पर एक छवि में वस्तुओं की पहचान करना और स्थानीयकरण करना शामिल है।

  • COCO: 200K से अधिक लेबल वाली छवियों के साथ ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग कार्यों के लिए डिज़ाइन किया गया एक बड़े पैमाने का डेटासेट।
  • COCO8-seg: उदाहरण विभाजन कार्यों के लिए एक छोटा डेटासेट, जिसमें विभाजन एनोटेशन के साथ 8 COCO छवियों का सबसेट होता है।
  • क्रैक-सेग: सड़कों और दीवारों पर दरारों का पता लगाने के लिए विशेष रूप से तैयार किया गया डेटासेट, ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन कार्यों दोनों के लिए लागू होता है।
  • पैकेज-सेग: गोदामों या औद्योगिक सेटिंग्स में पैकेज की पहचान करने के लिए अनुरूप डेटासेट, ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन एप्लिकेशन दोनों के लिए उपयुक्त है।
  • Carparts-seg: वाहन भागों की पहचान करने, डिजाइन, निर्माण और अनुसंधान आवश्यकताओं के लिए खानपान के लिए उद्देश्य-निर्मित डेटासेट। यह ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन दोनों कार्यों के लिए कार्य करता है।

पोज़ अनुमान

पोज़ अनुमान एक तकनीक है जिसका उपयोग कैमरे या विश्व समन्वय प्रणाली के सापेक्ष वस्तु की मुद्रा को निर्धारित करने के लिए किया जाता है।

  • COCO: मुद्रा अनुमान कार्यों के लिए डिज़ाइन किए गए मानव मुद्रा एनोटेशन के साथ एक बड़े पैमाने पर डेटासेट।
  • COCO8-POSE: मुद्रा अनुमान कार्यों के लिए एक छोटा डेटासेट, जिसमें मानव मुद्रा एनोटेशन के साथ 8 COCO छवियों का सबसेट होता है।
  • टाइगर-पोज़: बाघों पर केंद्रित 263 छवियों से युक्त एक कॉम्पैक्ट डेटासेट, मुद्रा अनुमान कार्यों के लिए प्रति बाघ 12 कीपॉइंट के साथ एनोटेट।

वर्गीकरण

छवि वर्गीकरण एक कंप्यूटर दृष्टि कार्य है जिसमें एक छवि को उसकी दृश्य सामग्री के आधार पर एक या अधिक पूर्वनिर्धारित वर्गों या श्रेणियों में वर्गीकृत करना शामिल है।

  • कैलटेक 101: एक डेटासेट जिसमें छवि वर्गीकरण कार्यों के लिए 101 ऑब्जेक्ट श्रेणियों की छवियां होती हैं।
  • Caltech 256: 256 ऑब्जेक्ट श्रेणियों और अधिक चुनौतीपूर्ण छवियों के साथ Caltech 101 का एक विस्तारित संस्करण।
  • CIFAR-10: 10 वर्गों में 60K 32x10 रंग छवियों का डेटासेट, प्रति वर्ग 6K छवियों के साथ।
  • CIFAR-100: CIFAR-10 का एक विस्तारित संस्करण जिसमें 100 ऑब्जेक्ट श्रेणियां और प्रति वर्ग 600 छवियां हैं।
  • फैशन-MNIST: छवि वर्गीकरण कार्यों के लिए 70,000 फैशन श्रेणियों की 10 ग्रेस्केल छवियों से युक्त एक डेटासेट।
  • इमेजनेट: 14 मिलियन से अधिक छवियों और 20,000 श्रेणियों के साथ ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण के लिए एक बड़े पैमाने पर डेटासेट।
  • इमेजनेट -10: तेजी से प्रयोग और परीक्षण के लिए 10 श्रेणियों के साथ इमेजनेट का एक छोटा सबसेट।
  • इमेजनेट: इमेजनेट का एक छोटा सबसेट जिसमें त्वरित प्रशिक्षण और परीक्षण के लिए 10 आसानी से अलग-अलग कक्षाएं शामिल हैं।
  • Imagewoof: छवि वर्गीकरण कार्यों के लिए 10 कुत्ते नस्ल श्रेणियों वाले इमेजनेट का एक अधिक चुनौतीपूर्ण सबसेट।
  • MNIST: छवि वर्गीकरण कार्यों के लिए हस्तलिखित अंकों की 70,000 ग्रेस्केल छवियों का डेटासेट।

ओरिएंटेड बाउंडिंग बॉक्स (OBB)

ओरिएंटेड बाउंडिंग बॉक्स (OBB) घुमाए गए बाउंडिंग बॉक्स का उपयोग करके छवियों में कोण वाली वस्तुओं का पता लगाने के लिए कंप्यूटर दृष्टि में एक विधि है, जिसे अक्सर हवाई और उपग्रह इमेजरी पर लागू किया जाता है।

  • DOTAv2: 1.7 मिलियन इंस्टेंस और 11,268 इमेज के साथ एक लोकप्रिय OBB एरियल इमेजरी डेटासेट।

मल्टी-ऑब्जेक्ट ट्रैकिंग

मल्टी-ऑब्जेक्ट ट्रैकिंग एक कंप्यूटर विज़न तकनीक है जिसमें वीडियो अनुक्रम में समय के साथ कई वस्तुओं का पता लगाना और ट्रैक करना शामिल है।

  • Argoverse: एक डेटासेट जिसमें शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है, जिसमें मल्टी-ऑब्जेक्ट ट्रैकिंग कार्यों के लिए समृद्ध एनोटेशन होते हैं।
  • VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।

नए डेटासेट का योगदान करें

एक नए डेटासेट में योगदान करने में यह सुनिश्चित करने के लिए कई चरण शामिल हैं कि यह मौजूदा बुनियादी ढांचे के साथ अच्छी तरह से संरेखित हो। नीचे आवश्यक कदम दिए गए हैं:

नए डेटासेट में योगदान करने के चरण

  1. छवियाँ एकत्र करें: डेटासेट से संबंधित छवियों को इकट्ठा करें। इन्हें विभिन्न स्रोतों से एकत्र किया जा सकता है, जैसे कि सार्वजनिक डेटाबेस या आपका अपना संग्रह।

  2. छवियों को एनोटेट करें: कार्य के आधार पर इन छवियों को बाउंडिंग बॉक्स, सेगमेंट या कीपॉइंट के साथ एनोटेट करें।

  3. निर्यात एनोटेशन: इन एनोटेशन को YOLO *.txt फ़ाइल स्वरूप जो Ultralytics समर्थन।

  4. डेटासेट व्यवस्थित करें: अपने डेटासेट को सही फ़ोल्डर संरचना में व्यवस्थित करें। आपके पास होना चाहिए train/ और val/ शीर्ष-स्तरीय निर्देशिका, और प्रत्येक के भीतर, एक images/ और labels/ subdirectory का उपयोग करें।

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. एक बनाएँ data.yaml रेती: अपने डेटासेट की रूट डायरेक्टरी में, data.yaml फ़ाइल जो डेटासेट, कक्षाओं और अन्य आवश्यक जानकारी का वर्णन करती है।

  6. छवियों का अनुकूलन करें (वैकल्पिक): यदि आप अधिक कुशल प्रसंस्करण के लिए डेटासेट के आकार को कम करना चाहते हैं, तो आप नीचे दिए गए कोड का उपयोग करके छवियों को अनुकूलित कर सकते हैं। यह आवश्यक नहीं है, लेकिन छोटे डेटासेट आकार और तेज डाउनलोड गति के लिए अनुशंसित है।

  7. ज़िप डेटासेट: संपूर्ण डेटासेट फ़ोल्डर को ज़िप फ़ाइल में संपीड़ित करें।

  8. दस्तावेज़ और पीआर: अपने डेटासेट का वर्णन करने वाला एक प्रलेखन पृष्ठ बनाएं और यह मौजूदा ढांचे में कैसे फिट बैठता है। उसके बाद, एक पुल अनुरोध (पीआर) जमा करें। संदर्भ लें Ultralytics पीआर जमा करने के तरीके के बारे में अधिक जानकारी के लिए योगदान दिशानिर्देश।

डेटासेट को ऑप्टिमाइज़ और ज़िप करने के लिए उदाहरण कोड

डेटासेट को ऑप्टिमाइज़ और ज़िप करें

from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path('path/to/dataset')

# Optimize images in dataset (optional)
for f in path.rglob('*.jpg'):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

इन चरणों का पालन करके, आप एक नए डेटासेट का योगदान कर सकते हैं जो अच्छी तरह से एकीकृत होता है Ultralytics' मौजूदा संरचना।



2023-11-12 बनाया गया, अपडेट किया गया 2024-03-03
लेखक: ग्लेन-जोचर (6), अबिरामी-वीना (1), chr043416@gmail.com (1), आयुयशएक्सेल (2)

टिप्पणियाँ