डेटासेट अवलोकन

Ultralytics कंप्यूटर दृष्टि कार्यों जैसे कि पहचान, उदाहरण विभाजन, मुद्रा अनुमान, वर्गीकरण और बहु-वस्तु ट्रैकिंग की सुविधा के लिए विभिन्न डेटासेट के लिए समर्थन प्रदान करता है। नीचे मुख्य की एक सूची है Ultralytics डेटासेट, प्रत्येक कंप्यूटर विज़न कार्य और संबंधित डेटासेट का सारांश के बाद।

सतर्कता: Ultralytics डेटासेट अवलोकन

नया 🚀 Ultralytics खोजयात्री

अपने डेटासेट के लिए एम्बेडिंग बनाएं, समान छवियों की खोज करें, SQL क्वेरी चलाएं, सिमेंटिक खोज करें और यहां तक कि प्राकृतिक भाषा का उपयोग करके खोज भी करें! आप हमारे जीयूआई ऐप के साथ शुरुआत कर सकते हैं या एपीआई का उपयोग करके अपना खुद का निर्माण कर सकते हैं। यहां और जानें।

Ultralytics एक्सप्लोरर स्क्रीनशॉट

जीयूआई डेमो का प्रयास करें
एक्सप्लोरर एपीआई के बारे में अधिक जानें

वस्तु का पता लगाना

बाउंडिंग बॉक्स ऑब्जेक्ट डिटेक्शन एक कंप्यूटर विज़न तकनीक है जिसमें प्रत्येक ऑब्जेक्ट के चारों ओर एक बाउंडिंग बॉक्स खींचकर एक छवि में वस्तुओं का पता लगाना और स्थानीयकरण करना शामिल है।

Argoverse: एक डेटासेट जिसमें समृद्ध एनोटेशन के साथ शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है।
COCO: कॉमन ऑब्जेक्ट्स इन कॉन्टेक्स्ट (COCO) 80 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट है।
LVIS: 1203 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट।
COCO8: COCO ट्रेन और COCO वैल से पहली 4 छवियों का एक छोटा सबसेट, त्वरित परीक्षणों के लिए उपयुक्त है।
ग्लोबल व्हीट 2020: ग्लोबल व्हीट चैलेंज 2020 के लिए गेहूं के सिर की छवियों वाला एक डेटासेट।
Objects365: 365 ऑब्जेक्ट श्रेणियों और 600K से अधिक एनोटेट की गई छवियों के साथ ऑब्जेक्ट डिटेक्शन के लिए एक उच्च-गुणवत्ता, बड़े पैमाने पर डेटासेट।
OpenImagesV7: द्वारा एक व्यापक डेटासेट Google 1.7M ट्रेन छवियों और 42k सत्यापन छवियों के साथ।
SKU-110K: 11K से अधिक छवियों और 1.7 मिलियन बाउंडिंग बॉक्स के साथ खुदरा वातावरण में घने ऑब्जेक्ट डिटेक्शन की विशेषता वाला डेटासेट।
VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।
VOC: पास्कल विज़ुअल ऑब्जेक्ट क्लासेस (VOC) डेटासेट ऑब्जेक्ट डिटेक्शन और 20 ऑब्जेक्ट क्लासेस और 11K से अधिक छवियों के साथ सेगमेंटेशन के लिए।
xView: 60 ऑब्जेक्ट श्रेणियों और 1 मिलियन से अधिक एनोटेट किए गए ऑब्जेक्ट्स के साथ ओवरहेड इमेजरी में ऑब्जेक्ट डिटेक्शन के लिए एक डेटासेट।
Roboflow 100: व्यापक मॉडल मूल्यांकन के लिए सात इमेजरी डोमेन में फैले 100 डेटासेट के साथ एक विविध ऑब्जेक्ट डिटेक्शन बेंचमार्क।
ब्रेन-ट्यूमर: ब्रेन ट्यूमर का पता लगाने के लिए एक डेटासेट में ट्यूमर की उपस्थिति, स्थान और विशेषताओं के विवरण के साथ एमआरआई या सीटी स्कैन छवियां शामिल हैं।
अफ्रीकी-वन्यजीव: भैंस, हाथी, गैंडे और ज़ेबरा सहित अफ्रीकी वन्यजीवों की छवियों की विशेषता वाला डेटासेट।
हस्ताक्षर: एनोटेट किए गए हस्ताक्षरों के साथ विभिन्न दस्तावेजों की छवियों की विशेषता वाला एक डेटासेट, दस्तावेज़ सत्यापन और धोखाधड़ी का पता लगाने के अनुसंधान का समर्थन करना।

इंस्टेंस सेगमेंटेशन

इंस्टेंस सेगमेंटेशन एक कंप्यूटर विज़न तकनीक है जिसमें पिक्सेल स्तर पर एक छवि में वस्तुओं की पहचान करना और स्थानीयकरण करना शामिल है।

COCO: 200K से अधिक लेबल वाली छवियों के साथ ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग कार्यों के लिए डिज़ाइन किया गया एक बड़े पैमाने का डेटासेट।
COCO8-seg: उदाहरण विभाजन कार्यों के लिए एक छोटा डेटासेट, जिसमें विभाजन एनोटेशन के साथ 8 COCO छवियों का सबसेट होता है।
क्रैक-सेग: सड़कों और दीवारों पर दरारों का पता लगाने के लिए विशेष रूप से तैयार किया गया डेटासेट, ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन कार्यों दोनों के लिए लागू होता है।
पैकेज-सेग: गोदामों या औद्योगिक सेटिंग्स में पैकेज की पहचान करने के लिए अनुरूप डेटासेट, ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन एप्लिकेशन दोनों के लिए उपयुक्त है।
Carparts-seg: वाहन भागों की पहचान करने, डिजाइन, निर्माण और अनुसंधान आवश्यकताओं के लिए खानपान के लिए उद्देश्य-निर्मित डेटासेट। यह ऑब्जेक्ट डिटेक्शन और सेगमेंटेशन दोनों कार्यों के लिए कार्य करता है।

पोज़ अनुमान

पोज़ अनुमान एक तकनीक है जिसका उपयोग कैमरे या विश्व समन्वय प्रणाली के सापेक्ष वस्तु की मुद्रा को निर्धारित करने के लिए किया जाता है।

COCO: मुद्रा अनुमान कार्यों के लिए डिज़ाइन किए गए मानव मुद्रा एनोटेशन के साथ एक बड़े पैमाने पर डेटासेट।
COCO8-POSE: मुद्रा अनुमान कार्यों के लिए एक छोटा डेटासेट, जिसमें मानव मुद्रा एनोटेशन के साथ 8 COCO छवियों का सबसेट होता है।
टाइगर-पोज़: बाघों पर केंद्रित 263 छवियों से युक्त एक कॉम्पैक्ट डेटासेट, मुद्रा अनुमान कार्यों के लिए प्रति बाघ 12 कीपॉइंट के साथ एनोटेट।

वर्गीकरण

छवि वर्गीकरण एक कंप्यूटर दृष्टि कार्य है जिसमें एक छवि को उसकी दृश्य सामग्री के आधार पर एक या अधिक पूर्वनिर्धारित वर्गों या श्रेणियों में वर्गीकृत करना शामिल है।

कैलटेक 101: एक डेटासेट जिसमें छवि वर्गीकरण कार्यों के लिए 101 ऑब्जेक्ट श्रेणियों की छवियां होती हैं।
Caltech 256: 256 ऑब्जेक्ट श्रेणियों और अधिक चुनौतीपूर्ण छवियों के साथ Caltech 101 का एक विस्तारित संस्करण।
CIFAR-10: 10 वर्गों में 60K 32x10 रंग छवियों का डेटासेट, प्रति वर्ग 6K छवियों के साथ।
CIFAR-100: CIFAR-10 का एक विस्तारित संस्करण जिसमें 100 ऑब्जेक्ट श्रेणियां और प्रति वर्ग 600 छवियां हैं।
फैशन-MNIST: छवि वर्गीकरण कार्यों के लिए 70,000 फैशन श्रेणियों की 10 ग्रेस्केल छवियों से युक्त एक डेटासेट।
इमेजनेट: 14 मिलियन से अधिक छवियों और 20,000 श्रेणियों के साथ ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण के लिए एक बड़े पैमाने पर डेटासेट।
इमेजनेट -10: तेजी से प्रयोग और परीक्षण के लिए 10 श्रेणियों के साथ इमेजनेट का एक छोटा सबसेट।
इमेजनेट: इमेजनेट का एक छोटा सबसेट जिसमें त्वरित प्रशिक्षण और परीक्षण के लिए 10 आसानी से अलग-अलग कक्षाएं शामिल हैं।
Imagewoof: छवि वर्गीकरण कार्यों के लिए 10 कुत्ते नस्ल श्रेणियों वाले इमेजनेट का एक अधिक चुनौतीपूर्ण सबसेट।
MNIST: छवि वर्गीकरण कार्यों के लिए हस्तलिखित अंकों की 70,000 ग्रेस्केल छवियों का डेटासेट।

ओरिएंटेड बाउंडिंग बॉक्स (OBB)

ओरिएंटेड बाउंडिंग बॉक्स (OBB) घुमाए गए बाउंडिंग बॉक्स का उपयोग करके छवियों में कोण वाली वस्तुओं का पता लगाने के लिए कंप्यूटर दृष्टि में एक विधि है, जिसे अक्सर हवाई और उपग्रह इमेजरी पर लागू किया जाता है।

DOTA-v2: 1.7 मिलियन उदाहरणों और 11,268 छवियों के साथ एक लोकप्रिय OBB हवाई इमेजरी डेटासेट।

मल्टी-ऑब्जेक्ट ट्रैकिंग

मल्टी-ऑब्जेक्ट ट्रैकिंग एक कंप्यूटर विज़न तकनीक है जिसमें वीडियो अनुक्रम में समय के साथ कई वस्तुओं का पता लगाना और ट्रैक करना शामिल है।

Argoverse: एक डेटासेट जिसमें शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है, जिसमें मल्टी-ऑब्जेक्ट ट्रैकिंग कार्यों के लिए समृद्ध एनोटेशन होते हैं।
VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।

नए डेटासेट का योगदान करें

एक नए डेटासेट में योगदान करने में यह सुनिश्चित करने के लिए कई चरण शामिल हैं कि यह मौजूदा बुनियादी ढांचे के साथ अच्छी तरह से संरेखित हो। नीचे आवश्यक कदम दिए गए हैं:

नए डेटासेट में योगदान करने के चरण

छवियाँ एकत्र करें: डेटासेट से संबंधित छवियों को इकट्ठा करें। इन्हें विभिन्न स्रोतों से एकत्र किया जा सकता है, जैसे कि सार्वजनिक डेटाबेस या आपका अपना संग्रह।
छवियों को एनोटेट करें: कार्य के आधार पर इन छवियों को बाउंडिंग बॉक्स, सेगमेंट या कीपॉइंट के साथ एनोटेट करें।
निर्यात एनोटेशन: इन एनोटेशन को YOLO *.txt फ़ाइल स्वरूप जो Ultralytics समर्थन।
डेटासेट व्यवस्थित करें: अपने डेटासेट को सही फ़ोल्डर संरचना में व्यवस्थित करें। आपके पास होना चाहिए train/ और val/ शीर्ष-स्तरीय निर्देशिका, और प्रत्येक के भीतर, एक images/ और labels/ subdirectory का उपयोग करें।
```
dataset/
├── train/
│   ├── images/
│   └── labels/
└── val/
    ├── images/
    └── labels/
```
एक बनाएँ data.yaml रेती: अपने डेटासेट की रूट डायरेक्टरी में, data.yaml फ़ाइल जो डेटासेट, कक्षाओं और अन्य आवश्यक जानकारी का वर्णन करती है।
छवियों का अनुकूलन करें (वैकल्पिक): यदि आप अधिक कुशल प्रसंस्करण के लिए डेटासेट के आकार को कम करना चाहते हैं, तो आप नीचे दिए गए कोड का उपयोग करके छवियों को अनुकूलित कर सकते हैं। यह आवश्यक नहीं है, लेकिन छोटे डेटासेट आकार और तेज डाउनलोड गति के लिए अनुशंसित है।
ज़िप डेटासेट: संपूर्ण डेटासेट फ़ोल्डर को ज़िप फ़ाइल में संपीड़ित करें।
दस्तावेज़ और पीआर: अपने डेटासेट का वर्णन करने वाला एक प्रलेखन पृष्ठ बनाएं और यह मौजूदा ढांचे में कैसे फिट बैठता है। उसके बाद, एक पुल अनुरोध (पीआर) जमा करें। संदर्भ लें Ultralytics पीआर जमा करने के तरीके के बारे में अधिक जानकारी के लिए योगदान दिशानिर्देश।

डेटासेट को ऑप्टिमाइज़ और ज़िप करने के लिए उदाहरण कोड

डेटासेट को ऑप्टिमाइज़ और ज़िप करें

Python

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

इन चरणों का पालन करके, आप एक नए डेटासेट का योगदान कर सकते हैं जो अच्छी तरह से एकीकृत होता है Ultralytics' मौजूदा संरचना।

अक्सर पूछे जाने वाले प्रश्न

डेटासेट क्या करता है Ultralytics ऑब्जेक्ट डिटेक्शन के लिए समर्थन?

Ultralytics ऑब्जेक्ट डिटेक्शन के लिए विभिन्न प्रकार के डेटासेट का समर्थन करता है, जिसमें शामिल हैं: - COCO: 80 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट। - LVIS: 1203 ऑब्जेक्ट श्रेणियों के साथ एक व्यापक डेटासेट, जिसे अधिक महीन दाने वाली वस्तु का पता लगाने और विभाजन के लिए डिज़ाइन किया गया है। - Argoverse: एक डेटासेट जिसमें समृद्ध एनोटेशन के साथ शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है। - VisDrone: ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा के साथ एक डेटासेट। - SKU-110K: 11K से अधिक छवियों के साथ खुदरा वातावरण में घनी वस्तु का पता लगाने की विशेषता।

ये डेटासेट विभिन्न ऑब्जेक्ट डिटेक्शन अनुप्रयोगों के लिए प्रशिक्षण मजबूत मॉडल की सुविधा प्रदान करते हैं।

मैं एक नया डेटासेट कैसे योगदान करूं Ultralytics?

एक नए डेटासेट का योगदान करने में कई चरण शामिल हैं: 1. छवियाँ एकत्र करें: सार्वजनिक डेटाबेस या व्यक्तिगत संग्रह से छवियों को इकट्ठा करें। 2. छवियों को एनोटेट करें: कार्य के आधार पर बाउंडिंग बॉक्स, सेगमेंट या कीपॉइंट लागू करें. 3. निर्यात एनोटेशन: एनोटेशन को YOLO *.txt प्रारूप। 4. डेटासेट व्यवस्थित करें: के साथ फ़ोल्डर संरचना का उपयोग करें train/ और val/ निर्देशिका, प्रत्येक युक्त images/ और labels/ उपनिर्देशिकाएँ। 5. एक बनाएँ data.yaml रेती: डेटासेट विवरण, कक्षाएं और अन्य प्रासंगिक जानकारी शामिल करें। 6. छवियों का अनुकूलन करें (वैकल्पिक): दक्षता के लिए डेटासेट का आकार कम करें। 7. ज़िप डेटासेट: डेटासेट को ज़िप फ़ाइल में संपीड़ित करें। 8. दस्तावेज़ और पीआर: अपने डेटासेट का वर्णन करें और निम्नलिखित पुल अनुरोध सबमिट करें Ultralytics अंशदान दिशानिर्देश.

भेंट नए डेटासेट योगदान करें एक व्यापक गाइड के लिए।

मुझे क्यों उपयोग करना चाहिए Ultralytics मेरे डेटासेट के लिए एक्सप्लोरर?

Ultralytics एक्सप्लोरर डेटासेट विश्लेषण के लिए शक्तिशाली सुविधाएँ प्रदान करता है, जिनमें शामिल हैं: - एम्बेडिंग जनरेशन: छवियों के लिए वेक्टर एम्बेडिंग बनाएं। - सिमेंटिक खोज: एम्बेडिंग या एआई का उपयोग करके समान छवियों की खोज करें। - SQL क्वेरीज़: विस्तृत डेटा विश्लेषण के लिए उन्नत SQL क्वेरी चलाएँ। - प्राकृतिक भाषा खोज: उपयोग में आसानी के लिए सादे भाषा प्रश्नों का उपयोग करके खोजें।

का अन्वेषण करें Ultralytics अधिक जानकारी के लिए और GUI डेमो का प्रयास करने के लिए एक्सप्लोरर।

की अनूठी विशेषताएं क्या हैं Ultralytics YOLO कंप्यूटर दृष्टि के लिए मॉडल?

Ultralytics YOLO मॉडल कई अनूठी विशेषताएं प्रदान करते हैं: - वास्तविक समय प्रदर्शन: उच्च गति अनुमान और प्रशिक्षण। - बहुमुखी प्रतिभा: पता लगाने, विभाजन, वर्गीकरण, और मुद्रा अनुमान कार्यों के लिए उपयुक्त। - पूर्व-प्रशिक्षित मॉडल: विभिन्न अनुप्रयोगों के लिए उच्च प्रदर्शन, पूर्व-प्रशिक्षित मॉडल तक पहुंच। - व्यापक सामुदायिक समर्थन: समस्या निवारण और विकास के लिए सक्रिय समुदाय और व्यापक प्रलेखन।

इसके बारे में और जानें YOLO पर Ultralytics YOLO पृष्ठ।

मैं किसी डेटासेट का उपयोग करके ऑप्टिमाइज़ और ज़िप कैसे कर सकता हूं Ultralytics औजार?

का उपयोग करके डेटासेट को अनुकूलित और ज़िप करने के लिए Ultralytics उपकरण, इस उदाहरण कोड का पालन करें: