सामग्री पर जाएं

इमेजवूफ डेटासेट

ImageWoof डेटासेट इमेजनेट का एक सबसेट है जिसमें 10 वर्ग शामिल हैं जिन्हें वर्गीकृत करना चुनौतीपूर्ण है, क्योंकि वे सभी कुत्ते की नस्लें हैं। यह छवि वर्गीकरण एल्गोरिदम को हल करने के लिए एक अधिक कठिन कार्य के रूप में बनाया गया था, जिसका उद्देश्य अधिक उन्नत मॉडल के विकास को प्रोत्साहित करना था।

प्रमुख विशेषताऐं

  • ImageWoof में 10 अलग-अलग कुत्तों की नस्लों की छवियां हैं: ऑस्ट्रेलियाई टेरियर, बॉर्डर टेरियर, समोएड, बीगल, शिह-त्ज़ु, English फॉक्सहाउंड, रोड्सियन रिजबैक, डिंगो, गोल्डन रिट्रीवर और ओल्ड English भेड़ का बच्चा।
  • डेटासेट विभिन्न कम्प्यूटेशनल क्षमताओं और अनुसंधान आवश्यकताओं के लिए समायोजित विभिन्न प्रस्तावों (पूर्ण आकार, 320px, 160px) पर चित्र प्रदान करता है।
  • इसमें शोर लेबल वाला एक संस्करण भी शामिल है, जो एक अधिक यथार्थवादी परिदृश्य प्रदान करता है जहां लेबल हमेशा विश्वसनीय नहीं हो सकते हैं।

डेटासेट संरचना

ImageWoof डेटासेट संरचना कुत्ते की नस्ल वर्गों पर आधारित है, जिसमें प्रत्येक नस्ल की छवियों की अपनी निर्देशिका होती है।

अनुप्रयोगों

ImageWoof डेटासेट का व्यापक रूप से छवि वर्गीकरण कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है, खासकर जब यह अधिक जटिल और समान वर्गों की बात आती है। डेटासेट की चुनौती कुत्ते की नस्लों के बीच सूक्ष्म अंतर में निहित है, जो मॉडल के प्रदर्शन और सामान्यीकरण की सीमाओं को आगे बढ़ाती है।

उपयोग

224x224 के छवि आकार के साथ 100 युगों के लिए ImageWoof डेटासेट पर CNN मॉडल को प्रशिक्षित करने के लिए, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

डेटासेट वेरिएंट

ImageWoof डेटासेट विभिन्न शोध आवश्यकताओं और कम्प्यूटेशनल क्षमताओं को समायोजित करने के लिए तीन अलग-अलग आकारों में आता है:

  1. पूर्ण आकार (इमेजवूफ): यह ImageWoof डेटासेट का मूल संस्करण है। इसमें पूर्ण आकार की छवियां शामिल हैं और यह अंतिम प्रशिक्षण और प्रदर्शन बेंचमार्किंग के लिए आदर्श है।

  2. मध्यम आकार (imagewoof320): इस संस्करण में छवियों को 320 पिक्सेल की अधिकतम किनारे की लंबाई के लिए आकार दिया गया है। यह मॉडल प्रदर्शन का महत्वपूर्ण त्याग किए बिना तेजी से प्रशिक्षण के लिए उपयुक्त है।

  3. छोटा आकार (imagewoof160): इस संस्करण में 160 पिक्सेल की अधिकतम किनारे की लंबाई के लिए आकार बदलने वाली छवियां हैं। यह तेजी से प्रोटोटाइप और प्रयोग के लिए डिज़ाइन किया गया है जहां प्रशिक्षण की गति प्राथमिकता है।

अपने प्रशिक्षण में इन प्रकारों का उपयोग करने के लिए, बस डेटासेट तर्क में 'imagewoof' को 'imagewoof320' या 'imagewoof160' से बदलें। उदाहरण के लिए:

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

यह ध्यान रखना महत्वपूर्ण है कि छोटी छवियों का उपयोग करने से वर्गीकरण सटीकता के मामले में कम प्रदर्शन की संभावना होगी। हालांकि, यह मॉडल विकास और प्रोटोटाइप के शुरुआती चरणों में जल्दी से पुनरावृति करने का एक शानदार तरीका है।

नमूना छवियाँ और एनोटेशन

ImageWoof डेटासेट में विभिन्न कुत्तों की नस्लों की रंगीन छवियां हैं, जो छवि वर्गीकरण कार्यों के लिए एक चुनौतीपूर्ण डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण ImageWoof डेटासेट में विभिन्न कुत्तों की नस्लों के बीच सूक्ष्म अंतर और समानता दिखाता है, वर्गीकरण कार्य की जटिलता और कठिनाई को उजागर करता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में ImageWoof डेटासेट का उपयोग करते हैं, तो कृपया आधिकारिक डेटासेट रिपॉजिटरी से लिंक करके डेटासेट के रचनाकारों को स्वीकार करना सुनिश्चित करें।

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में ImageWoof डेटासेट बनाने और बनाए रखने के लिए FastAI टीम को स्वीकार करना चाहते हैं। ImageWoof डेटासेट के बारे में अधिक जानकारी के लिए, ImageWoof डेटासेट रिपॉजिटरी पर जाएं।



2023-11-12 बनाया गया, अपडेट किया गया 2023-12-03
लेखक: ग्लेन-जोचर (3)

टिप्पणियाँ