सामग्री पर जाएं

इमेजवूफ डेटासेट

ImageWoof डेटासेट इमेजनेट का एक सबसेट है जिसमें 10 वर्ग शामिल हैं जिन्हें वर्गीकृत करना चुनौतीपूर्ण है, क्योंकि वे सभी कुत्ते की नस्लें हैं। यह छवि वर्गीकरण एल्गोरिदम को हल करने के लिए एक अधिक कठिन कार्य के रूप में बनाया गया था, जिसका उद्देश्य अधिक उन्नत मॉडल के विकास को प्रोत्साहित करना था।

प्रमुख विशेषताऐं

  • ImageWoof में 10 अलग-अलग कुत्तों की नस्लों की छवियां हैं: ऑस्ट्रेलियाई टेरियर, बॉर्डर टेरियर, समोएड, बीगल, शिह-त्ज़ु, English फॉक्सहाउंड, रोड्सियन रिजबैक, डिंगो, गोल्डन रिट्रीवर और ओल्ड English भेड़ का बच्चा।
  • डेटासेट विभिन्न कम्प्यूटेशनल क्षमताओं और अनुसंधान आवश्यकताओं के लिए समायोजित विभिन्न प्रस्तावों (पूर्ण आकार, 320px, 160px) पर चित्र प्रदान करता है।
  • इसमें शोर लेबल वाला एक संस्करण भी शामिल है, जो एक अधिक यथार्थवादी परिदृश्य प्रदान करता है जहां लेबल हमेशा विश्वसनीय नहीं हो सकते हैं।

डेटासेट संरचना

ImageWoof डेटासेट संरचना कुत्ते की नस्ल वर्गों पर आधारित है, जिसमें प्रत्येक नस्ल की छवियों की अपनी निर्देशिका होती है।

अनुप्रयोगों

ImageWoof डेटासेट का व्यापक रूप से छवि वर्गीकरण कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है, खासकर जब यह अधिक जटिल और समान वर्गों की बात आती है। डेटासेट की चुनौती कुत्ते की नस्लों के बीच सूक्ष्म अंतर में निहित है, जो मॉडल के प्रदर्शन और सामान्यीकरण की सीमाओं को आगे बढ़ाती है।

उपयोग

224x224 के छवि आकार के साथ 100 युगों के लिए ImageWoof डेटासेट पर CNN मॉडल को प्रशिक्षित करने के लिए, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

डेटासेट वेरिएंट

ImageWoof डेटासेट विभिन्न शोध आवश्यकताओं और कम्प्यूटेशनल क्षमताओं को समायोजित करने के लिए तीन अलग-अलग आकारों में आता है:

  1. पूर्ण आकार (इमेजवूफ): यह ImageWoof डेटासेट का मूल संस्करण है। इसमें पूर्ण आकार की छवियां शामिल हैं और यह अंतिम प्रशिक्षण और प्रदर्शन बेंचमार्किंग के लिए आदर्श है।

  2. मध्यम आकार (imagewoof320): इस संस्करण में छवियों को 320 पिक्सेल की अधिकतम किनारे की लंबाई के लिए आकार दिया गया है। यह मॉडल प्रदर्शन का महत्वपूर्ण त्याग किए बिना तेजी से प्रशिक्षण के लिए उपयुक्त है।

  3. छोटा आकार (imagewoof160): इस संस्करण में 160 पिक्सेल की अधिकतम किनारे की लंबाई के लिए आकार बदलने वाली छवियां हैं। यह तेजी से प्रोटोटाइप और प्रयोग के लिए डिज़ाइन किया गया है जहां प्रशिक्षण की गति प्राथमिकता है।

अपने प्रशिक्षण में इन प्रकारों का उपयोग करने के लिए, बस डेटासेट तर्क में 'imagewoof' को 'imagewoof320' या 'imagewoof160' से बदलें। उदाहरण के लिए:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

यह ध्यान रखना महत्वपूर्ण है कि छोटी छवियों का उपयोग करने से वर्गीकरण सटीकता के मामले में कम प्रदर्शन की संभावना होगी। हालांकि, यह मॉडल विकास और प्रोटोटाइप के शुरुआती चरणों में जल्दी से पुनरावृति करने का एक शानदार तरीका है।

नमूना छवियाँ और एनोटेशन

ImageWoof डेटासेट में विभिन्न कुत्तों की नस्लों की रंगीन छवियां हैं, जो छवि वर्गीकरण कार्यों के लिए एक चुनौतीपूर्ण डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण ImageWoof डेटासेट में विभिन्न कुत्तों की नस्लों के बीच सूक्ष्म अंतर और समानता दिखाता है, वर्गीकरण कार्य की जटिलता और कठिनाई को उजागर करता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में ImageWoof डेटासेट का उपयोग करते हैं, तो कृपया आधिकारिक डेटासेट रिपॉजिटरी से लिंक करके डेटासेट के रचनाकारों को स्वीकार करना सुनिश्चित करें।

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में ImageWoof डेटासेट बनाने और बनाए रखने के लिए FastAI टीम को स्वीकार करना चाहते हैं। ImageWoof डेटासेट के बारे में अधिक जानकारी के लिए, ImageWoof डेटासेट रिपॉजिटरी पर जाएं।

अक्सर पूछे जाने वाले प्रश्न

ImageWoof डेटासेट क्या है Ultralytics?

ImageWoof डेटासेट 10 विशिष्ट कुत्तों की नस्लों पर ध्यान केंद्रित करने वाले ImageNet का एक चुनौतीपूर्ण सबसेट है। छवि वर्गीकरण मॉडल की सीमाओं को आगे बढ़ाने के लिए बनाया गया, इसमें बीगल, शिह-त्ज़ु और गोल्डन रिट्रीवर जैसी नस्लें हैं। डेटासेट में विभिन्न प्रस्तावों (पूर्ण आकार, 320px, 160px) पर छवियां और अधिक यथार्थवादी प्रशिक्षण परिदृश्यों के लिए शोर लेबल भी शामिल हैं। यह जटिलता ImageWoof को अधिक उन्नत गहन शिक्षण मॉडल विकसित करने के लिए आदर्श बनाती है।

मैं ImageWoof डेटासेट का उपयोग करके एक मॉडल को कैसे प्रशिक्षित कर सकता हूं Ultralytics YOLO?

ImageWoof डेटासेट का उपयोग करके एक दृढ़ तंत्रिका नेटवर्क (CNN) मॉडल को प्रशिक्षित करने के लिए Ultralytics YOLO 224x224 के छवि आकार पर 100 युगों के लिए, आप निम्न कोड का उपयोग कर सकते हैं:

ट्रेन का उदाहरण

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

उपलब्ध प्रशिक्षण तर्कों के बारे में अधिक जानकारी के लिए, प्रशिक्षण पृष्ठ देखें।

ImageWoof डेटासेट के कौन से संस्करण उपलब्ध हैं?

ImageWoof डेटासेट तीन आकारों में आता है:

  1. पूर्ण आकार (imagewoof): अंतिम प्रशिक्षण और बेंचमार्किंग के लिए आदर्श, पूर्ण आकार की छवियों से युक्त।
  2. मध्यम आकार (imagewoof320): 320 पिक्सेल की अधिकतम किनारे की लंबाई वाली आकार की छवियां, तेजी से प्रशिक्षण के लिए उपयुक्त।
  3. छोटा आकार (imagewoof160): 160 पिक्सेल की अधिकतम किनारे की लंबाई वाली छवियों का आकार बदलना, तेजी से प्रोटोटाइप के लिए एकदम सही।

तदनुसार डेटासेट तर्क में 'imagewoof' को बदलकर इन संस्करणों का उपयोग करें। ध्यान दें, हालांकि, छोटी छवियां कम वर्गीकरण सटीकता उत्पन्न कर सकती हैं लेकिन त्वरित पुनरावृत्तियों के लिए उपयोगी हो सकती हैं।

ImageWoof डेटासेट में शोर लेबल प्रशिक्षण को कैसे लाभान्वित करते हैं?

ImageWoof डेटासेट में शोर लेबल वास्तविक दुनिया की स्थितियों का अनुकरण करते हैं जहां लेबल हमेशा सटीक नहीं हो सकते हैं। इस डेटा के साथ प्रशिक्षण मॉडल छवि वर्गीकरण कार्यों में मजबूती और सामान्यीकरण विकसित करने में मदद करता है। यह मॉडल को अस्पष्ट या गलत लेबल वाले डेटा को प्रभावी ढंग से संभालने के लिए तैयार करता है, जो अक्सर व्यावहारिक अनुप्रयोगों में सामने आता है।

ImageWoof डेटासेट का उपयोग करने की प्रमुख चुनौतियाँ क्या हैं?

ImageWoof डेटासेट की प्राथमिक चुनौती इसमें शामिल कुत्तों की नस्लों के बीच सूक्ष्म अंतर में निहित है। चूंकि यह 10 निकट से संबंधित नस्लों पर केंद्रित है, इसलिए उनके बीच अंतर करने के लिए अधिक उन्नत और ठीक-ठाक छवि वर्गीकरण मॉडल की आवश्यकता होती है। यह ImageWoof को गहन शिक्षण मॉडल की क्षमताओं और सुधारों का परीक्षण करने के लिए एक उत्कृष्ट बेंचमार्क बनाता है।



बनाया गया 2023-11-12, अपडेट किया गया 2024-07-04
लेखक: ग्लेन-जोचर (6)

टिप्पणियाँ