सामग्री पर जाएं

कैलटेक-101 डेटासेट

Caltech-101 डेटासेट ऑब्जेक्ट रिकग्निशन कार्यों के लिए व्यापक रूप से उपयोग किया जाने वाला डेटासेट है, जिसमें 9,000 ऑब्जेक्ट श्रेणियों से लगभग 101 छवियां हैं। श्रेणियों को विभिन्न प्रकार की वास्तविक दुनिया की वस्तुओं को प्रतिबिंबित करने के लिए चुना गया था, और छवियों को स्वयं सावधानीपूर्वक चुना गया था और ऑब्जेक्ट पहचान एल्गोरिदम के लिए एक चुनौतीपूर्ण बेंचमार्क प्रदान करने के लिए एनोटेट किया गया था।

प्रमुख विशेषताऐं

  • Caltech-101 डेटासेट में 101 श्रेणियों में विभाजित लगभग 9,000 रंगीन छवियां शामिल हैं।
  • श्रेणियों में जानवरों, वाहनों, घरेलू सामानों और लोगों सहित विभिन्न प्रकार की वस्तुएं शामिल हैं।
  • प्रति श्रेणी छवियों की संख्या भिन्न होती है, प्रत्येक श्रेणी में लगभग 40 से 800 छवियां होती हैं।
  • छवियां परिवर्तनशील आकारों की होती हैं, जिनमें अधिकांश छवियां मध्यम रिज़ॉल्यूशन की होती हैं।
  • Caltech-101 का व्यापक रूप से मशीन लर्निंग के क्षेत्र में प्रशिक्षण और परीक्षण के लिए उपयोग किया जाता है, विशेष रूप से ऑब्जेक्ट रिकग्निशन कार्यों के लिए।

डेटासेट संरचना

कई अन्य डेटासेट के विपरीत, Caltech-101 डेटासेट औपचारिक रूप से प्रशिक्षण और परीक्षण सेटों में विभाजित नहीं है। उपयोगकर्ता आमतौर पर अपनी विशिष्ट आवश्यकताओं के आधार पर अपने स्वयं के विभाजन बनाते हैं। हालांकि, एक सामान्य अभ्यास प्रशिक्षण के लिए छवियों के एक यादृच्छिक सबसेट का उपयोग करना है (उदाहरण के लिए, प्रति श्रेणी 30 छवियां) और परीक्षण के लिए शेष छवियां।

अनुप्रयोगों

Caltech-101 डेटासेट का उपयोग ऑब्जेक्ट रिकग्निशन कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए व्यापक रूप से किया जाता है, जैसे कि कन्वोल्यूशनल न्यूरल नेटवर्क (CNNs), सपोर्ट वेक्टर मशीन (SVMs), और विभिन्न अन्य मशीन लर्निंग एल्गोरिदम। इसकी विभिन्न प्रकार की श्रेणियां और उच्च गुणवत्ता वाली छवियां इसे मशीन लर्निंग और कंप्यूटर विज़न के क्षेत्र में अनुसंधान और विकास के लिए एक उत्कृष्ट डेटासेट बनाती हैं।

उपयोग

एक प्रशिक्षित करने के लिए YOLO 100 युगों के लिए Caltech-101 डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech101', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

नमूना छवियाँ और एनोटेशन

Caltech-101 डेटासेट में विभिन्न वस्तुओं की उच्च-गुणवत्ता वाली रंगीन छवियां होती हैं, जो ऑब्जेक्ट पहचान कार्यों के लिए एक अच्छी तरह से संरचित डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण Caltech-101 डेटासेट में वस्तुओं की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत वस्तु पहचान मॉडल के प्रशिक्षण के लिए एक विविध डेटासेट के महत्व पर जोर देता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में Caltech-101 डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में Caltech-101 डेटासेट बनाने और बनाए रखने के लिए ली फी-फी, रॉब फर्गस और पिएत्रो पेरोना को स्वीकार करना चाहते हैं। Caltech-101 डेटासेट और इसके रचनाकारों के बारे में अधिक जानकारी के लिए, Caltech-101 डेटासेट वेबसाइट पर जाएँ।



2023-11-12 बनाया गया, अपडेट किया गया 2023-11-22
लेखक: ग्लेन-जोचर (3)

टिप्पणियाँ