सामग्री पर जाएं

कैलटेक-101 डेटासेट

Caltech-101 डेटासेट ऑब्जेक्ट रिकग्निशन कार्यों के लिए व्यापक रूप से उपयोग किया जाने वाला डेटासेट है, जिसमें 9,000 ऑब्जेक्ट श्रेणियों से लगभग 101 छवियां हैं। श्रेणियों को विभिन्न प्रकार की वास्तविक दुनिया की वस्तुओं को प्रतिबिंबित करने के लिए चुना गया था, और छवियों को स्वयं सावधानीपूर्वक चुना गया था और ऑब्जेक्ट पहचान एल्गोरिदम के लिए एक चुनौतीपूर्ण बेंचमार्क प्रदान करने के लिए एनोटेट किया गया था।

प्रमुख विशेषताऐं

  • Caltech-101 डेटासेट में 101 श्रेणियों में विभाजित लगभग 9,000 रंगीन छवियां शामिल हैं।
  • श्रेणियों में जानवरों, वाहनों, घरेलू सामानों और लोगों सहित विभिन्न प्रकार की वस्तुएं शामिल हैं।
  • प्रति श्रेणी छवियों की संख्या भिन्न होती है, प्रत्येक श्रेणी में लगभग 40 से 800 छवियां होती हैं।
  • छवियां परिवर्तनशील आकारों की होती हैं, जिनमें अधिकांश छवियां मध्यम रिज़ॉल्यूशन की होती हैं।
  • Caltech-101 का व्यापक रूप से मशीन लर्निंग के क्षेत्र में प्रशिक्षण और परीक्षण के लिए उपयोग किया जाता है, विशेष रूप से ऑब्जेक्ट रिकग्निशन कार्यों के लिए।

डेटासेट संरचना

कई अन्य डेटासेट के विपरीत, Caltech-101 डेटासेट औपचारिक रूप से प्रशिक्षण और परीक्षण सेटों में विभाजित नहीं है। उपयोगकर्ता आमतौर पर अपनी विशिष्ट आवश्यकताओं के आधार पर अपने स्वयं के विभाजन बनाते हैं। हालांकि, एक सामान्य अभ्यास प्रशिक्षण के लिए छवियों के एक यादृच्छिक सबसेट का उपयोग करना है (उदाहरण के लिए, प्रति श्रेणी 30 छवियां) और परीक्षण के लिए शेष छवियां।

अनुप्रयोगों

Caltech-101 डेटासेट का उपयोग ऑब्जेक्ट रिकग्निशन कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए व्यापक रूप से किया जाता है, जैसे कि कन्वोल्यूशनल न्यूरल नेटवर्क (CNNs), सपोर्ट वेक्टर मशीन (SVMs), और विभिन्न अन्य मशीन लर्निंग एल्गोरिदम। इसकी विभिन्न प्रकार की श्रेणियां और उच्च गुणवत्ता वाली छवियां इसे मशीन लर्निंग और कंप्यूटर विज़न के क्षेत्र में अनुसंधान और विकास के लिए एक उत्कृष्ट डेटासेट बनाती हैं।

उपयोग

एक प्रशिक्षित करने के लिए YOLO 100 युगों के लिए Caltech-101 डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

नमूना छवियाँ और एनोटेशन

Caltech-101 डेटासेट में विभिन्न वस्तुओं की उच्च-गुणवत्ता वाली रंगीन छवियां होती हैं, जो ऑब्जेक्ट पहचान कार्यों के लिए एक अच्छी तरह से संरचित डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण Caltech-101 डेटासेट में वस्तुओं की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत वस्तु पहचान मॉडल के प्रशिक्षण के लिए एक विविध डेटासेट के महत्व पर जोर देता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में Caltech-101 डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में Caltech-101 डेटासेट बनाने और बनाए रखने के लिए ली फी-फी, रॉब फर्गस और पिएत्रो पेरोना को स्वीकार करना चाहते हैं। Caltech-101 डेटासेट और इसके रचनाकारों के बारे में अधिक जानकारी के लिए, Caltech-101 डेटासेट वेबसाइट पर जाएँ।

अक्सर पूछे जाने वाले प्रश्न

मशीन लर्निंग में Caltech-101 डेटासेट का उपयोग किस लिए किया जाता है?

Caltech-101 डेटासेट का व्यापक रूप से ऑब्जेक्ट रिकग्निशन कार्यों के लिए मशीन लर्निंग में उपयोग किया जाता है। इसमें 101 श्रेणियों में लगभग 9,000 छवियां शामिल हैं, जो ऑब्जेक्ट रिकग्निशन एल्गोरिदम के मूल्यांकन के लिए एक चुनौतीपूर्ण बेंचमार्क प्रदान करती हैं। शोधकर्ता कंप्यूटर दृष्टि में मॉडल, विशेष रूप से कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन) और सपोर्ट वेक्टर मशीन (एसवीएम) को प्रशिक्षित करने और परीक्षण करने के लिए इसका लाभ उठाते हैं।

मैं एक को कैसे प्रशिक्षित कर सकता हूं Ultralytics YOLO Caltech-101 डेटासेट पर मॉडल?

एक को प्रशिक्षित करने के लिए Ultralytics YOLO Caltech-101 डेटासेट पर मॉडल, आप दिए गए कोड स्निपेट का उपयोग कर सकते हैं। उदाहरण के लिए, 100 युगों के लिए प्रशिक्षित करने के लिए:

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

अधिक विस्तृत तर्कों और विकल्पों के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

Caltech-101 डेटासेट की प्रमुख विशेषताएं क्या हैं?

Caltech-101 डेटासेट में शामिल हैं: - 101 श्रेणियों में लगभग 9,000 रंगीन चित्र। - जानवरों, वाहनों और घरेलू सामानों सहित वस्तुओं की एक विविध श्रेणी को कवर करने वाली श्रेणियाँ। - प्रति श्रेणी छवियों की चर संख्या, आमतौर पर 40 और 800 के बीच। - परिवर्तनीय छवि आकार, अधिकांश मध्यम रिज़ॉल्यूशन के साथ।

ये विशेषताएं मशीन लर्निंग और कंप्यूटर दृष्टि में ऑब्जेक्ट रिकग्निशन मॉडल के प्रशिक्षण और मूल्यांकन के लिए इसे एक उत्कृष्ट विकल्प बनाती हैं।

मुझे अपने शोध में Caltech-101 डेटासेट का हवाला क्यों देना चाहिए?

अपने शोध में Caltech-101 डेटासेट का हवाला देते हुए रचनाकारों के योगदान को स्वीकार करता है और उन अन्य लोगों के लिए एक संदर्भ प्रदान करता है जो डेटासेट का उपयोग कर सकते हैं। अनुशंसित उद्धरण है:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

उद्धृत करने से शैक्षणिक कार्य की अखंडता को बनाए रखने में मदद मिलती है और मूल संसाधन का पता लगाने में साथियों की सहायता होती है।

क्या मैं उपयोग कर सकता हूं Ultralytics Caltech-101 डेटासेट पर प्रशिक्षण मॉडल के लिए HUB?

हाँ, आप उपयोग कर सकते हैं Ultralytics Caltech-101 डेटासेट पर प्रशिक्षण मॉडल के लिए HUB। Ultralytics HUB डेटासेट के प्रबंधन, प्रशिक्षण मॉडल और व्यापक कोडिंग के बिना उन्हें तैनात करने के लिए एक सहज ज्ञान युक्त मंच प्रदान करता है। विस्तृत मार्गदर्शिका के लिए, देखें अपने कस्टम मॉडल को कैसे प्रशिक्षित करें Ultralytics हब ब्लॉग पोस्ट।



बनाया गया 2023-11-12, अपडेट किया गया 2024-07-04
लेखक: ग्लेन-जोचर (6)

टिप्पणियाँ