सामग्री पर जाएं

कैलटेक-256 डेटासेट

Caltech-256 डेटासेट ऑब्जेक्ट वर्गीकरण कार्यों के लिए उपयोग की जाने वाली छवियों का एक व्यापक संग्रह है। इसमें 257 श्रेणियों (256 ऑब्जेक्ट श्रेणियां और 1 पृष्ठभूमि श्रेणी) में विभाजित लगभग 30,000 छवियां हैं। ऑब्जेक्ट रिकग्निशन एल्गोरिदम के लिए एक चुनौतीपूर्ण और विविध बेंचमार्क प्रदान करने के लिए छवियों को सावधानीपूर्वक क्यूरेट और एनोटेट किया गया है।

प्रमुख विशेषताऐं

  • Caltech-256 डेटासेट में 257 श्रेणियों में विभाजित लगभग 30,000 रंगीन छवियां शामिल हैं।
  • प्रत्येक श्रेणी में कम से कम 80 चित्र होते हैं।
  • श्रेणियों में जानवरों, वाहनों, घरेलू सामानों और लोगों सहित वास्तविक दुनिया की वस्तुओं की एक विस्तृत विविधता शामिल है।
  • छवियां चर आकार और संकल्प के हैं।
  • Caltech-256 का व्यापक रूप से मशीन लर्निंग के क्षेत्र में प्रशिक्षण और परीक्षण के लिए उपयोग किया जाता है, विशेष रूप से वस्तु पहचान कार्यों के लिए।

डेटासेट संरचना

Caltech-101 की तरह, Caltech-256 डेटासेट में प्रशिक्षण और परीक्षण सेटों के बीच औपचारिक विभाजन नहीं है। उपयोगकर्ता आमतौर पर अपनी विशिष्ट आवश्यकताओं के अनुसार अपने स्वयं के विभाजन बनाते हैं। एक सामान्य अभ्यास प्रशिक्षण के लिए छवियों के एक यादृच्छिक सबसेट और परीक्षण के लिए शेष छवियों का उपयोग करना है।

अनुप्रयोगों

Caltech-256 डेटासेट का उपयोग ऑब्जेक्ट रिकग्निशन कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए व्यापक रूप से किया जाता है, जैसे कि कन्वोल्यूशनल न्यूरल नेटवर्क (CNNs), सपोर्ट वेक्टर मशीन (SVMs), और कई अन्य मशीन लर्निंग एल्गोरिदम। इसकी श्रेणियों और उच्च-गुणवत्ता वाली छवियों का विविध सेट इसे मशीन लर्निंग और कंप्यूटर विज़न के क्षेत्र में अनुसंधान और विकास के लिए एक अमूल्य डेटासेट बनाता है।

उपयोग

एक प्रशिक्षित करने के लिए YOLO 256 युगों के लिए Caltech-100 डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

नमूना छवियाँ और एनोटेशन

Caltech-256 डेटासेट में विभिन्न वस्तुओं की उच्च-गुणवत्ता वाली रंगीन छवियां होती हैं, जो ऑब्जेक्ट पहचान कार्यों के लिए एक व्यापक डेटासेट प्रदान करती हैं। डेटासेट (क्रेडिट) से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण Caltech-256 डेटासेट में वस्तुओं की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत वस्तु पहचान मॉडल के प्रशिक्षण के लिए एक विविध डेटासेट के महत्व पर जोर देता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में Caltech-256 डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में Caltech-256 डेटासेट बनाने और बनाए रखने के लिए ग्रेगरी ग्रिफिन, एलेक्स होलूब और पिएत्रो पेरोना को स्वीकार करना चाहते हैं। के बारे में अधिक जानकारी के लिए

Caltech-256 डेटासेट और इसके निर्माता, Caltech-256 डेटासेट वेबसाइट पर जाएँ।



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

टिप्पणियाँ