सामग्री पर जाएं

CIFAR-100 डेटासेट

CIFAR-100 (कैनेडियन इंस्टीट्यूट फॉर एडवांस्ड रिसर्च) डेटासेट CIFAR-10 डेटासेट का एक महत्वपूर्ण विस्तार है, जो 100 विभिन्न वर्गों में 60,000 32x32 रंगीन छवियों से बना है। इसे CIFAR संस्थान के शोधकर्ताओं द्वारा विकसित किया गया था, जो अधिक जटिल मशीन लर्निंग और कंप्यूटर विज़न कार्यों के लिए अधिक चुनौतीपूर्ण डेटासेट पेश करता है।

प्रमुख विशेषताऐं

  • CIFAR-100 डेटासेट में 60,000 छवियां हैं, जिन्हें 100 वर्गों में विभाजित किया गया है।
  • प्रत्येक वर्ग में 600 छवियां होती हैं, जो प्रशिक्षण के लिए 500 और परीक्षण के लिए 100 में विभाजित होती हैं।
  • चित्र रंगीन और आकार 32x32 पिक्सेल के हैं।
  • उच्च स्तरीय वर्गीकरण के लिए 100 विभिन्न वर्गों को 20 मोटे वर्गों में बांटा गया है।
  • CIFAR-100 का उपयोग आमतौर पर मशीन लर्निंग और कंप्यूटर विजन के क्षेत्र में प्रशिक्षण और परीक्षण के लिए किया जाता है।

डेटासेट संरचना

CIFAR-100 डेटासेट को दो सबसेट में विभाजित किया गया है:

  1. प्रशिक्षण सेट: इस सबसेट में मशीन लर्निंग मॉडल के प्रशिक्षण के लिए उपयोग की जाने वाली 50,000 छवियां हैं।
  2. परीक्षण सेट: इस सबसेट में प्रशिक्षित मॉडलों के परीक्षण और बेंचमार्किंग के लिए उपयोग की जाने वाली 10,000 छवियां शामिल हैं।

अनुप्रयोगों

CIFAR-100 डेटासेट का व्यापक रूप से छवि वर्गीकरण कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है, जैसे कि दृढ़ तंत्रिका नेटवर्क (CNNs), सपोर्ट वेक्टर मशीन (SVMs), और विभिन्न अन्य मशीन लर्निंग एल्गोरिदम। कक्षाओं के संदर्भ में डेटासेट की विविधता और रंगीन छवियों की उपस्थिति इसे मशीन लर्निंग और कंप्यूटर दृष्टि के क्षेत्र में अनुसंधान और विकास के लिए एक अधिक चुनौतीपूर्ण और व्यापक डेटासेट बनाती है।

उपयोग

एक प्रशिक्षित करने के लिए YOLO 32x32 के छवि आकार वाले 100 युगों के लिए CIFAR-100 डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar100', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

नमूना छवियाँ और एनोटेशन

CIFAR-100 डेटासेट में विभिन्न वस्तुओं की रंगीन छवियां होती हैं, जो छवि वर्गीकरण कार्यों के लिए एक अच्छी तरह से संरचित डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण CIFAR-100 डेटासेट में वस्तुओं की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत छवि वर्गीकरण मॉडल के प्रशिक्षण के लिए विविध डेटासेट के महत्व पर प्रकाश डालता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में CIFAR-100 डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

हम मशीन लर्निंग और कंप्यूटर दृष्टि अनुसंधान समुदाय के लिए एक मूल्यवान संसाधन के रूप में CIFAR-100 डेटासेट बनाने और बनाए रखने के लिए एलेक्स क्रिज़ेव्स्की को स्वीकार करना चाहते हैं। CIFAR-100 डेटासेट और इसके निर्माता के बारे में अधिक जानकारी के लिए, CIFAR-100 डेटासेट वेबसाइट पर जाएँ।



2023-11-12 बनाया गया, अपडेट किया गया 2023-11-22
लेखक: ग्लेन-जोचर (3)

टिप्पणियाँ