सामग्री पर जाएं

CIFAR-10 डेटासेट

CIFAR-10 (कैनेडियन इंस्टीट्यूट फॉर एडवांस्ड रिसर्च) डेटासेट मशीन लर्निंग और कंप्यूटर विज़न एल्गोरिदम के लिए व्यापक रूप से उपयोग की जाने वाली छवियों का एक संग्रह है। इसे CIFAR संस्थान के शोधकर्ताओं द्वारा विकसित किया गया था और इसमें 10 अलग-अलग वर्गों में 60,000 32x32 रंगीन चित्र शामिल हैं।

प्रमुख विशेषताऐं

  • CIFAR-10 डेटासेट में 60,000 छवियां हैं, जिन्हें 10 वर्गों में विभाजित किया गया है।
  • प्रत्येक वर्ग में 6,000 छवियां होती हैं, जिन्हें प्रशिक्षण के लिए 5,000 और परीक्षण के लिए 1,000 में विभाजित किया जाता है।
  • चित्र रंगीन और आकार 32x32 पिक्सेल के हैं।
  • 10 अलग-अलग वर्ग हवाई जहाज, कार, पक्षी, बिल्लियों, हिरणों, कुत्तों, मेंढकों, घोड़ों, जहाजों और ट्रकों का प्रतिनिधित्व करते हैं।
  • CIFAR-10 का उपयोग आमतौर पर मशीन लर्निंग और कंप्यूटर विजन के क्षेत्र में प्रशिक्षण और परीक्षण के लिए किया जाता है।

डेटासेट संरचना

CIFAR-10 डेटासेट को दो सबसेट में विभाजित किया गया है:

  1. प्रशिक्षण सेट: इस सबसेट में मशीन लर्निंग मॉडल के प्रशिक्षण के लिए उपयोग की जाने वाली 50,000 छवियां हैं।
  2. परीक्षण सेट: इस सबसेट में प्रशिक्षित मॉडलों के परीक्षण और बेंचमार्किंग के लिए उपयोग की जाने वाली 10,000 छवियां शामिल हैं।

अनुप्रयोगों

CIFAR-10 डेटासेट का व्यापक रूप से छवि वर्गीकरण कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है, जैसे कि दृढ़ तंत्रिका नेटवर्क (CNNs), समर्थन वेक्टर मशीन (SVMs), और विभिन्न अन्य मशीन लर्निंग एल्गोरिदम। कक्षाओं के संदर्भ में डेटासेट की विविधता और रंगीन छवियों की उपस्थिति इसे मशीन लर्निंग और कंप्यूटर दृष्टि के क्षेत्र में अनुसंधान और विकास के लिए एक अच्छी तरह गोल डेटासेट बनाती है।

उपयोग

एक प्रशिक्षित करने के लिए YOLO 32x32 के छवि आकार वाले 100 युगों के लिए CIFAR-10 डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar10', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

नमूना छवियाँ और एनोटेशन

CIFAR-10 डेटासेट में विभिन्न वस्तुओं की रंगीन छवियां होती हैं, जो छवि वर्गीकरण कार्यों के लिए एक अच्छी तरह से संरचित डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण CIFAR-10 डेटासेट में वस्तुओं की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत छवि वर्गीकरण मॉडल के प्रशिक्षण के लिए एक विविध डेटासेट के महत्व पर प्रकाश डालता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में CIFAR-10 डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में CIFAR-10 डेटासेट बनाने और बनाए रखने के लिए एलेक्स क्रिज़ेव्स्की को स्वीकार करना चाहते हैं। CIFAR-10 डेटासेट और इसके निर्माता के बारे में अधिक जानकारी के लिए, CIFAR-10 डेटासेट वेबसाइट पर जाएँ।



2023-11-12 बनाया गया, अपडेट किया गया 2023-11-22
लेखक: ग्लेन-जोचर (3)

टिप्पणियाँ