सामग्री पर जाएं

MNIST डेटासेट

MNIST (संशोधित राष्ट्रीय मानक और प्रौद्योगिकी संस्थान) डेटासेट हस्तलिखित अंकों का एक बड़ा डेटाबेस है जो आमतौर पर विभिन्न इमेज प्रोसेसिंग सिस्टम और मशीन लर्निंग मॉडल के प्रशिक्षण के लिए उपयोग किया जाता है। यह एनआईएसटी के मूल डेटासेट से नमूनों को "फिर से मिश्रण" करके बनाया गया था और छवि वर्गीकरण एल्गोरिदम के प्रदर्शन का मूल्यांकन करने के लिए एक बेंचमार्क बन गया है।

प्रमुख विशेषताऐं

  • MNIST में 60,000 प्रशिक्षण चित्र और हस्तलिखित अंकों की 10,000 परीक्षण छवियां हैं।
  • डेटासेट में 28x28 पिक्सेल आकार की ग्रेस्केल छवियां शामिल हैं।
  • छवियों को 28x28 पिक्सेल बाउंडिंग बॉक्स और एंटी-अलियास्ड में फिट करने के लिए सामान्यीकृत किया जाता है, जो ग्रेस्केल स्तरों को पेश करता है।
  • MNIST का व्यापक रूप से मशीन लर्निंग के क्षेत्र में प्रशिक्षण और परीक्षण के लिए उपयोग किया जाता है, विशेष रूप से छवि वर्गीकरण कार्यों के लिए।

डेटासेट संरचना

MNIST डेटासेट को दो सबसेट में विभाजित किया गया है:

  1. प्रशिक्षण सेट: इस सबसेट में मशीन लर्निंग मॉडल के प्रशिक्षण के लिए उपयोग किए जाने वाले हस्तलिखित अंकों की 60,000 छवियां हैं।
  2. परीक्षण सेट: इस सबसेट में प्रशिक्षित मॉडलों के परीक्षण और बेंचमार्किंग के लिए उपयोग की जाने वाली 10,000 छवियां शामिल हैं।

विस्तारित MNIST (EMNIST)

विस्तारित MNIST (EMNIST) NIST द्वारा MNIST का उत्तराधिकारी बनने के लिए विकसित और जारी किया गया एक नया डेटासेट है। जबकि MNIST में केवल हस्तलिखित अंकों की छवियां शामिल थीं, EMNIST में NIST स्पेशल डेटाबेस 19 की सभी छवियां शामिल हैं, जो हस्तलिखित अपरकेस और लोअरकेस अक्षरों के साथ-साथ अंकों का एक बड़ा डेटाबेस है। EMNIST में छवियों को उसी 28x28 पिक्सेल प्रारूप में परिवर्तित किया गया था, उसी प्रक्रिया से, जैसा कि MNIST छवियां थीं। तदनुसार, पुराने, छोटे MNIST डेटासेट के साथ काम करने वाले उपकरण संभवतः EMNIST के साथ असंशोधित काम करेंगे।

अनुप्रयोगों

MNIST डेटासेट का व्यापक रूप से छवि वर्गीकरण कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है, जैसे कि दृढ़ तंत्रिका नेटवर्क (CNNs), समर्थन वेक्टर मशीनें (SVMs), और विभिन्न अन्य मशीन लर्निंग एल्गोरिदम। डेटासेट का सरल और अच्छी तरह से संरचित प्रारूप इसे मशीन लर्निंग और कंप्यूटर विज़न के क्षेत्र में शोधकर्ताओं और चिकित्सकों के लिए एक आवश्यक संसाधन बनाता है।

उपयोग

32x32 के छवि आकार के साथ 100 युगों के लिए MNIST डेटासेट पर CNN मॉडल को प्रशिक्षित करने के लिए, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

नमूना छवियाँ और एनोटेशन

MNIST डेटासेट में हस्तलिखित अंकों की ग्रेस्केल छवियां होती हैं, जो छवि वर्गीकरण कार्यों के लिए एक अच्छी तरह से संरचित डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण MNIST डेटासेट में हस्तलिखित अंकों की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत छवि वर्गीकरण मॉडल के प्रशिक्षण के लिए एक विविध डेटासेट के महत्व पर प्रकाश डालता है।

प्रशंसा पत्र और पावती

यदि आप अपने में MNIST डेटासेट का उपयोग करते हैं

अनुसंधान या विकास कार्य, कृपया निम्नलिखित पेपर का हवाला दें:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में MNIST डेटासेट बनाने और बनाए रखने के लिए Yann LeCun, Corinna Cortes, और Christopher J.C. Burges को स्वीकार करना चाहते हैं। MNIST डेटासेट और इसके रचनाकारों के बारे में अधिक जानकारी के लिए, MNIST डेटासेट वेबसाइट पर जाएँ।



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

टिप्पणियाँ