सामग्री पर जाएं

CIFAR-10 डेटासेट

CIFAR-10 (कैनेडियन इंस्टीट्यूट फॉर एडवांस्ड रिसर्च) डेटासेट मशीन लर्निंग और कंप्यूटर विज़न एल्गोरिदम के लिए व्यापक रूप से उपयोग की जाने वाली छवियों का एक संग्रह है। इसे CIFAR संस्थान के शोधकर्ताओं द्वारा विकसित किया गया था और इसमें 10 अलग-अलग वर्गों में 60,000 32x32 रंगीन चित्र शामिल हैं।



सतर्कता: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLOv8

प्रमुख विशेषताऐं

  • CIFAR-10 डेटासेट में 60,000 छवियां हैं, जिन्हें 10 वर्गों में विभाजित किया गया है।
  • प्रत्येक वर्ग में 6,000 छवियां होती हैं, जिन्हें प्रशिक्षण के लिए 5,000 और परीक्षण के लिए 1,000 में विभाजित किया जाता है।
  • चित्र रंगीन और आकार 32x32 पिक्सेल के हैं।
  • 10 अलग-अलग वर्ग हवाई जहाज, कार, पक्षी, बिल्लियों, हिरणों, कुत्तों, मेंढकों, घोड़ों, जहाजों और ट्रकों का प्रतिनिधित्व करते हैं।
  • CIFAR-10 का उपयोग आमतौर पर मशीन लर्निंग और कंप्यूटर विजन के क्षेत्र में प्रशिक्षण और परीक्षण के लिए किया जाता है।

डेटासेट संरचना

CIFAR-10 डेटासेट को दो सबसेट में विभाजित किया गया है:

  1. प्रशिक्षण सेट: इस सबसेट में मशीन लर्निंग मॉडल के प्रशिक्षण के लिए उपयोग की जाने वाली 50,000 छवियां हैं।
  2. परीक्षण सेट: इस सबसेट में प्रशिक्षित मॉडलों के परीक्षण और बेंचमार्किंग के लिए उपयोग की जाने वाली 10,000 छवियां शामिल हैं।

अनुप्रयोगों

CIFAR-10 डेटासेट का व्यापक रूप से छवि वर्गीकरण कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है, जैसे कि दृढ़ तंत्रिका नेटवर्क (CNNs), समर्थन वेक्टर मशीन (SVMs), और विभिन्न अन्य मशीन लर्निंग एल्गोरिदम। कक्षाओं के संदर्भ में डेटासेट की विविधता और रंगीन छवियों की उपस्थिति इसे मशीन लर्निंग और कंप्यूटर दृष्टि के क्षेत्र में अनुसंधान और विकास के लिए एक अच्छी तरह गोल डेटासेट बनाती है।

उपयोग

एक प्रशिक्षित करने के लिए YOLO 32x32 के छवि आकार वाले 100 युगों के लिए CIFAR-10 डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

नमूना छवियाँ और एनोटेशन

CIFAR-10 डेटासेट में विभिन्न वस्तुओं की रंगीन छवियां होती हैं, जो छवि वर्गीकरण कार्यों के लिए एक अच्छी तरह से संरचित डेटासेट प्रदान करती हैं। डेटासेट से छवियों के कुछ उदाहरण यहां दिए गए हैं:

डेटासेट नमूना छवि

उदाहरण CIFAR-10 डेटासेट में वस्तुओं की विविधता और जटिलता को प्रदर्शित करता है, जो मजबूत छवि वर्गीकरण मॉडल के प्रशिक्षण के लिए एक विविध डेटासेट के महत्व पर प्रकाश डालता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में CIFAR-10 डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

हम मशीन लर्निंग और कंप्यूटर विज़न रिसर्च कम्युनिटी के लिए एक मूल्यवान संसाधन के रूप में CIFAR-10 डेटासेट बनाने और बनाए रखने के लिए एलेक्स क्रिज़ेव्स्की को स्वीकार करना चाहते हैं। CIFAR-10 डेटासेट और इसके निर्माता के बारे में अधिक जानकारी के लिए, CIFAR-10 डेटासेट वेबसाइट पर जाएँ।

अक्सर पूछे जाने वाले प्रश्न

मैं कैसे प्रशिक्षित कर सकता हूं YOLO CIFAR-10 डेटासेट पर मॉडल?

एक को प्रशिक्षित करने के लिए YOLO CIFAR-10 डेटासेट पर मॉडल का उपयोग करके Ultralytics, आप दोनों के लिए दिए गए उदाहरणों का अनुसरण कर सकते हैं Python और CLI. 32x32 पिक्सेल के छवि आकार के साथ 100 युगों के लिए अपने मॉडल को प्रशिक्षित करने के लिए यहां एक बुनियादी उदाहरण दिया गया है:

उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

अधिक जानकारी के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

CIFAR-10 डेटासेट की प्रमुख विशेषताएं क्या हैं?

CIFAR-10 डेटासेट में 60,000 रंगीन छवियां शामिल हैं जिन्हें 10 वर्गों में विभाजित किया गया है। प्रत्येक वर्ग में 6,000 चित्र होते हैं, जिसमें 5,000 प्रशिक्षण के लिए और 1,000 परीक्षण के लिए होते हैं। छवियों का आकार 32x32 पिक्सेल है और निम्नलिखित श्रेणियों में भिन्न है:

  • हवाई जहाज
  • कारों
  • पक्षियों
  • बिल्लियां
  • हरिण
  • कुत्ते
  • मेंढ़कों
  • घोड़ों
  • जहाजों
  • ट्रकों

मशीन लर्निंग और कंप्यूटर विज़न जैसे क्षेत्रों में छवि वर्गीकरण मॉडल के प्रशिक्षण के लिए यह विविध डेटासेट आवश्यक है। अधिक जानकारी के लिए, डेटासेट संरचना और अनुप्रयोगों पर CIFAR-10 अनुभागों पर जाएँ।

छवि वर्गीकरण कार्यों के लिए CIFAR-10 डेटासेट का उपयोग क्यों करें?

CIFAR-10 डेटासेट अपनी विविधता और संरचना के कारण छवि वर्गीकरण के लिए एक उत्कृष्ट बेंचमार्क है। इसमें 10 विभिन्न श्रेणियों में 60,000 लेबल वाली छवियों का संतुलित मिश्रण है, जो मजबूत और सामान्यीकृत मॉडल को प्रशिक्षित करने में मदद करता है। इसका व्यापक रूप से गहन शिक्षण मॉडल के मूल्यांकन के लिए उपयोग किया जाता है, जिसमें कन्वेंशनल न्यूरल नेटवर्क (CNNs) और अन्य मशीन लर्निंग एल्गोरिदम शामिल हैं। डेटासेट अपेक्षाकृत छोटा है, जो इसे त्वरित प्रयोग और एल्गोरिथ्म विकास के लिए उपयुक्त बनाता है। एप्लिकेशन अनुभाग में इसके कई अनुप्रयोगों का अन्वेषण करें।

CIFAR-10 डेटासेट कैसे संरचित है?

CIFAR-10 डेटासेट को दो मुख्य सबसेट में संरचित किया गया है:

  1. प्रशिक्षण सेट: मशीन लर्निंग मॉडल के प्रशिक्षण के लिए उपयोग की जाने वाली 50,000 छवियां शामिल हैं।
  2. परीक्षण सेट: प्रशिक्षित मॉडलों के परीक्षण और बेंचमार्किंग के लिए 10,000 छवियों से मिलकर बनता है।

प्रत्येक सबसेट में 10 वर्गों में वर्गीकृत छवियां शामिल हैं, उनके एनोटेशन मॉडल प्रशिक्षण और मूल्यांकन के लिए आसानी से उपलब्ध हैं। अधिक विस्तृत जानकारी के लिए, डेटासेट संरचना अनुभाग देखें।

मैं अपने शोध में CIFAR-10 डेटासेट का हवाला कैसे दे सकता हूं?

यदि आप अपने शोध या विकास परियोजनाओं में CIFAR-10 डेटासेट का उपयोग करते हैं, तो निम्नलिखित पेपर का हवाला देना सुनिश्चित करें:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

डेटासेट के रचनाकारों को स्वीकार करने से क्षेत्र में निरंतर अनुसंधान और विकास का समर्थन करने में मदद मिलती है। अधिक जानकारी के लिए, उद्धरण और पावती अनुभाग देखें।

CIFAR-10 डेटासेट का उपयोग करने के कुछ व्यावहारिक उदाहरण क्या हैं?

CIFAR-10 डेटासेट का उपयोग अक्सर छवि वर्गीकरण मॉडल के प्रशिक्षण के लिए किया जाता है, जैसे कि कन्वेन्शनल न्यूरल नेटवर्क (CNNs) और सपोर्ट वेक्टर मशीन (SVM)। इन मॉडलों को ऑब्जेक्ट डिटेक्शन, इमेज रिकग्निशन और स्वचालित टैगिंग सहित विभिन्न कंप्यूटर विज़न कार्यों में नियोजित किया जा सकता है। कुछ व्यावहारिक उदाहरण देखने के लिए, उपयोग अनुभाग में कोड स्निपेट देखें.



Created 2023-11-12, Updated 2024-07-12
Authors: RizwanMunawar (1), glenn-jocher (6)

टिप्पणियाँ