सामग्री पर जाएं

छवि वर्गीकरण डेटासेट अवलोकन

के लिए डेटासेट संरचना YOLO वर्गीकरण कार्य

के लिए Ultralytics YOLO वर्गीकरण कार्य, डेटासेट को एक विशिष्ट विभाजन-निर्देशिका संरचना में व्यवस्थित किया जाना चाहिए root उचित प्रशिक्षण, परीक्षण और वैकल्पिक सत्यापन प्रक्रियाओं की सुविधा के लिए निर्देशिका। इस संरचना में प्रशिक्षण के लिए अलग-अलग निर्देशिकाएं शामिल हैं (train) और परीक्षण (test) चरण, सत्यापन के लिए एक वैकल्पिक निर्देशिका के साथ (val).

इनमें से प्रत्येक निर्देशिका में डेटासेट में प्रत्येक वर्ग के लिए एक उपनिर्देशिका होनी चाहिए। उपनिर्देशिकाओं का नाम संबंधित वर्ग के नाम पर रखा गया है और इसमें उस वर्ग के लिए सभी छवियां हैं। सुनिश्चित करें कि प्रत्येक छवि फ़ाइल को विशिष्ट रूप से नाम दिया गया है और JPEG या PNG जैसे सामान्य प्रारूप में संग्रहीत किया गया है।

फ़ोल्डर संरचना उदाहरण

एक उदाहरण के रूप में CIFAR-10 डेटासेट पर विचार करें। फ़ोल्डर संरचना इस तरह दिखनी चाहिए:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- val/ (optional)
|   |-- airplane/
|   |   |-- 105_airplane.png
|   |   |-- 106_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 102_automobile.png
|   |   |-- 103_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1045_bird.png
|   |   |-- 1046_bird.png
|   |   |-- ...
|   |
|   |-- ...

यह संरचित दृष्टिकोण सुनिश्चित करता है कि मॉडल प्रशिक्षण चरण के दौरान सुव्यवस्थित कक्षाओं से प्रभावी ढंग से सीख सकता है और परीक्षण और सत्यापन चरणों के दौरान प्रदर्शन का सटीक मूल्यांकन कर सकता है।

उपयोग

उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="path/to/dataset", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

समर्थित डेटासेट

Ultralytics स्वचालित डाउनलोड के साथ निम्नलिखित डेटासेट का समर्थन करता है:

  • कैलटेक 101: एक डेटासेट जिसमें छवि वर्गीकरण कार्यों के लिए 101 ऑब्जेक्ट श्रेणियों की छवियां होती हैं।
  • Caltech 256: 256 ऑब्जेक्ट श्रेणियों और अधिक चुनौतीपूर्ण छवियों के साथ Caltech 101 का एक विस्तारित संस्करण।
  • CIFAR-10: 10 वर्गों में 60K 32x10 रंग छवियों का डेटासेट, प्रति वर्ग 6K छवियों के साथ।
  • CIFAR-100: CIFAR-10 का एक विस्तारित संस्करण जिसमें 100 ऑब्जेक्ट श्रेणियां और प्रति वर्ग 600 छवियां हैं।
  • फैशन-MNIST: छवि वर्गीकरण कार्यों के लिए 70,000 फैशन श्रेणियों की 10 ग्रेस्केल छवियों से युक्त एक डेटासेट।
  • इमेजनेट: 14 मिलियन से अधिक छवियों और 20,000 श्रेणियों के साथ ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण के लिए एक बड़े पैमाने पर डेटासेट।
  • इमेजनेट -10: तेजी से प्रयोग और परीक्षण के लिए 10 श्रेणियों के साथ इमेजनेट का एक छोटा सबसेट।
  • इमेजनेट: इमेजनेट का एक छोटा सबसेट जिसमें त्वरित प्रशिक्षण और परीक्षण के लिए 10 आसानी से अलग-अलग कक्षाएं शामिल हैं।
  • Imagewoof: छवि वर्गीकरण कार्यों के लिए 10 कुत्ते नस्ल श्रेणियों वाले इमेजनेट का एक अधिक चुनौतीपूर्ण सबसेट।
  • MNIST: छवि वर्गीकरण कार्यों के लिए हस्तलिखित अंकों की 70,000 ग्रेस्केल छवियों का डेटासेट।

अपना खुद का डेटासेट जोड़ना

यदि आपके पास अपना स्वयं का डेटासेट है और आप इसे वर्गीकरण मॉडल के प्रशिक्षण के लिए उपयोग करना चाहते हैं Ultralytics, सुनिश्चित करें कि यह "डेटासेट प्रारूप" के तहत ऊपर निर्दिष्ट प्रारूप का पालन करता है और फिर अपना data डेटासेट निर्देशिका के लिए तर्क।



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), stormsson (1), GreatV (1)

टिप्पणियाँ