सामग्री पर जाएं

ऑब्जेक्ट डिटेक्शन डेटासेट ओवरview

एक मजबूत और सटीक ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करने के लिए एक व्यापक डेटासेट की आवश्यकता होती है। यह मार्गदर्शिका डेटासेट के विभिन्न स्वरूपों का परिचय देती है जो संगत हैं Ultralytics YOLO मॉडल और उनकी संरचना, उपयोग और विभिन्न स्वरूपों के बीच रूपांतरण करने के तरीके में अंतर्दृष्टि प्रदान करता है।

समर्थित डेटासेट प्रारूप

Ultralytics YOLO प्रारूप

वही Ultralytics YOLO प्रारूप एक डेटासेट कॉन्फ़िगरेशन प्रारूप है जो आपको डेटासेट रूट निर्देशिका, प्रशिक्षण/सत्यापन/परीक्षण छवि निर्देशिकाओं के सापेक्ष पथ या *.txt छवि पथ वाली फ़ाइलें, और वर्ग नामों का एक शब्दकोश। यहाँ एक उदाहरण है:

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8  # dataset root dir
train: images/train  # train images (relative to 'path') 4 images
val: images/val  # val images (relative to 'path') 4 images
test:  # test images (optional)

# Classes (80 COCO classes)
names:
  0: person
  1: bicycle
  2: car
  # ...
  77: teddy bear
  78: hair drier
  79: toothbrush

इस प्रारूप के लिए लेबल को निर्यात किया जाना चाहिए YOLO एक के साथ प्रारूप *.txt प्रति छवि फ़ाइल। यदि किसी छवि में कोई ऑब्जेक्ट नहीं हैं, तो नहीं *.txt फ़ाइल आवश्यक है। वही *.txt फ़ाइल को प्रति ऑब्जेक्ट एक पंक्ति के साथ स्वरूपित किया जाना चाहिए class x_center y_center width height प्रारूप। बॉक्स निर्देशांक अंदर होना चाहिए सामान्यीकृत XYWH फ़ॉर्मैट (0 से 1 तक). यदि आपके बॉक्स पिक्सेल में हैं, तो आपको विभाजित करना चाहिए x_center और width छवि चौड़ाई द्वारा, और y_center और height छवि ऊंचाई से। कक्षा संख्या शून्य-अनुक्रमित होनी चाहिए (0 से शुरू करें)।

लेबल की गई छवि का उदाहरण

उपरोक्त छवि के अनुरूप लेबल फ़ाइल में 2 व्यक्ति (वर्ग ) शामिल हैं 0) और एक टाई (वर्ग 27):

उदाहरण लेबल फ़ाइल

वापरताना Ultralytics YOLO प्रारूपित करें, अपने प्रशिक्षण और सत्यापन छवियों और लेबलों को व्यवस्थित करें जैसा कि नीचे COCO8 डेटासेट उदाहरण में दिखाया गया है।

उदाहरण डेटासेट निर्देशिका संरचना

उपयोग

यहां बताया गया है कि आप अपने मॉडल को प्रशिक्षित करने के लिए इन प्रारूपों का उपयोग कैसे कर सकते हैं:

उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco8.yaml model=yolov8n.pt epochs=100 imgsz=640

समर्थित डेटासेट

यहां समर्थित डेटासेट की सूची और प्रत्येक के लिए एक संक्षिप्त विवरण दिया गया है:

  • Argoverse: एक डेटासेट जिसमें समृद्ध एनोटेशन के साथ शहरी वातावरण से 3D ट्रैकिंग और गति पूर्वानुमान डेटा होता है।
  • COCO: कॉमन ऑब्जेक्ट्स इन कॉन्टेक्स्ट (COCO) 80 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट है।
  • LVIS: 1203 ऑब्जेक्ट श्रेणियों के साथ एक बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और कैप्शनिंग डेटासेट।
  • COCO8: COCO ट्रेन और COCO वैल से पहली 4 छवियों का एक छोटा सबसेट, त्वरित परीक्षणों के लिए उपयुक्त है।
  • ग्लोबल व्हीट 2020: ग्लोबल व्हीट चैलेंज 2020 के लिए गेहूं के सिर की छवियों वाला एक डेटासेट।
  • Objects365: 365 ऑब्जेक्ट श्रेणियों और 600K से अधिक एनोटेट की गई छवियों के साथ ऑब्जेक्ट डिटेक्शन के लिए एक उच्च-गुणवत्ता, बड़े पैमाने पर डेटासेट।
  • OpenImagesV7: 1.7M ट्रेन छवियों और 42k सत्यापन छवियों के साथ Google द्वारा एक व्यापक डेटासेट।
  • SKU-110K: 11K से अधिक छवियों और 1.7 मिलियन बाउंडिंग बॉक्स के साथ खुदरा वातावरण में घने ऑब्जेक्ट डिटेक्शन की विशेषता वाला डेटासेट।
  • VisDrone: एक डेटासेट जिसमें 10K से अधिक छवियों और वीडियो अनुक्रमों के साथ ड्रोन-कैप्चर की गई इमेजरी से ऑब्जेक्ट डिटेक्शन और मल्टी-ऑब्जेक्ट ट्रैकिंग डेटा होता है।
  • VOC: पास्कल विज़ुअल ऑब्जेक्ट क्लासेस (VOC) डेटासेट ऑब्जेक्ट डिटेक्शन और 20 ऑब्जेक्ट क्लासेस और 11K से अधिक छवियों के साथ सेगमेंटेशन के लिए।
  • xView: 60 ऑब्जेक्ट श्रेणियों और 1 मिलियन से अधिक एनोटेट किए गए ऑब्जेक्ट्स के साथ ओवरहेड इमेजरी में ऑब्जेक्ट डिटेक्शन के लिए एक डेटासेट।
  • Roboflow 100: व्यापक मॉडल मूल्यांकन के लिए सात इमेजरी डोमेन में फैले 100 डेटासेट के साथ एक विविध ऑब्जेक्ट डिटेक्शन बेंचमार्क।
  • ब्रेन-ट्यूमर: ब्रेन ट्यूमर का पता लगाने के लिए एक डेटासेट में ट्यूमर की उपस्थिति, स्थान और विशेषताओं के विवरण के साथ एमआरआई या सीटी स्कैन छवियां शामिल हैं।
  • अफ्रीकी-वन्यजीव: भैंस, हाथी, गैंडे और ज़ेबरा सहित अफ्रीकी वन्यजीवों की छवियों की विशेषता वाला डेटासेट।
  • हस्ताक्षर: एनोटेट किए गए हस्ताक्षरों के साथ विभिन्न दस्तावेजों की छवियों की विशेषता वाला एक डेटासेट, दस्तावेज़ सत्यापन और धोखाधड़ी का पता लगाने के अनुसंधान का समर्थन करना।

अपना खुद का डेटासेट जोड़ना

यदि आपके पास अपना डेटासेट है और आप इसका उपयोग प्रशिक्षण पहचान मॉडल के लिए करना चाहते हैं Ultralytics YOLO प्रारूप, सुनिश्चित करें कि यह ऊपर निर्दिष्ट प्रारूप का पालन करता है "Ultralytics YOLO प्रारूप"। अपने एनोटेशन को आवश्यक प्रारूप में कनवर्ट करें और YAML कॉन्फ़िगरेशन फ़ाइल में पथ, कक्षाओं की संख्या और वर्ग के नाम निर्दिष्ट करें।

पोर्ट या कन्वर्ट लेबल प्रारूप

COCO डेटासेट प्रारूप को YOLO प्रारूप

आप आसानी से लोकप्रिय COCO डेटासेट प्रारूप से लेबल को में बदल सकते हैं YOLO निम्न कोड स्निपेट का उपयोग करके स्वरूपित करें:

उदाहरण

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/")

इस रूपांतरण उपकरण का उपयोग COCO डेटासेट या COCO प्रारूप में किसी भी डेटासेट को बदलने के लिए किया जा सकता है Ultralytics YOLO प्रारूप।

दोबारा जांचना याद रखें कि आप जिस डेटासेट का उपयोग करना चाहते हैं वह आपके मॉडल के अनुकूल है और आवश्यक प्रारूप सम्मेलनों का पालन करता है। सफल ऑब्जेक्ट डिटेक्शन मॉडल के प्रशिक्षण के लिए उचित रूप से स्वरूपित डेटासेट महत्वपूर्ण हैं।



बनाया गया 2023-11-12, अपडेट किया गया 2024-05-22
लेखक: रिजवान मुनव्वर (2), ग्लेन-जोचर (8), इवोरझू331 (1), लाफिंग-क्यू (1)

टिप्पणियाँ