सामग्री पर जाएं

सिग्नेचर डिटेक्शन डेटासेट

यह डेटासेट दस्तावेजों के भीतर मानव लिखित हस्ताक्षर का पता लगाने पर केंद्रित है। इसमें एनोटेट किए गए हस्ताक्षर के साथ विभिन्न प्रकार के दस्तावेज़ शामिल हैं, जो दस्तावेज़ सत्यापन और धोखाधड़ी का पता लगाने में अनुप्रयोगों के लिए मूल्यवान अंतर्दृष्टि प्रदान करते हैं। कंप्यूटर दृष्टि एल्गोरिदम के प्रशिक्षण के लिए आवश्यक, यह डेटासेट विभिन्न दस्तावेज़ स्वरूपों में हस्ताक्षर की पहचान करने, दस्तावेज़ विश्लेषण में अनुसंधान और व्यावहारिक अनुप्रयोगों का समर्थन करने में सहायता करता है।

डेटासेट संरचना

हस्ताक्षर पहचान डेटासेट को तीन सबसेट में विभाजित किया गया है:

  • प्रशिक्षण सेट: इसमें 143 चित्र शामिल हैं, जिनमें से प्रत्येक संबंधित एनोटेशन के साथ है।
  • पुष्टि सेट : इसमें 35 इमेज शामिल हैं, जिनमें से हर एक में पेयर किए गए ऐनोटेशन हैं.

अनुप्रयोगों

इस डेटासेट को विभिन्न कंप्यूटर दृष्टि कार्यों जैसे ऑब्जेक्ट डिटेक्शन, ऑब्जेक्ट ट्रैकिंग और दस्तावेज़ विश्लेषण में लागू किया जा सकता है। विशेष रूप से, इसका उपयोग दस्तावेजों में हस्ताक्षर की पहचान करने के लिए मॉडल को प्रशिक्षित और मूल्यांकन करने के लिए किया जा सकता है, जिसमें दस्तावेज़ सत्यापन, धोखाधड़ी का पता लगाने और अभिलेखीय अनुसंधान में अनुप्रयोग हो सकते हैं। इसके अतिरिक्त, यह शैक्षिक उद्देश्यों के लिए एक मूल्यवान संसाधन के रूप में काम कर सकता है, जिससे छात्रों और शोधकर्ताओं को विभिन्न दस्तावेज़ प्रकारों में हस्ताक्षर की विशेषताओं और व्यवहारों का अध्ययन करने और समझने में सक्षम बनाया जा सकता है।

डेटासेट YAML

एक YAML (अभी तक एक और मार्कअप भाषा) फ़ाइल डेटासेट कॉन्फ़िगरेशन को परिभाषित करती है, जिसमें पथ और वर्ग की जानकारी शामिल है। हस्ताक्षर पहचान डेटासेट के लिए, signature.yaml फ़ाइल पर स्थित है https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

उपयोग

एक को प्रशिक्षित करने के लिए YOLOv8n 640 के छवि आकार के साथ 100 युगों के लिए हस्ताक्षर पहचान डेटासेट पर मॉडल, प्रदान किए गए कोड नमूनों का उपयोग करें। उपलब्ध मापदंडों की एक व्यापक सूची के लिए, मॉडल के प्रशिक्षण पृष्ठ को देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

अनुमान उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

नमूना छवियाँ और एनोटेशन

हस्ताक्षर पहचान डेटासेट में विभिन्न दस्तावेज़ प्रकारों और एनोटेट किए गए हस्ताक्षरों को प्रदर्शित करने वाली छवियों की एक विस्तृत विविधता शामिल है। नीचे डेटासेट से छवियों के उदाहरण दिए गए हैं, प्रत्येक इसके संबंधित एनोटेशन के साथ।

हस्ताक्षर का पता लगाने डेटासेट नमूना छवि

  • मोज़ेस्ड छवि: यहां, हम एक प्रशिक्षण बैच प्रस्तुत करते हैं जिसमें मोज़ेक किए गए डेटासेट चित्र शामिल हैं। Mosaicing, एक प्रशिक्षण तकनीक, बैच विविधता को समृद्ध करते हुए, कई छवियों को एक में जोड़ती है। यह विधि विभिन्न हस्ताक्षर आकारों, पहलू अनुपातों और संदर्भों में सामान्यीकरण करने के लिए मॉडल की क्षमता को बढ़ाने में मदद करती है।

यह उदाहरण हस्ताक्षर डिटेक्शन डेटासेट में छवियों की विविधता और जटिलता को दिखाता है, प्रशिक्षण प्रक्रिया के दौरान मोज़ेसिंग को शामिल करने के लाभों पर जोर देता है।

प्रशंसा पत्र और पावती

डेटासेट के तहत उपलब्ध जारी किया गया है AGPL-3.0 लाइसेंस



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

टिप्पणियाँ