सामग्री पर जाएं

ग्लोबल व्हीट हेड डेटासेट

ग्लोबल व्हीट हेड डेटासेट गेहूं फेनोटाइपिंग और फसल प्रबंधन में अनुप्रयोगों के लिए सटीक गेहूं सिर का पता लगाने वाले मॉडल के विकास का समर्थन करने के लिए डिज़ाइन की गई छवियों का एक संग्रह है। गेहूं के सिर, जिन्हें स्पाइक्स के रूप में भी जाना जाता है, गेहूं के पौधे के अनाज वाले हिस्से हैं। फसल के स्वास्थ्य, परिपक्वता और उपज क्षमता का आकलन करने के लिए गेहूं के शीर्ष घनत्व और आकार का सटीक अनुमान आवश्यक है। सात देशों के नौ शोध संस्थानों के सहयोग से बनाया गया डेटासेट, विभिन्न वातावरणों में मॉडल को अच्छी तरह से सामान्यीकृत करने के लिए कई बढ़ते क्षेत्रों को कवर करता है।

प्रमुख विशेषताऐं

  • डेटासेट में यूरोप (फ्रांस, यूके, स्विट्जरलैंड) और उत्तरी अमेरिका (कनाडा) से 3,000 से अधिक प्रशिक्षण छवियां शामिल हैं।
  • इसमें ऑस्ट्रेलिया, जापान और चीन से लगभग 1,000 परीक्षण छवियां शामिल हैं।
  • छवियाँ बाहरी क्षेत्र की छवियां हैं, जो गेहूं के सिर के दिखावे में प्राकृतिक परिवर्तनशीलता को कैप्चर करती हैं।
  • एनोटेशन में ऑब्जेक्ट डिटेक्शन कार्यों का समर्थन करने के लिए गेहूं के सिर बाउंडिंग बॉक्स शामिल हैं।

डेटासेट संरचना

ग्लोबल व्हीट हेड डेटासेट को दो मुख्य सबसेट में व्यवस्थित किया गया है:

  1. प्रशिक्षण सेट: इस सबसेट में यूरोप और उत्तरी अमेरिका की 3,000 से अधिक छवियां हैं। छवियों को गेहूं के सिर बाउंडिंग बक्से के साथ लेबल किया जाता है, जो ऑब्जेक्ट डिटेक्शन मॉडल के प्रशिक्षण के लिए जमीनी सच्चाई प्रदान करता है।
  2. टेस्ट सेट: इस सबसेट में ऑस्ट्रेलिया, जापान और चीन की लगभग 1,000 छवियां शामिल हैं। इन छवियों का उपयोग अनदेखी जीनोटाइप, वातावरण और अवलोकन स्थितियों पर प्रशिक्षित मॉडल के प्रदर्शन के मूल्यांकन के लिए किया जाता है।

अनुप्रयोगों

ग्लोबल व्हीट हेड डेटासेट का व्यापक रूप से गेहूं के सिर का पता लगाने के कार्यों में गहन शिक्षण मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयोग किया जाता है। डेटासेट की छवियों का विविध सेट, दिखावे, वातावरण और स्थितियों की एक विस्तृत श्रृंखला को कैप्चर करते हुए, इसे प्लांट फेनोटाइपिंग और फसल प्रबंधन के क्षेत्र में शोधकर्ताओं और चिकित्सकों के लिए एक मूल्यवान संसाधन बनाते हैं।

डेटासेट YAML

डेटासेट कॉन्फ़िगरेशन को परिभाषित करने के लिए एक YAML (अभी तक एक और मार्कअप भाषा) फ़ाइल का उपयोग किया जाता है। इसमें डेटासेट के पथ, कक्षाओं और अन्य प्रासंगिक जानकारी के बारे में जानकारी होती है। ग्लोबल व्हीट हेड डेटासेट के मामले में, GlobalWheat2020.yaml फ़ाइल पर बनाए रखा जाता है https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

उपयोग

एक प्रशिक्षित करने के लिए YOLOv8n 640 के छवि आकार के साथ 100 युगों के लिए ग्लोबल व्हीट हेड डेटासेट पर मॉडल, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की व्यापक सूची के लिए, मॉडल प्रशिक्षण पृष्ठ देखें।

ट्रेन का उदाहरण

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

नमूना डेटा और एनोटेशन

ग्लोबल व्हीट हेड डेटासेट में बाहरी क्षेत्र की छवियों का एक विविध सेट होता है, जो गेहूं के सिर के दिखावे, वातावरण और स्थितियों में प्राकृतिक परिवर्तनशीलता को कैप्चर करता है। यहां डेटासेट से डेटा के कुछ उदाहरण दिए गए हैं, साथ ही उनके संबंधित एनोटेशन के साथ:

डेटासेट नमूना छवि

  • गेहूं सिर का पता लगाने: इस छवि गेहूं सिर का पता लगाने, जहां गेहूं सिर बाउंडिंग बक्से के साथ एनोटेट कर रहे हैं का एक उदाहरण प्रदर्शित करता है. डेटासेट इस कार्य के लिए मॉडल के विकास की सुविधा के लिए विभिन्न प्रकार की छवियां प्रदान करता है।

उदाहरण ग्लोबल व्हीट हेड डेटासेट में डेटा की विविधता और जटिलता को प्रदर्शित करता है और गेहूं फेनोटाइपिंग और फसल प्रबंधन में अनुप्रयोगों के लिए सटीक गेहूं सिर का पता लगाने के महत्व पर प्रकाश डालता है।

प्रशंसा पत्र और पावती

यदि आप अपने शोध या विकास कार्य में ग्लोबल व्हीट हेड डेटासेट का उपयोग करते हैं, तो कृपया निम्नलिखित पेपर का हवाला दें:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

हम शोधकर्ताओं और संस्थानों है कि निर्माण और संयंत्र फेनोटाइपिंग और फसल प्रबंधन अनुसंधान समुदाय के लिए एक मूल्यवान संसाधन के रूप में ग्लोबल गेहूं हेड डेटासेट के रखरखाव में योगदान देने के लिए स्वीकार करना चाहते हैं. डेटासेट और इसके रचनाकारों के बारे में अधिक जानकारी के लिए, ग्लोबल व्हीट हेड डेटासेट वेबसाइट पर जाएं।



बनाया गया 2023-11-12, अपडेट किया गया 2024-05-18
लेखक: ग्लेन-जोचर (5), लाफिंग-क्यू (1)

टिप्पणियाँ