Wereldwijde tarwekop dataset

De Global Wheat Head Dataset is een verzameling beelden die is ontworpen ter ondersteuning van de ontwikkeling van nauwkeurige detectiemodellen voor tarwekoppen voor toepassingen in tarwe fenotypering en gewasbeheer. Tarwekoppen, ook wel aren genoemd, zijn de graandragende delen van de tarweplant. Een nauwkeurige schatting van de dichtheid en grootte van tarwekoppen is essentieel voor het beoordelen van de gezondheid, rijpheid en opbrengstpotentieel van het gewas. De dataset, gemaakt door een samenwerking van negen onderzoeksinstituten uit zeven landen, omvat meerdere teeltregio's om ervoor te zorgen dat de modellen goed generaliseren in verschillende omgevingen.

Belangrijkste kenmerken

De dataset bevat meer dan 3000 trainingsbeelden uit Europa (Frankrijk, Verenigd Koninkrijk, Zwitserland) en Noord-Amerika (Canada).
Het bevat ongeveer 1000 testbeelden uit Australië, Japan en China.
De foto's zijn veldfoto's die de natuurlijke variabiliteit in het uiterlijk van tarwekoppen vastleggen.
Annotaties omvatten tarwekop bounding boxes om objectdetectietaken te ondersteunen.

Structuur dataset

De Global Wheat Head Dataset is onderverdeeld in twee subsets:

Trainingsset: Deze subset bevat meer dan 3000 afbeeldingen uit Europa en Noord-Amerika. De afbeeldingen zijn gelabeld met de begrenzingskaders van tarwekoppen en bieden zo de grondwaarheid voor het trainen van objectdetectiemodellen.
Testset: Deze subset bestaat uit ongeveer 1000 afbeeldingen uit Australië, Japan en China. Deze afbeeldingen worden gebruikt om de prestaties van getrainde modellen te evalueren op ongeziene genotypen, omgevingen en observatieomstandigheden.

Toepassingen

De Global Wheat Head Dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in tarwekopdetectietaken. De diverse set afbeeldingen van de dataset, die een breed scala aan verschijningsvormen, omgevingen en omstandigheden vastlegt, maakt het een waardevolle bron voor onderzoekers en praktijkmensen op het gebied van plantenfenotypering en gewasbeheer.

Dataset YAML

Een YAML (Yet Another Markup Language) bestand wordt gebruikt om de configuratie van de dataset te definiëren. Het bevat informatie over de paden, klassen en andere relevante informatie van de dataset. In het geval van de Global Wheat Head Dataset is het GlobalWheat2020.yaml bestand wordt onderhouden op https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobaalWarmte2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Gebruik

Om een YOLOv8n model te trainen op de Global Wheat Head Dataset voor 100 epochs met een afbeeldingsgrootte van 640, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Voorbeeldgegevens en annotaties

De Global Wheat Head Dataset bevat een gevarieerde set veldopnamen van tarwekoppen in de buitenlucht, die de natuurlijke variabiliteit in tarwekoppen, omgevingen en omstandigheden vastlegt. Hier zijn enkele voorbeelden van gegevens uit de dataset, samen met de bijbehorende annotaties:

Voorbeeldafbeelding dataset

Detectie van tarwekoppen: Deze afbeelding toont een voorbeeld van tarwekopdetectie, waarbij tarwekoppen zijn geannoteerd met begrenzende vakken. De dataset biedt een verscheidenheid aan afbeeldingen om de ontwikkeling van modellen voor deze taak te vergemakkelijken.

Het voorbeeld toont de verscheidenheid en complexiteit van de gegevens in de Global Wheat Head Dataset en benadrukt het belang van nauwkeurige detectie van tarwekoppen voor toepassingen in tarwe fenotypering en gewasbeheer.

Citaten en erkenningen

Als je de Global Wheat Head Dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende document:

BibTeX

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

We willen graag onze erkentelijkheid betuigen aan de onderzoekers en instellingen die hebben bijgedragen aan het creëren en onderhouden van de Global Wheat Head Dataset als een waardevolle bron voor de onderzoeksgemeenschap op het gebied van plantenfenotypering en gewasbeheer. Ga voor meer informatie over de dataset en de makers naar de Global Wheat Head Dataset website.

Aangemaakt 2023-11-12, Bijgewerkt 2024-01-12
Auteurs: glenn-jocher (4), Laughing-q (1)