Zum Inhalt springen

Globaler Weizenkopf-Datensatz

Der Globale Weizenkopf-Datensatz ist eine Sammlung von Bildern, die die Entwicklung genauer Modelle zur Erkennung von Weizenköpfen fĂŒr die PhĂ€notypisierung von Weizen und das Erntemanagement unterstĂŒtzen soll. Weizenköpfe, auch Ähren genannt, sind die korntragenden Teile der Weizenpflanze. Eine genaue SchĂ€tzung der Dichte und GrĂ¶ĂŸe der Weizenköpfe ist fĂŒr die Beurteilung der Gesundheit, der Reife und des Ertragspotenzials der Pflanzen unerlĂ€sslich. Der Datensatz, der in Zusammenarbeit von neun Forschungsinstituten aus sieben LĂ€ndern erstellt wurde, deckt mehrere Anbauregionen ab, um sicherzustellen, dass die Modelle in verschiedenen Umgebungen gut verallgemeinert werden können.

Hauptmerkmale

  • Der Datensatz enthĂ€lt ĂŒber 3.000 Trainingsbilder aus Europa (Frankreich, Großbritannien, Schweiz) und Nordamerika (Kanada).
  • Sie enthĂ€lt rund 1.000 Testbilder aus Australien, Japan und China.
  • Bei den Bildern handelt es sich um Freilandaufnahmen, die die natĂŒrliche VariabilitĂ€t im Aussehen der Weizenköpfe einfangen.
  • Zu den Anmerkungen gehören Bounding Boxes fĂŒr Weizenköpfe, um die Objekterkennung zu unterstĂŒtzen.

Struktur des Datensatzes

Der Globale Weizenkopfdatensatz ist in zwei Teilmengen unterteilt:

  1. Training Set: Dieser Teilsatz enthĂ€lt ĂŒber 3.000 Bilder aus Europa und Nordamerika. Die Bilder sind mit Boundingboxen fĂŒr Weizenköpfe beschriftet, die die Grundlage fĂŒr das Training von Objekterkennungsmodellen bilden.
  2. Test Set: Diese Teilmenge besteht aus etwa 1.000 Bildern aus Australien, Japan und China. Diese Bilder werden verwendet, um die Leistung der trainierten Modelle bei ungesehenen Genotypen, Umgebungen und Beobachtungsbedingungen zu bewerten.

Anwendungen

Der Global Wheat Head Dataset wird hĂ€ufig zum Trainieren und Bewerten von Deep-Learning-Modellen fĂŒr die Erkennung von Weizenköpfen verwendet. Die vielfĂ€ltigen Bilder des Datensatzes, die ein breites Spektrum an Erscheinungsbildern, Umgebungen und Bedingungen abbilden, machen ihn zu einer wertvollen Ressource fĂŒr Forscher und Praktiker im Bereich der PflanzenphĂ€notypisierung und des Erntemanagements.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) wird verwendet, um die Konfiguration des Datensatzes zu definieren. Sie enthĂ€lt Informationen ĂŒber die Pfade des Datensatzes, Klassen und andere relevante Informationen. Im Fall des Global Wheat Head Dataset ist die GlobalWheat2020.yaml Datei wird verwaltet unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Verwendung

Um ein YOLOv8n Modell auf dem Global Wheat Head Dataset fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 640 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Beispieldaten und Anmerkungen

Der Globale Weizenkopfdatensatz enthĂ€lt eine Vielzahl von Bildern von Weizenköpfen im Freien, die die natĂŒrliche VariabilitĂ€t des Aussehens, der Umgebung und der Bedingungen erfassen. Hier sind einige Beispiele fĂŒr Daten aus dem Datensatz mit den dazugehörigen Kommentaren:

Datensatz Beispielbild

  • Erkennung von Weizenköpfen: Dieses Bild zeigt ein Beispiel fĂŒr die Weizenkopferkennung, bei der die Weizenköpfe mit Begrenzungsrahmen versehen sind. Der Datensatz enthĂ€lt eine Vielzahl von Bildern, um die Entwicklung von Modellen fĂŒr diese Aufgabe zu erleichtern.

Das Beispiel zeigt die Vielfalt und KomplexitĂ€t der Daten im Global Wheat Head Dataset und verdeutlicht, wie wichtig die genaue Erkennung von Weizenköpfen fĂŒr Anwendungen in der WeizenphĂ€notypisierung und im Pflanzenmanagement ist.

Zitate und Danksagungen

Wenn du den Global Wheat Head Dataset in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Wir möchten uns bei den Forschern und Institutionen bedanken, die zur Erstellung und Pflege des Global Wheat Head Dataset beigetragen haben, das eine wertvolle Ressource fĂŒr die PflanzenphĂ€notypisierungs- und Pflanzenschutzforschung darstellt. Weitere Informationen ĂŒber den Datensatz und seine Ersteller findest du auf der Website des Global Wheat Head Dataset.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), Laughing-q (1)

Kommentare