Zum Inhalt springen

Globaler Weizenkopf-Datensatz

Der Globale Weizenkopf-Datensatz ist eine Sammlung von Bildern, die die Entwicklung genauer Modelle zur Erkennung von Weizenköpfen für die Phänotypisierung von Weizen und das Erntemanagement unterstützen soll. Weizenköpfe, auch Ähren genannt, sind die korntragenden Teile der Weizenpflanze. Eine genaue Schätzung der Dichte und Größe der Weizenköpfe ist für die Beurteilung der Gesundheit, der Reife und des Ertragspotenzials der Pflanzen unerlässlich. Der Datensatz, der in Zusammenarbeit von neun Forschungsinstituten aus sieben Ländern erstellt wurde, deckt mehrere Anbauregionen ab, um sicherzustellen, dass die Modelle in verschiedenen Umgebungen gut verallgemeinert werden können.

Hauptmerkmale

  • Der Datensatz enthält über 3.000 Trainingsbilder aus Europa (Frankreich, Großbritannien, Schweiz) und Nordamerika (Kanada).
  • Sie enthält rund 1.000 Testbilder aus Australien, Japan und China.
  • Bei den Bildern handelt es sich um Freilandaufnahmen, die die natürliche Variabilität im Aussehen der Weizenköpfe einfangen.
  • Zu den Anmerkungen gehören Bounding Boxes für Weizenköpfe, um die Objekterkennung zu unterstützen.

Struktur des Datensatzes

Der Globale Weizenkopfdatensatz ist in zwei Teilmengen unterteilt:

  1. Training Set: Dieser Teilsatz enthält über 3.000 Bilder aus Europa und Nordamerika. Die Bilder sind mit Boundingboxen für Weizenköpfe beschriftet, die die Grundlage für das Training von Objekterkennungsmodellen bilden.
  2. Test Set: Diese Teilmenge besteht aus etwa 1.000 Bildern aus Australien, Japan und China. Diese Bilder werden verwendet, um die Leistung der trainierten Modelle bei ungesehenen Genotypen, Umgebungen und Beobachtungsbedingungen zu bewerten.

Anwendungen

Der Global Wheat Head Dataset wird häufig zum Trainieren und Bewerten von Deep-Learning-Modellen für die Erkennung von Weizenköpfen verwendet. Die vielfältigen Bilder des Datensatzes, die ein breites Spektrum an Erscheinungsbildern, Umgebungen und Bedingungen abbilden, machen ihn zu einer wertvollen Ressource für Forscher und Praktiker im Bereich der Pflanzenphänotypisierung und des Erntemanagements.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) wird verwendet, um die Konfiguration des Datensatzes zu definieren. Sie enthält Informationen über die Pfade des Datensatzes, Klassen und andere relevante Informationen. Im Fall des Global Wheat Head Dataset ist die GlobalWheat2020.yaml Datei wird verwaltet unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Verwendung

Um ein YOLOv8n Modell auf dem Global Wheat Head Dataset für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Beispieldaten und Anmerkungen

Der Globale Weizenkopfdatensatz enthält eine Vielzahl von Bildern von Weizenköpfen im Freien, die die natürliche Variabilität des Aussehens, der Umgebung und der Bedingungen erfassen. Hier sind einige Beispiele für Daten aus dem Datensatz mit den dazugehörigen Kommentaren:

Datensatz Beispielbild

  • Erkennung von Weizenköpfen: Dieses Bild zeigt ein Beispiel für die Weizenkopferkennung, bei der die Weizenköpfe mit Begrenzungsrahmen versehen sind. Der Datensatz enthält eine Vielzahl von Bildern, um die Entwicklung von Modellen für diese Aufgabe zu erleichtern.

Das Beispiel zeigt die Vielfalt und Komplexität der Daten im Global Wheat Head Dataset und verdeutlicht, wie wichtig die genaue Erkennung von Weizenköpfen für Anwendungen in der Weizenphänotypisierung und im Pflanzenmanagement ist.

Zitate und Danksagungen

Wenn du den Global Wheat Head Dataset in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Wir möchten uns bei den Forschern und Institutionen bedanken, die zur Erstellung und Pflege des Global Wheat Head Dataset beigetragen haben, das eine wertvolle Ressource für die Pflanzenphänotypisierungs- und Pflanzenschutzforschung darstellt. Weitere Informationen über den Datensatz und seine Ersteller findest du auf der Website des Global Wheat Head Dataset.



Erstellt am 2023-11-12, Aktualisiert am 2024-01-12
Autoren: glenn-jocher (4), Laughing-q (1)

Kommentare