Skip to content

Ensemble de données sur l'épi de blé

Le Global Wheat Head Dataset est une collection d'images conçue pour soutenir le développement de modèles précis de détection des épis de blé pour des applications dans le phénotypage du blé et la gestion des cultures. Les têtes de blé, également appelées épis, sont les parties de la plante de blé qui portent les grains. Une estimation précise de la densité et de la taille des épis de blé est essentielle pour évaluer la santé, la maturité et le potentiel de rendement des cultures. L'ensemble de données, créé par la collaboration de neuf instituts de recherche de sept pays, couvre plusieurs régions de culture afin de s'assurer que les modèles se généralisent bien à différents environnements.

Caractéristiques principales

  • L'ensemble de données contient plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
  • Il comprend environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
  • Les images sont des images de champs extérieurs, capturant la variabilité naturelle de l'apparence des épis de blé.
  • Les annotations comprennent les boîtes de délimitation des têtes de blé pour faciliter les tâches de détection des objets.

Structure de l'ensemble de données

L'ensemble de données mondial sur l'épi de blé est organisé en deux sous-ensembles principaux :

  1. Ensemble d'entraînement: Ce sous-ensemble contient plus de 3 000 images d'Europe et d'Amérique du Nord. Les images sont étiquetées avec des boîtes de délimitation d'épis de blé, ce qui fournit une vérité de terrain pour l'entraînement des modèles de détection d'objets.
  2. Ensemble de test: Ce sous-ensemble est composé d'environ 1 000 images provenant d'Australie, du Japon et de Chine. Ces images sont utilisées pour évaluer les performances des modèles entraînés sur des génotypes, des environnements et des conditions d'observation inédits.

Applications

Le Global Wheat Head Dataset est largement utilisé pour former et évaluer des modèles d'apprentissage profond dans des tâches de détection d'épis de blé. L'ensemble diversifié d'images de l'ensemble de données, capturant un large éventail d'apparences, d'environnements et de conditions, en fait une ressource précieuse pour les chercheurs et les praticiens dans le domaine du phénotypage des plantes et de la gestion des cultures.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins d'accès au jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données mondial sur les épis de blé, le fichier YAML est un fichier de configuration. GlobalWheat2020.yaml est maintenu à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilisation

Pour entraîner un modèle YOLOv8n sur l'ensemble de données Global Wheat Head Dataset pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Exemples de données et d'annotations

L'ensemble de données mondial sur les épis de blé contient un ensemble varié d'images de champs extérieurs, capturant la variabilité naturelle des apparences, des environnements et des conditions des épis de blé. Voici quelques exemples de données issues de l'ensemble de données, ainsi que les annotations correspondantes :

Image de l'échantillon du jeu de données

  • Détection des épis de blé : Cette image montre un exemple de détection d'épis de blé, où les épis de blé sont annotés avec des boîtes de délimitation. L'ensemble de données fournit une variété d'images pour faciliter le développement de modèles pour cette tâche.

Cet exemple montre la variété et la complexité des données du Global Wheat Head Dataset et souligne l'importance d'une détection précise des épis de blé pour les applications de phénotypage du blé et de gestion des cultures.

Citations et remerciements

Si tu utilises le Global Wheat Head Dataset dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Nous tenons à remercier les chercheurs et les institutions qui ont contribué à la création et à la maintenance du Global Wheat Head Dataset en tant que ressource précieuse pour la communauté de recherche sur le phénotypage des plantes et la gestion des cultures. Pour plus d'informations sur le jeu de données et ses créateurs, visite le site Web du Global Wheat Head Dataset (jeu de données mondial sur l'épi de blé).



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), Laughing-q (1)

Commentaires