Passer au contenu

Ensemble de données Global Wheat Head

L'Global Wheat Head Dataset est une collection d'images conçue pour soutenir le développement de modèles précis de détection d'épis de blé pour des applications dans le phénotypage du blé et la gestion des cultures. Les épis de blé, également appelés pointes, sont les parties porteuses de grains de la plante de blé. Une estimation précise de la densité et de la taille des épis de blé est essentielle pour évaluer la santé des cultures, leur maturité et leur potentiel de rendement. L'ensemble de données, créé par une collaboration de neuf instituts de recherche de sept pays, couvre de multiples régions de culture pour garantir que les modèles se généralisent bien dans différents environnements.

Principales caractéristiques

  • L'ensemble de données contient plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
  • Il comprend environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
  • Les images sont des images de champs extérieurs, capturant la variabilité naturelle de l'apparence des épis de blé.
  • Les annotations comprennent des cadres de délimitation de têtes de blé pour prendre en charge les tâches de détection d’objets.

Structure du jeu de données

L'ensemble de données Global Wheat Head est organisé en deux sous-ensembles principaux :

  1. Ensemble d’entraînement: Ce sous-ensemble contient plus de 3 000 images provenant d’Europe et d’Amérique du Nord. Les images sont étiquetées avec des cadres de délimitation des épis de blé, fournissant ainsi une vérité de base pour l’entraînement des modèles de détection d’objets.
  2. Ensemble de test : Ce sous-ensemble comprend environ 1 000 images provenant d’Australie, du Japon et de Chine. Ces images sont utilisées pour évaluer les performances des modèles entraînés sur des génotypes, des environnements et des conditions d’observation inédits.

Applications

Le Global Wheat Head Dataset est largement utilisé pour l'entraînement et l'évaluation de modèles de deep learning dans les tâches de détection d'épis de blé. L'ensemble diversifié d'images du dataset, capturant un large éventail d'apparences, d'environnements et de conditions, en fait une ressource précieuse pour les chercheurs et les praticiens dans le domaine du phénotypage des plantes et de la gestion des cultures.

YAML du jeu de données

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration de l'ensemble de données. Il contient des informations sur les chemins d'accès, les classes et d'autres informations pertinentes de l'ensemble de données. Dans le cas de l'ensemble de données Global Wheat Head, le GlobalWheat2020.yaml fichier est maintenu à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Utilisation

Pour entraîner un modèle YOLO11n sur l'ensemble de données Global Wheat Head pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemple de données et d'annotations

L'ensemble de données Global Wheat Head contient un ensemble diversifié d'images de champs extérieurs, capturant la variabilité naturelle de l'apparence, des environnements et des conditions des épis de blé. Voici quelques exemples de données de l'ensemble de données, ainsi que leurs annotations correspondantes :

Exemple d'image de l'ensemble de données

  • Détection d’épis de blé : Cette image montre un exemple de détection d’épis de blé, où les épis de blé sont annotés avec des boîtes englobantes. L’ensemble de données fournit une variété d’images pour faciliter le développement de modèles pour cette tâche.

L'exemple met en évidence la variété et la complexité des données de l'ensemble de données Global Wheat Head et souligne l'importance d'une détection précise des épis de blé pour les applications de phénotypage du blé et de gestion des cultures.

Citations et remerciements

Si vous utilisez l'ensemble de données Global Wheat Head dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Nous tenons à remercier les chercheurs et les institutions qui ont contribué à la création et à la maintenance du Global Wheat Head Dataset en tant que ressource précieuse pour la communauté de recherche sur le phénotypage des plantes et la gestion des cultures. Pour plus d'informations sur le jeu de données et ses créateurs, consultez le site web du Global Wheat Head Dataset.

FAQ

À quoi sert le jeu de données Global Wheat Head Dataset ?

L'ensemble de données Global Wheat Head est principalement utilisé pour développer et entraîner des modèles d'apprentissage profond visant à détecter les épis de blé. Ceci est essentiel pour les applications dans le domaine du phénotypage du blé et de la gestion des cultures, permettant des estimations plus précises de la densité des épis de blé, de la taille et du potentiel global de rendement des cultures. Des méthodes de détection précises aident à évaluer la santé et la maturité des cultures, ce qui est essentiel pour une gestion efficace des cultures.

Comment entraîner un modèle YOLO11n sur le jeu de données Global Wheat Head ?

Pour entraîner un modèle YOLO11n sur le jeu de données Global Wheat Head, vous pouvez utiliser les extraits de code suivants. Assurez-vous d'avoir le GlobalWheat2020.yaml fichier de configuration spécifiant les chemins d'accès aux ensembles de données et aux classes :

Exemple d'entraînement

from ultralytics import YOLO

# Load a pre-trained model (recommended for training)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

Pour une liste complète des arguments disponibles, consultez la page Entraînement du modèle.

Quelles sont les principales caractéristiques du jeu de données Global Wheat Head Dataset ?

Les principales caractéristiques de l'ensemble de données Global Wheat Head sont les suivantes :

  • Plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
  • Environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
  • Forte variabilité de l'apparence des épis de blé en raison des différents environnements de croissance.
  • Annotations détaillées avec des boîtes englobantes de têtes de blé pour aider les modèles de détection d'objets.

Ces fonctionnalités facilitent le développement de modèles robustes capables de se généraliser à travers de multiples régions.

Où puis-je trouver le fichier YAML de configuration de l'ensemble de données Global Wheat Head ?

Le fichier YAML de configuration pour le jeu de données Global Wheat Head, nommé GlobalWheat2020.yaml, est disponible sur GitHub. Vous pouvez y accéder à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Ce fichier contient les informations nécessaires sur les chemins d'accès aux ensembles de données, les classes et d'autres détails de configuration nécessaires à l'entraînement du modèle dans Ultralytics YOLO.

Pourquoi la détection des épis de blé est-elle importante dans la gestion des cultures ?

La détection des épis de blé est essentielle dans la gestion des cultures car elle permet une estimation précise de la densité et de la taille des épis de blé, qui sont essentielles pour évaluer la santé, la maturité et le potentiel de rendement des cultures. En tirant parti des modèles d'apprentissage profond entraînés sur des ensembles de données tels que le Global Wheat Head Dataset, les agriculteurs et les chercheurs peuvent mieux surveiller et gérer les cultures, ce qui améliore la productivité et optimise l'utilisation des ressources dans les pratiques agricoles. Cette avancée technologique soutient l'agriculture durable et les initiatives de sécurité alimentaire.

Pour plus d'informations sur les applications de l'IA dans l'agriculture, consultez la page L'IA dans l'agriculture.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 4 mois

Commentaires