Skip to content

Ensemble de données mondiales sur l'épi de blé

Le Global Wheat Head Dataset est une collection d'images conçue pour soutenir le développement de modèles précis de détection des épis de blé pour des applications dans le phénotypage du blé et la gestion des cultures. Les épis de blé sont les parties de la plante qui portent les grains. Une estimation précise de la densité et de la taille des épis de blé est essentielle pour évaluer la santé, la maturité et le potentiel de rendement des cultures. L'ensemble de données, créé par une collaboration entre neuf instituts de recherche de sept pays, couvre plusieurs régions de culture afin de s'assurer que les modèles se généralisent bien dans différents environnements.

Caractéristiques principales

  • L'ensemble de données contient plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
  • Il comprend environ 1 000 images test provenant d'Australie, du Japon et de Chine.
  • Les images sont des images de champs extérieurs, capturant la variabilité naturelle de l'apparence des épis de blé.
  • Les annotations comprennent les boîtes de délimitation des têtes de blé pour faciliter les tâches de détection des objets.

Structure de l'ensemble de données

Le jeu de données global sur l'épi de blé est organisé en deux sous-ensembles principaux :

  1. Ensemble d'entraînement: Ce sous-ensemble contient plus de 3 000 images d'Europe et d'Amérique du Nord. Les images sont étiquetées avec les boîtes de délimitation des épis de blé, ce qui permet d'obtenir une vérité de terrain pour l'entraînement des modèles de détection d'objets.
  2. Ensemble de test: Ce sous-ensemble se compose d'environ 1 000 images provenant d'Australie, du Japon et de Chine. Ces images sont utilisées pour évaluer les performances des modèles formés sur des génotypes, des environnements et des conditions d'observation inédits.

Applications

Le Global Wheat Head Dataset est largement utilisé pour la formation et l'évaluation de modèles d'apprentissage profond dans les tâches de détection d'épis de blé. L'ensemble diversifié d'images de l'ensemble de données, capturant un large éventail d'apparences, d'environnements et de conditions, en fait une ressource précieuse pour les chercheurs et les praticiens dans le domaine du phénotypage des plantes et de la gestion des cultures.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins d'accès au jeu de données, les classes et d'autres informations pertinentes. Dans le cas du Global Wheat Head Dataset, le fichier GlobalWheat2020.yaml est conservé à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilisation

Pour entraîner un modèle YOLO11n sur le Global Wheat Head Dataset pendant 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemples de données et d'annotations

Le Global Wheat Head Dataset contient un ensemble varié d'images de champs extérieurs, capturant la variabilité naturelle de l'apparence des épis de blé, des environnements et des conditions. Voici quelques exemples de données issues de l'ensemble de données, ainsi que les annotations correspondantes :

Image de l'échantillon de l'ensemble de données

  • Détection d'épis de blé: Cette image montre un exemple de détection d'épis de blé, où les épis de blé sont annotés avec des boîtes de délimitation. L'ensemble de données fournit une variété d'images pour faciliter le développement de modèles pour cette tâche.

Cet exemple illustre la variété et la complexité des données contenues dans le Global Wheat Head Dataset et souligne l'importance d'une détection précise des épis de blé pour les applications dans le domaine du phénotypage du blé et de la gestion des cultures.

Citations et remerciements

Si vous utilisez le Global Wheat Head Dataset dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Nous tenons à remercier les chercheurs et les institutions qui ont contribué à la création et à la mise à jour du Global Wheat Head Dataset en tant que ressource précieuse pour la communauté de recherche sur le phénotypage des plantes et la gestion des cultures. Pour plus d'informations sur le jeu de données et ses créateurs, visitez le site web du Global Wheat Head Dataset (jeu de données mondial sur l'épi de blé).

FAQ

À quoi sert la base de données mondiale sur l'épi de blé ?

Le Global Wheat Head Dataset est principalement utilisé pour développer et entraîner des modèles d'apprentissage profond visant à détecter les épis de blé. Ceci est crucial pour les applications de phénotypage du blé et de gestion des cultures, permettant des estimations plus précises de la densité et de la taille des épis de blé, ainsi que du potentiel de rendement global des cultures. Des méthodes de détection précises aident à évaluer la santé et la maturité des cultures, ce qui est essentiel pour une gestion efficace des cultures.

Comment entraîner un modèle YOLO11n sur le jeu de données Global Wheat Head ?

Pour entraîner un modèle YOLO11n sur le Global Wheat Head Dataset, vous pouvez utiliser les extraits de code suivants. Assurez-vous d'avoir le fichier GlobalWheat2020.yaml fichier de configuration spécifiant les chemins d'accès aux jeux de données et les classes :

Exemple de train

from ultralytics import YOLO

# Load a pre-trained model (recommended for training)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

Pour une liste complète des arguments disponibles, voir la page Formation au modèle.

Quelles sont les principales caractéristiques de la base de données mondiale sur les épis de blé ?

Les principales caractéristiques de la base de données mondiale sur l'épi de blé sont les suivantes :

  • Plus de 3 000 images d'entraînement d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
  • Environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
  • La grande variabilité de l'apparence des épis de blé est due aux différents environnements de culture.
  • Annotations détaillées des boîtes de délimitation des épis de blé pour faciliter les modèles de détection d'objets.

Ces caractéristiques facilitent le développement de modèles robustes capables de se généraliser à plusieurs régions.

Où puis-je trouver le fichier de configuration YAML pour le Global Wheat Head Dataset ?

Le fichier de configuration YAML pour le Global Wheat Head Dataset, nommé GlobalWheat2020.yamlest disponible sur GitHub. Vous pouvez y accéder à l'adresse suivante lien. Ce fichier contient les informations nécessaires sur les chemins d'accès aux ensembles de données, les classes et d'autres détails de configuration nécessaires à l'entraînement des modèles dans Ultralytics YOLO .

Pourquoi la détection de l'épi de blé est-elle importante dans la gestion des cultures ?

La détection des épis de blé est essentielle dans la gestion des cultures, car elle permet d'estimer avec précision la densité et la taille des épis de blé, qui sont indispensables pour évaluer la santé, la maturité et le potentiel de rendement des cultures. En tirant parti de modèles d'apprentissage profond formés sur des ensembles de données tels que le Global Wheat Head Dataset, les agriculteurs et les chercheurs peuvent mieux surveiller et gérer les cultures, ce qui permet d'améliorer la productivité et d'optimiser l'utilisation des ressources dans les pratiques agricoles. Cette avancée technologique soutient l'agriculture durable et les initiatives de sécurité alimentaire.

Pour plus d'informations sur les applications de l'IA dans l'agriculture, consultez le site L'IA dans l'agriculture.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires