Global Wheat Head Dataset
Le Global Wheat Head Dataset est une collection d'images conçue pour soutenir le développement de modèles précis de détection d'épis de blé pour des applications en phénotypage du blé et en gestion des cultures. Les épis de blé, également appelés « spikes », sont les parties porteuses de grains de la plante. Une estimation précise de la densité et de la taille des épis est essentielle pour évaluer la santé, la maturité et le rendement potentiel des cultures. Le jeu de données, créé par la collaboration de neuf instituts de recherche issus de sept pays, couvre de multiples régions de culture pour garantir que les modèles généralisent bien dans différents environnements.
Fonctionnalités clés
- Le jeu de données contient plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
- Il comprend environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
- Les images sont des images de champs en extérieur, capturant la variabilité naturelle de l'apparence des épis de blé.
- Les annotations incluent des boîtes englobantes (bounding boxes) d'épis de blé pour prendre en charge les tâches de détection d'objets.
Structure du jeu de données
Le Global Wheat Head Dataset est organisé en deux sous-ensembles principaux :
- Ensemble d'entraînement : Ce sous-ensemble contient plus de 3 000 images provenant d'Europe et d'Amérique du Nord. Les images sont étiquetées avec des boîtes englobantes d'épis de blé, fournissant une vérité terrain pour l'entraînement de modèles de détection d'objets.
- Ensemble de test : Ce sous-ensemble se compose d'environ 1 000 images provenant d'Australie, du Japon et de Chine. Ces images sont utilisées pour évaluer la performance des modèles entraînés sur des génotypes, des environnements et des conditions d'observation inconnus.
Applications
Le Global Wheat Head Dataset est largement utilisé pour entraîner et évaluer des modèles de deep learning dans des tâches de détection d'épis de blé. L'ensemble diversifié d'images du jeu de données, capturant un large éventail d'apparences, d'environnements et de conditions, en fait une ressource précieuse pour les chercheurs et les praticiens dans le domaine du phénotypage végétal et de la gestion des cultures.
YAML du jeu de données
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins, les classes et d'autres informations pertinentes du jeu de données. Pour le Global Wheat Head Dataset, le fichier GlobalWheat2020.yaml est maintenu à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from pathlib import Path
from ultralytics.utils.downloads import download
# Download
dir = Path(yaml["path"]) # dataset root dir
urls = [
"https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
"https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
]
download(urls, dir=dir)
# Make Directories
for p in "annotations", "images", "labels":
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in (
"arvalis_1",
"arvalis_2",
"arvalis_3",
"ethz_1",
"rres_1",
"inrae_1",
"usask_1",
"utokyo_1",
"utokyo_2",
"nau_1",
"uq_1",
):
(dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p) # move to /images
f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json") # json file
if f.exists():
f.rename((dir / "annotations" / p).with_suffix(".json")) # move to /annotationsUtilisation
Pour entraîner un modèle YOLO26n sur le Global Wheat Head Dataset pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)Exemples de données et d'annotations
Le Global Wheat Head Dataset contient un ensemble diversifié d'images de champs en extérieur, capturant la variabilité naturelle des apparences, environnements et conditions des épis de blé. Voici quelques exemples de données issues du jeu de données, accompagnés de leurs annotations correspondantes :

- Détection d'épis de blé : Cette image montre un exemple de détection d'épis de blé, où les épis sont annotés avec des boîtes englobantes. Le jeu de données fournit une variété d'images pour faciliter le développement de modèles pour cette tâche.
L'exemple illustre la variété et la complexité des données du Global Wheat Head Dataset et souligne l'importance d'une détection précise des épis de blé pour les applications en phénotypage du blé et en gestion des cultures.
Citations et remerciements
Si tu utilises le Global Wheat Head Dataset dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}Nous tenons à remercier les chercheurs et les institutions qui ont contribué à la création et à la maintenance du Global Wheat Head Dataset en tant que ressource précieuse pour la communauté de recherche en phénotypage végétal et en gestion des cultures. Pour plus d'informations sur le jeu de données et ses créateurs, visite le site web du Global Wheat Head Dataset.
FAQ
À quoi sert le Global Wheat Head Dataset ?
Le Global Wheat Head Dataset est principalement utilisé pour développer et entraîner des modèles de deep learning visant la détection d'épis de blé. Cela est crucial pour les applications en phénotypage du blé et en gestion des cultures, permettant des estimations plus précises de la densité, de la taille des épis et du potentiel de rendement global des cultures. Des méthodes de détection précises aident à évaluer la santé et la maturité des cultures, ce qui est essentiel pour une gestion efficace.
Comment entraîner un modèle YOLO26n sur le Global Wheat Head Dataset ?
Pour entraîner un modèle YOLO26n sur le Global Wheat Head Dataset, tu peux utiliser les extraits de code suivants. Assure-toi d'avoir le fichier de configuration GlobalWheat2020.yaml spécifiant les chemins et les classes du jeu de données :
from ultralytics import YOLO
# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.
Quelles sont les caractéristiques clés du Global Wheat Head Dataset ?
Les caractéristiques clés du Global Wheat Head Dataset incluent :
- Plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
- Environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
- Une grande variabilité dans l'apparence des épis de blé due aux différents environnements de culture.
- Detailed annotations with wheat head bounding boxes to aid object detection models.
Ces caractéristiques facilitent le développement de modèles robustes capables de généraliser sur plusieurs régions.
Où puis-je trouver le fichier YAML de configuration pour le Global Wheat Head Dataset ?
Le fichier YAML de configuration pour le Global Wheat Head Dataset, nommé GlobalWheat2020.yaml, est disponible sur GitHub. Tu peux y accéder sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Ce fichier contient les informations nécessaires sur les chemins du jeu de données, les classes et autres détails de configuration requis pour l'entraînement des modèles dans Ultralytics YOLO.
Pourquoi la détection des épis de blé est-elle importante dans la gestion des cultures ?
La détection des épis de blé est critique dans la gestion des cultures car elle permet une estimation précise de la densité et de la taille des épis, qui sont essentielles pour évaluer la santé, la maturité et le rendement potentiel des cultures. En tirant parti de modèles de deep learning entraînés sur des jeux de données comme le Global Wheat Head Dataset, les agriculteurs et les chercheurs peuvent mieux surveiller et gérer les cultures, ce qui conduit à une productivité accrue et à une utilisation optimisée des ressources dans les pratiques agricoles. Cette avancée technologique soutient l'agriculture durable et les initiatives de sécurité alimentaire.
Pour plus d'informations sur les applications de l'IA dans l'agriculture, visite IA dans l'Agriculture.