Ensemble de données sur l'épi de blé
Le Global Wheat Head Dataset est une collection d'images conçue pour soutenir le développement de modèles précis de détection des épis de blé pour des applications dans le phénotypage du blé et la gestion des cultures. Les têtes de blé, également appelées épis, sont les parties de la plante de blé qui portent les grains. Une estimation précise de la densité et de la taille des épis de blé est essentielle pour évaluer la santé, la maturité et le potentiel de rendement des cultures. L'ensemble de données, créé par la collaboration de neuf instituts de recherche de sept pays, couvre plusieurs régions de culture afin de s'assurer que les modèles se généralisent bien à différents environnements.
Caractéristiques principales
- L'ensemble de données contient plus de 3 000 images d'entraînement provenant d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
- Il comprend environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
- Les images sont des images de champs extérieurs, capturant la variabilité naturelle de l'apparence des épis de blé.
- Les annotations comprennent les boîtes de délimitation des têtes de blé pour faciliter les tâches de détection des objets.
Structure de l'ensemble de données
L'ensemble de données mondial sur l'épi de blé est organisé en deux sous-ensembles principaux :
- Ensemble d'entraînement: Ce sous-ensemble contient plus de 3 000 images d'Europe et d'Amérique du Nord. Les images sont étiquetées avec des boîtes de délimitation d'épis de blé, ce qui fournit une vérité de terrain pour l'entraînement des modèles de détection d'objets.
- Ensemble de test: Ce sous-ensemble est composé d'environ 1 000 images provenant d'Australie, du Japon et de Chine. Ces images sont utilisées pour évaluer les performances des modèles entraînés sur des génotypes, des environnements et des conditions d'observation inédits.
Applications
Le Global Wheat Head Dataset est largement utilisé pour former et évaluer des modèles d'apprentissage profond dans des tâches de détection d'épis de blé. L'ensemble diversifié d'images de l'ensemble de données, capturant un large éventail d'apparences, d'environnements et de conditions, en fait une ressource précieuse pour les chercheurs et les praticiens dans le domaine du phénotypage des plantes et de la gestion des cultures.
Jeu de données YAML
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins d'accès au jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données mondial sur les épis de blé, le fichier YAML est un fichier de configuration. GlobalWheat2020.yaml
est maintenu à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from ultralytics.utils.downloads import download
from pathlib import Path
# Download
dir = Path(yaml['path']) # dataset root dir
urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
download(urls, dir=dir)
# Make Directories
for p in 'annotations', 'images', 'labels':
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
(dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p) # move to /images
f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json') # json file
if f.exists():
f.rename((dir / 'annotations' / p).with_suffix('.json')) # move to /annotations
Utilisation
Pour entraîner un modèle YOLOv8n sur l'ensemble de données Global Wheat Head Dataset pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.
Exemple de train
Exemples de données et d'annotations
L'ensemble de données mondial sur les épis de blé contient un ensemble varié d'images de champs extérieurs, capturant la variabilité naturelle des apparences, des environnements et des conditions des épis de blé. Voici quelques exemples de données issues de l'ensemble de données, ainsi que les annotations correspondantes :
- Détection des épis de blé : Cette image montre un exemple de détection d'épis de blé, où les épis de blé sont annotés avec des boîtes de délimitation. L'ensemble de données fournit une variété d'images pour faciliter le développement de modèles pour cette tâche.
Cet exemple montre la variété et la complexité des données du Global Wheat Head Dataset et souligne l'importance d'une détection précise des épis de blé pour les applications de phénotypage du blé et de gestion des cultures.
Citations et remerciements
Si tu utilises le Global Wheat Head Dataset dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
Nous tenons à remercier les chercheurs et les institutions qui ont contribué à la création et à la maintenance du Global Wheat Head Dataset en tant que ressource précieuse pour la communauté de recherche sur le phénotypage des plantes et la gestion des cultures. Pour plus d'informations sur le jeu de données et ses créateurs, visite le site Web du Global Wheat Head Dataset (jeu de données mondial sur l'épi de blé).
FAQ
À quoi sert l'ensemble de données sur l'épi de blé mondial ?
Le Global Wheat Head Dataset est principalement utilisé pour développer et former des modèles d'apprentissage profond visant à détecter les épis de blé. Ceci est crucial pour les applications de phénotypage du blé et de gestion des cultures, permettant des estimations plus précises de la densité et de la taille des têtes de blé, ainsi que du potentiel de rendement global des cultures. Des méthodes de détection précises aident à évaluer la santé et la maturité des cultures, ce qui est essentiel pour une gestion efficace des cultures.
Comment entraîner un modèle YOLOv8n sur le jeu de données Global Wheat Head ?
Pour entraîner un modèle YOLOv8n sur l'ensemble de données Global Wheat Head, tu peux utiliser les extraits de code suivants. Assure-toi d'avoir le fichier GlobalWheat2020.yaml
fichier de configuration spécifiant les chemins d'accès aux jeux de données et les classes :
Exemple de train
Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation au modèle.
Quelles sont les principales caractéristiques du jeu de données mondial sur les têtes de bétail ?
Les principales caractéristiques de l'ensemble de données sur l'épi de blé mondial sont les suivantes :
- Plus de 3 000 images d'entraînement d'Europe (France, Royaume-Uni, Suisse) et d'Amérique du Nord (Canada).
- Environ 1 000 images de test provenant d'Australie, du Japon et de Chine.
- La grande variabilité des apparences de l'épi de blé est due aux différents environnements de culture.
- Annotations détaillées avec les boîtes de délimitation de l'épi de blé pour aider les modèles de détection d'objets.
Ces caractéristiques facilitent le développement de modèles robustes capables de se généraliser à plusieurs régions.
Où puis-je trouver le fichier de configuration YAML pour le jeu de données mondial sur l'épi de blé ?
Le fichier de configuration YAML pour le jeu de données mondial sur l'épi de blé, nommé GlobalWheat2020.yaml
est disponible sur GitHub. Tu peux y accéder à l'adresse suivante lien. Ce fichier contient les informations nécessaires sur les chemins d'accès aux ensembles de données, les classes et d'autres détails de configuration nécessaires à l'entraînement des modèles dans Ultralytics YOLO .
Pourquoi la détection de l'épi de blé est-elle importante dans la gestion des cultures ?
La détection des épis de blé est essentielle dans la gestion des cultures, car elle permet d'estimer avec précision la densité et la taille des épis de blé, qui sont indispensables pour évaluer la santé, la maturité et le potentiel de rendement des cultures. En tirant parti de modèles d'apprentissage profond formés sur des ensembles de données tels que le Global Wheat Head Dataset, les agriculteurs et les chercheurs peuvent mieux surveiller et gérer les cultures, ce qui permet d'améliorer la productivité et d'optimiser l'utilisation des ressources dans les pratiques agricoles. Cette avancée technologique soutient l'agriculture durable et les initiatives de sécurité alimentaire.
Pour plus d'informations sur les applications de l'IA dans l'agriculture, visite le site L'IA dans l'agriculture.