No license

Link to this sectionConjunto de datos Global Wheat Head Dataset#

El Global Wheat Head Dataset (GWHD) es un conjunto de datos de detección de objetos de una sola clase para detectar espigas de trigo —las inflorescencias que contienen el grano de la planta de trigo— en imágenes de campos al aire libre. Ofrece 3.422 imágenes de entrenamiento, 748 de validación y 1.276 de prueba capturadas en múltiples regiones de cultivo, y fue creado mediante la colaboración de nueve institutos de investigación de siete países para que los modelos se generalicen en diferentes entornos. Una detección precisa de las espigas de trigo fundamenta las estimaciones de densidad, tamaño y potencial de rendimiento de las espigas en fenotipado de plantas y gestión de cultivos.

Link to this sectionCaracterísticas clave#

Imágenes reales de campos al aire libre que capturan la variabilidad natural en el aspecto, la iluminación y la etapa de crecimiento de las espigas de trigo.
Creado por nueve institutos de investigación de siete países, que abarcan regiones de cultivo de Europa, América del Norte, Asia y Australia para una fuerte generalización entre entornos.
Anotaciones de cuadros delimitadores para una única clase, wheat_head, lista para canalizaciones de detección de objetos y seguimiento.
Las imágenes de prueba provienen de genotipos y regiones no vistos durante el entrenamiento, lo que proporciona una auténtica prueba comparativa de generalización.

Link to this sectionEstructura del dataset#

El Global Wheat Head Dataset está organizado en tres subconjuntos definidos por la configuración GlobalWheat2020.yaml, todos ellos anotados con una única clase, wheat_head:

Split	Imágenes	Regiones
Entrenar	3.422	Europa (Francia, Reino Unido, Suiza), América del Norte (Canadá)
Validación	748	Suiza (ETH Zürich)
Prueba	1.276	Australia, Japón, China

División de validación

El conjunto de validación (748 imágenes) es el subconjunto ethz_1, que también forma parte de los dominios de entrenamiento, por lo que las métricas de validación reflejan el rendimiento dentro del dominio. El conjunto de prueba reservado de Australia, Japón y China mide la generalización a entornos no vistos durante el entrenamiento.

Link to this sectionAplicaciones#

El Global Wheat Head Dataset se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo para la detección de espigas de trigo. Su diversa imaginería a través de regiones, genotipos y condiciones lo convierte en un recurso valioso para el fenotipado de plantas y la gestión de cultivos, apoyando la estimación del rendimiento, el seguimiento de la salud del cultivo y el análisis fenotípico.

Para anotar imágenes de campo, entrenar y gestionar versiones de conjuntos de datos en tu navegador, ejecuta el flujo de trabajo completo con Ultralytics Platform.

Link to this sectionYAML del dataset#

Se utiliza un archivo YAML para definir la configuración del conjunto de datos. Define las rutas del conjunto de datos, las clases y otros detalles de configuración. Para el conjunto de datos Global Wheat Head, el archivo GlobalWheat2020.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Link to this sectionUso#

Para entrenar un modelo YOLO26n en el Global Wheat Head Dataset durante 100 épocas con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. El conjunto de datos (~7,0 GB) se descarga automáticamente la primera vez que se usa. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Link to this sectionMuestras de imágenes y anotaciones#

El Global Wheat Head Dataset contiene un conjunto diverso de imágenes de campos al aire libre, que capturan la variabilidad natural en los aspectos, entornos y condiciones de las espigas de trigo. Aquí tienes una imagen de ejemplo del conjunto de datos, junto con sus anotaciones correspondientes:

Muestra del conjunto de datos Global Wheat que muestra la detección de espigas de trigo

Detección de espigas de trigo: Las espigas de trigo están anotadas con cuadros delimitadores para detección de objetos, en una variedad de condiciones de campo que reflejan la diversidad y complejidad del conjunto de datos.

Link to this sectionCitas y agradecimientos#

Si utilizas el Global Wheat Head Dataset en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Nos gustaría reconocer a los investigadores e instituciones que contribuyeron a la creación y el mantenimiento del Global Wheat Head Dataset como un recurso valioso para la comunidad de investigación en fenotipado de plantas y gestión de cultivos. Para obtener más información sobre el conjunto de datos y sus creadores, visita el sitio web del Global Wheat Head Dataset.

Link to this sectionFAQ#

Link to this section¿Para qué se utiliza el Global Wheat Head Dataset?#

El Global Wheat Head Dataset se utiliza principalmente para desarrollar y entrenar modelos de aprendizaje profundo destinados a la detección de espigas de trigo. Esto es crucial para aplicaciones en fenotipado de trigo y gestión de cultivos, permitiendo estimaciones más precisas de la densidad, el tamaño y el potencial general de rendimiento del cultivo de trigo. Los métodos de detección precisos ayudan a evaluar la salud y madurez del cultivo, fundamentales para una gestión eficiente del mismo.

Link to this section¿Cuántas imágenes y clases hay en el Global Wheat Head Dataset?#

El Global Wheat Head Dataset tiene una única clase, wheat_head, y se divide en tres subconjuntos: 3.422 imágenes de entrenamiento, 748 imágenes de validación y 1.276 imágenes de prueba. Las imágenes de entrenamiento y validación provienen de Europa y América del Norte, mientras que el conjunto de prueba se extrae de Australia, Japón y China para evaluar la generalización a entornos no vistos.

Link to this section¿Cómo entreno un modelo YOLO26n en el Global Wheat Head Dataset?#

Para entrenar un modelo YOLO26n en el Global Wheat Head Dataset, puedes usar los siguientes fragmentos de código. Asegúrate de tener el archivo de configuración GlobalWheat2020.yaml especificando las rutas del conjunto de datos y las clases:

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Para obtener una lista completa de los argumentos disponibles, consulta la página de Training del modelo.

Link to this section¿Cómo descargo el Global Wheat Head Dataset?#

El conjunto de datos (~7,0 GB) se descarga automáticamente la primera vez que entrenas con data="GlobalWheat2020.yaml", no se requiere ningún paso manual. Ultralytics obtiene las imágenes y etiquetas y las descomprime en tu directorio local de conjuntos de datos. Puedes explorar conjuntos de datos relacionados en la descripción general de los conjuntos de datos de detección.

Link to this section¿Dónde puedo encontrar el archivo YAML de configuración para el Global Wheat Head Dataset?#

El archivo de configuración YAML para el Global Wheat Head Dataset, llamado GlobalWheat2020.yaml, está disponible en GitHub. Puedes acceder a él en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Este archivo contiene las rutas del conjunto de datos, las clases y otros detalles de configuración necesarios para el entrenamiento del modelo en Ultralytics YOLO.

Link to this section¿Por qué es importante la detección de espigas de trigo en la gestión de cultivos?#

La detección de espigas de trigo es fundamental en la gestión de cultivos porque permite una estimación precisa de la densidad y el tamaño de las espigas, lo cual es esencial para evaluar la salud, la madurez y el potencial de rendimiento del cultivo. Al aprovechar modelos de aprendizaje profundo entrenados en conjuntos de datos como el Global Wheat Head Dataset, agricultores e investigadores pueden monitorear y gestionar mejor los cultivos, lo que conduce a una mayor productividad y a un uso optimizado de los recursos en las prácticas agrícolas. Este avance tecnológico apoya iniciativas de agricultura sostenible y seguridad alimentaria.

Para obtener más información sobre las aplicaciones de la IA en la agricultura, visita AI in Agriculture.

Colaboradores

GLglenn-jocher¹⁷ RAraimbekovm³ MImiles-deans-ultralytics¹ PDpderrenger¹ MAMatthewNoyce¹ RIRizwanMunawar¹

Creado 12 nov 2023Actualizado anteayer