Global Wheat Head Dataset

El Global Wheat Head Dataset es una colección de imágenes diseñada para apoyar el desarrollo de modelos precisos de detección de espigas de trigo para aplicaciones en fenotipado de trigo y gestión de cultivos. Las espigas de trigo, también conocidas como panículas, son las partes de la planta de trigo que contienen el grano. La estimación precisa de la densidad y el tamaño de las espigas es esencial para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. El conjunto de datos, creado mediante la colaboración de nueve institutos de investigación de siete países, cubre múltiples regiones de cultivo para garantizar que los modelos se generalicen bien en diferentes entornos.

Características clave

  • El conjunto de datos contiene más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y América del Norte (Canadá).
  • Incluye aproximadamente 1.000 imágenes de prueba de Australia, Japón y China.
  • Las imágenes son fotografías de campo en exteriores que capturan la variabilidad natural en la apariencia de las espigas de trigo.
  • Las anotaciones incluyen cuadros delimitadores de espigas de trigo para admitir tareas de detección de objetos.

Estructura del conjunto de datos

El Global Wheat Head Dataset se organiza en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Este subconjunto contiene más de 3.000 imágenes de Europa y América del Norte. Las imágenes están etiquetadas con cuadros delimitadores de espigas de trigo, proporcionando la verdad fundamental (ground truth) para entrenar modelos de detección de objetos.
  2. Conjunto de prueba: Este subconjunto consta de aproximadamente 1.000 imágenes de Australia, Japón y China. Estas imágenes se utilizan para evaluar el rendimiento de los modelos entrenados en genotipos, entornos y condiciones de observación no vistos anteriormente.

Aplicaciones

El Global Wheat Head Dataset se utiliza ampliamente para entrenar y evaluar modelos de deep learning en tareas de detección de espigas de trigo. El diverso conjunto de imágenes del conjunto de datos, que captura una amplia gama de apariencias, entornos y condiciones, lo convierte en un recurso valioso para investigadores y profesionales en el campo del fenotipado de plantas y la gestión de cultivos.

YAML del conjunto de datos

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas del conjunto de datos, clases y otra información relevante. Para el caso del Global Wheat Head Dataset, el archivo GlobalWheat2020.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Uso

Para entrenar un modelo YOLO26n en el Global Wheat Head Dataset durante 100 epochs con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Muestra de datos y anotaciones

El Global Wheat Head Dataset contiene un conjunto diverso de imágenes de campo al aire libre, que capturan la variabilidad natural en la apariencia, los entornos y las condiciones de las espigas de trigo. Aquí tienes algunos ejemplos de datos del conjunto, junto con sus anotaciones correspondientes:

Muestra del conjunto de datos Global Wheat que muestra la detección de espigas de trigo

  • Detección de espigas de trigo: Esta imagen demuestra un ejemplo de detección de espigas de trigo, donde las espigas están anotadas con cuadros delimitadores. El conjunto de datos proporciona una variedad de imágenes para facilitar el desarrollo de modelos para esta tarea.

El ejemplo muestra la variedad y complejidad de los datos en el Global Wheat Head Dataset y destaca la importancia de una detección precisa de las espigas de trigo para aplicaciones en el fenotipado de trigo y la gestión de cultivos.

Citas y reconocimientos

Si utilizas el Global Wheat Head Dataset en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Queremos reconocer a los investigadores e instituciones que contribuyeron a la creación y el mantenimiento del Global Wheat Head Dataset como un recurso valioso para la comunidad de investigación en fenotipado de plantas y gestión de cultivos. Para obtener más información sobre el conjunto de datos y sus creadores, visita el sitio web del Global Wheat Head Dataset.

Preguntas frecuentes

¿Para qué se utiliza el Global Wheat Head Dataset?

El Global Wheat Head Dataset se utiliza principalmente para desarrollar y entrenar modelos de deep learning destinados a la detección de espigas de trigo. Esto es crucial para las aplicaciones en fenotipado de trigo y gestión de cultivos, lo que permite realizar estimaciones más precisas de la densidad, el tamaño y el potencial general de rendimiento de las espigas de trigo. Los métodos de detección precisos ayudan a evaluar la salud y la madurez de los cultivos, lo cual es esencial para una gestión eficiente de los mismos.

¿Cómo entreno un modelo YOLO26n en el Global Wheat Head Dataset?

Para entrenar un modelo YOLO26n en el Global Wheat Head Dataset, puedes usar los siguientes fragmentos de código. Asegúrate de tener el archivo de configuración GlobalWheat2020.yaml que especifica las rutas del conjunto de datos y las clases:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.

¿Cuáles son las características clave del Global Wheat Head Dataset?

Las características clave del Global Wheat Head Dataset incluyen:

  • Más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y América del Norte (Canadá).
  • Aproximadamente 1.000 imágenes de prueba de Australia, Japón y China.
  • Alta variabilidad en la apariencia de las espigas de trigo debido a diferentes entornos de cultivo.
  • Detailed annotations with wheat head bounding boxes to aid object detection models.

Estas características facilitan el desarrollo de modelos robustos capaces de generalizar en múltiples regiones.

¿Dónde puedo encontrar el archivo YAML de configuración para el Global Wheat Head Dataset?

El archivo YAML de configuración para el Global Wheat Head Dataset, llamado GlobalWheat2020.yaml, está disponible en GitHub. Puedes acceder a él en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Este archivo contiene la información necesaria sobre las rutas del conjunto de datos, las clases y otros detalles de configuración necesarios para el entrenamiento de modelos en Ultralytics YOLO.

¿Por qué es importante la detección de espigas de trigo en la gestión de cultivos?

La detección de espigas de trigo es fundamental en la gestión de cultivos porque permite una estimación precisa de la densidad y el tamaño de las espigas, lo cual es esencial para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. Al aprovechar los modelos de deep learning entrenados en conjuntos de datos como el Global Wheat Head Dataset, los agricultores e investigadores pueden monitorear y gestionar mejor los cultivos, lo que conduce a una mayor productividad y un uso optimizado de los recursos en las prácticas agrícolas. Este avance tecnológico apoya la agricultura sostenible y las iniciativas de seguridad alimentaria.

Para obtener más información sobre las aplicaciones de la IA en la agricultura, visita IA en la agricultura.

Comentarios