Ir al contenido

Conjunto de datos mundial sobre cabezas de trigo

El Global Wheat Head Dataset es una colección de imágenes diseñadas para apoyar el desarrollo de modelos precisos de detección de cabezas de trigo para aplicaciones en fenotipado de trigo y gestión de cultivos. Las espigas de trigo son las partes de la planta que producen el grano. La estimación precisa de la densidad y el tamaño de las espigas es esencial para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. El conjunto de datos, creado gracias a la colaboración de nueve institutos de investigación de siete países, abarca múltiples regiones de cultivo para garantizar la buena generalización de los modelos en distintos entornos.

Características principales

  • El conjunto de datos contiene más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
  • Incluye unas 1.000 imágenes de prueba de Australia, Japón y China.
  • Se trata de imágenes de campo al aire libre, que captan la variabilidad natural del aspecto de las espigas.
  • Las anotaciones incluyen cuadros delimitadores de cabezas de trigo para apoyar las tareas de detección de objetos.

Estructura del conjunto de datos

El conjunto de datos mundial sobre cabezas de trigo está organizado en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Este subconjunto contiene más de 3.000 imágenes de Europa y Norteamérica. Las imágenes están etiquetadas con recuadros delimitadores de cabezas de trigo, lo que proporciona datos reales para entrenar los modelos de detección de objetos.
  2. Conjunto de prueba: Este subconjunto consta de aproximadamente 1.000 imágenes de Australia, Japón y China. Estas imágenes se utilizan para evaluar el rendimiento de los modelos entrenados en genotipos, entornos y condiciones de observación no observados.

Aplicaciones

El Global Wheat Head Dataset se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de detección de cabezas de trigo. El variado conjunto de imágenes del conjunto de datos, que captura una amplia gama de apariencias, entornos y condiciones, lo convierte en un valioso recurso para investigadores y profesionales en el campo del fenotipado de plantas y la gestión de cultivos.

Conjunto de datos YAML

Para definir la configuración del conjunto de datos se utiliza un archivo YAML (Yet Another Markup Language). Contiene información sobre las rutas del conjunto de datos, las clases y otra información relevante. En el caso del conjunto de datos mundial sobre cabezas de trigo, el archivo GlobalWheat2020.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilización

Para entrenar un modelo YOLO11n en el conjunto de datos global de cabezas de trigo durante 100 épocas con un tamaño de imagen de 640, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

Ejemplos de datos y anotaciones

El Global Wheat Head Dataset contiene un conjunto diverso de imágenes de campo al aire libre, que capturan la variabilidad natural en el aspecto, el entorno y las condiciones de las espigas de trigo. He aquí algunos ejemplos de datos del conjunto, junto con sus correspondientes anotaciones:

Imagen de muestra del conjunto de datos

  • Detección de cabezas de trigo: Esta imagen muestra un ejemplo de detección de cabezas de trigo, en el que las cabezas de trigo se anotan con recuadros delimitadores. El conjunto de datos proporciona una variedad de imágenes para facilitar el desarrollo de modelos para esta tarea.

El ejemplo muestra la variedad y complejidad de los datos del conjunto de datos mundial sobre cabezas de trigo y destaca la importancia de una detección precisa de las cabezas de trigo para las aplicaciones en el fenotipado del trigo y la gestión de cultivos.

Citas y agradecimientos

Si utiliza el Global Wheat Head Dataset en su trabajo de investigación o desarrollo, cite el siguiente documento:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Nos gustaría agradecer a los investigadores e instituciones que han contribuido a la creación y mantenimiento del Global Wheat Head Dataset como un valioso recurso para la comunidad de investigación en fenotipado de plantas y gestión de cultivos. Para más información sobre el conjunto de datos y sus creadores, visite el sitio web Global Wheat Head Dataset.

PREGUNTAS FRECUENTES

¿Para qué se utiliza el conjunto de datos mundial sobre cabezas de trigo?

El Global Wheat Head Dataset se utiliza principalmente para desarrollar y entrenar modelos de aprendizaje profundo orientados a la detección de cabezas de trigo. Esto es crucial para las aplicaciones de fenotipado de trigo y gestión de cultivos, ya que permite realizar estimaciones más precisas de la densidad y el tamaño de las cabezas de trigo, así como del potencial de rendimiento general del cultivo. Los métodos de detección precisos ayudan a evaluar la salud y la madurez de los cultivos, algo esencial para una gestión eficiente de los mismos.

¿Cómo se entrena un modelo YOLO11n con el conjunto de datos Global Wheat Head?

Para entrenar un modelo YOLO11n en el conjunto de datos global de cabezas de trigo, puede utilizar los siguientes fragmentos de código. Asegúrese de que dispone de los archivos GlobalWheat2020.yaml en el que se especifican las rutas de los conjuntos de datos y las clases:

Ejemplo de tren

from ultralytics import YOLO

# Load a pre-trained model (recommended for training)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

Para obtener una lista completa de los argumentos disponibles, consulte la página de formación del modelo.

¿Cuáles son las principales características de la base de datos mundial sobre cabezas de trigo?

Entre las principales características del conjunto de datos mundial sobre cabezas de trigo figuran las siguientes:

  • Más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
  • Aproximadamente 1.000 imágenes de prueba procedentes de Australia, Japón y China.
  • Gran variabilidad en el aspecto de las espigas de trigo debido a los distintos entornos de cultivo.
  • Anotaciones detalladas con cuadros delimitadores de cabezas de trigo para ayudar a los modelos de detección de objetos.

Estas características facilitan el desarrollo de modelos robustos capaces de generalizar a través de múltiples regiones.

¿Dónde puedo encontrar el archivo YAML de configuración del conjunto de datos mundial sobre cabezas de trigo?

El archivo YAML de configuración del conjunto de datos mundial sobre cabezas de trigo, denominado GlobalWheat2020.yamlestá disponible en GitHub. Puede acceder a él en enlace. Este archivo contiene la información necesaria sobre rutas de conjuntos de datos, clases y otros detalles de configuración necesarios para el entrenamiento de modelos en Ultralytics YOLO .

¿Por qué es importante la detección de cabezas de trigo en la gestión de los cultivos?

La detección de cabezas de trigo es fundamental en la gestión de los cultivos porque permite estimar con precisión la densidad y el tamaño de las cabezas de trigo, que son esenciales para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. Al aprovechar los modelos de aprendizaje profundo entrenados en conjuntos de datos como el Global Wheat Head Dataset, los agricultores y los investigadores pueden supervisar y gestionar mejor los cultivos, lo que mejora la productividad y optimiza el uso de los recursos en las prácticas agrícolas. Este avance tecnológico favorece la agricultura sostenible y las iniciativas de seguridad alimentaria.

Para más información sobre las aplicaciones de la IA en la agricultura, visite La IA en la agricultura.

Creado hace 1 año ✏️ Actualizado hace 2 meses

Comentarios