Saltar al contenido

Conjunto de datos global de cabezas de trigo

El Conjunto Global de Datos de Cabezas de Trigo es una colección de imágenes diseñadas para apoyar el desarrollo de modelos precisos de detección de cabezas de trigo para aplicaciones en el fenotipado del trigo y la gestión de cultivos. Las cabezas de trigo, también conocidas como espigas, son las partes de la planta de trigo portadoras de granos. La estimación precisa de la densidad y el tamaño de las espigas es esencial para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. El conjunto de datos, creado por una colaboración de nueve institutos de investigación de siete países, abarca múltiples regiones de cultivo para garantizar que los modelos generalicen bien en distintos entornos.

Características principales

  • El conjunto de datos contiene más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
  • Incluye aproximadamente 1.000 imágenes de prueba de Australia, Japón y China.
  • Las imágenes son imágenes de campo al aire libre, que captan la variabilidad natural del aspecto de las espigas de trigo.
  • Las anotaciones incluyen cajas delimitadoras de cabezas de trigo para apoyar las tareas de detección de objetos.

Estructura del conjunto de datos

El Conjunto de Datos Global de Cabezas de Trigo está organizado en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Este subconjunto contiene más de 3.000 imágenes de Europa y Norteamérica. Las imágenes están etiquetadas con cuadros delimitadores de cabezas de trigo, lo que proporciona la verdad básica para entrenar los modelos de detección de objetos.
  2. Conjunto de prueba: Este subconjunto consta de aproximadamente 1.000 imágenes de Australia, Japón y China. Estas imágenes se utilizan para evaluar el rendimiento de los modelos entrenados en genotipos, entornos y condiciones de observación no vistos.

Aplicaciones

El conjunto de datos global de cabezas de trigo se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de detección de cabezas de trigo. El variado conjunto de imágenes del conjunto de datos, que captura una amplia gama de apariencias, entornos y condiciones, lo convierte en un valioso recurso para investigadores y profesionales en el campo del fenotipado de plantas y la gestión de cultivos.

Conjunto de datos YAML

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas del conjunto de datos, las clases y otra información relevante. En el caso del Conjunto de Datos Global de Cabezas de Trigo, el archivo GlobalWheat2020.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilización

Para entrenar un modelo YOLOv8n en el Conjunto de datos global de cabezas de trigo durante 100 épocas con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Muestra de datos y anotaciones

El Conjunto de datos global de cabezas de trigo contiene un conjunto diverso de imágenes de campo al aire libre, que captan la variabilidad natural del aspecto, el entorno y las condiciones de las cabezas de trigo. He aquí algunos ejemplos de datos del conjunto de datos, junto con sus correspondientes anotaciones:

Imagen de muestra del conjunto de datos

  • Detección de cabezas de trigo: Esta imagen muestra un ejemplo de detección de cabezas de trigo, en el que las cabezas de trigo se anotan con cuadros delimitadores. El conjunto de datos proporciona una variedad de imágenes para facilitar el desarrollo de modelos para esta tarea.

El ejemplo muestra la variedad y complejidad de los datos del Conjunto de Datos Mundial sobre Cabezas de Trigo y destaca la importancia de una detección precisa de las cabezas de trigo para las aplicaciones en el fenotipado del trigo y la gestión de cultivos.

Citas y agradecimientos

Si utilizas el Conjunto de datos mundial sobre cabezas de trigo en tu trabajo de investigación o desarrollo, cita el siguiente documento:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Queremos expresar nuestro reconocimiento a los investigadores e instituciones que han contribuido a la creación y el mantenimiento del Conjunto de datos mundial sobre cabezas de trigo como valioso recurso para la comunidad de investigación sobre fenotipado de plantas y gestión de cultivos. Para más información sobre el conjunto de datos y sus creadores, visita el sitio web del Conjunto de datos mundial sobre cabezas de trigo.



Creado 2023-11-12, Actualizado 2024-01-12
Autores: glenn-jocher (4), Laughing-q (1)

Comentarios