Saltar al contenido

Conjunto de datos global de cabezas de trigo

El Conjunto Global de Datos de Cabezas de Trigo es una colecci贸n de im谩genes dise帽adas para apoyar el desarrollo de modelos precisos de detecci贸n de cabezas de trigo para aplicaciones en el fenotipado del trigo y la gesti贸n de cultivos. Las cabezas de trigo, tambi茅n conocidas como espigas, son las partes de la planta de trigo portadoras de granos. La estimaci贸n precisa de la densidad y el tama帽o de las espigas es esencial para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. El conjunto de datos, creado por una colaboraci贸n de nueve institutos de investigaci贸n de siete pa铆ses, abarca m煤ltiples regiones de cultivo para garantizar que los modelos generalicen bien en distintos entornos.

Caracter铆sticas principales

  • El conjunto de datos contiene m谩s de 3.000 im谩genes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteam茅rica (Canad谩).
  • Incluye aproximadamente 1.000 im谩genes de prueba de Australia, Jap贸n y China.
  • Las im谩genes son im谩genes de campo al aire libre, que captan la variabilidad natural del aspecto de las espigas de trigo.
  • Las anotaciones incluyen cajas delimitadoras de cabezas de trigo para apoyar las tareas de detecci贸n de objetos.

Estructura del conjunto de datos

El Conjunto de Datos Global de Cabezas de Trigo est谩 organizado en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Este subconjunto contiene m谩s de 3.000 im谩genes de Europa y Norteam茅rica. Las im谩genes est谩n etiquetadas con cuadros delimitadores de cabezas de trigo, lo que proporciona la verdad b谩sica para entrenar los modelos de detecci贸n de objetos.
  2. Conjunto de prueba: Este subconjunto consta de aproximadamente 1.000 im谩genes de Australia, Jap贸n y China. Estas im谩genes se utilizan para evaluar el rendimiento de los modelos entrenados en genotipos, entornos y condiciones de observaci贸n no vistos.

Aplicaciones

El conjunto de datos global de cabezas de trigo se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de detecci贸n de cabezas de trigo. El variado conjunto de im谩genes del conjunto de datos, que captura una amplia gama de apariencias, entornos y condiciones, lo convierte en un valioso recurso para investigadores y profesionales en el campo del fenotipado de plantas y la gesti贸n de cultivos.

Conjunto de datos YAML

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuraci贸n del conjunto de datos. Contiene informaci贸n sobre las rutas del conjunto de datos, las clases y otra informaci贸n relevante. En el caso del Conjunto de Datos Global de Cabezas de Trigo, el archivo GlobalWheat2020.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 馃殌, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# 鈹溾攢鈹 ultralytics
# 鈹斺攢鈹 datasets
#     鈹斺攢鈹 GlobalWheat2020  鈫 downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilizaci贸n

Para entrenar un modelo YOLOv8n en el Conjunto de datos global de cabezas de trigo durante 100 茅pocas con un tama帽o de imagen de 640, puedes utilizar los siguientes fragmentos de c贸digo. Para obtener una lista completa de los argumentos disponibles, consulta la p谩gina Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Muestra de datos y anotaciones

El Conjunto de datos global de cabezas de trigo contiene un conjunto diverso de im谩genes de campo al aire libre, que captan la variabilidad natural del aspecto, el entorno y las condiciones de las cabezas de trigo. He aqu铆 algunos ejemplos de datos del conjunto de datos, junto con sus correspondientes anotaciones:

Imagen de muestra del conjunto de datos

  • Detecci贸n de cabezas de trigo: Esta imagen muestra un ejemplo de detecci贸n de cabezas de trigo, en el que las cabezas de trigo se anotan con cuadros delimitadores. El conjunto de datos proporciona una variedad de im谩genes para facilitar el desarrollo de modelos para esta tarea.

El ejemplo muestra la variedad y complejidad de los datos del Conjunto de Datos Mundial sobre Cabezas de Trigo y destaca la importancia de una detecci贸n precisa de las cabezas de trigo para las aplicaciones en el fenotipado del trigo y la gesti贸n de cultivos.

Citas y agradecimientos

Si utilizas el Conjunto de datos mundial sobre cabezas de trigo en tu trabajo de investigaci贸n o desarrollo, cita el siguiente documento:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Queremos expresar nuestro reconocimiento a los investigadores e instituciones que han contribuido a la creaci贸n y el mantenimiento del Conjunto de datos mundial sobre cabezas de trigo como valioso recurso para la comunidad de investigaci贸n sobre fenotipado de plantas y gesti贸n de cultivos. Para m谩s informaci贸n sobre el conjunto de datos y sus creadores, visita el sitio web del Conjunto de datos mundial sobre cabezas de trigo.



Creado 2023-11-12, Actualizado 2024-05-18
Autores: glenn-jocher (5), Laughing-q (1)

Comentarios