Conjunto de datos Global Wheat Head

El Conjunto de Datos Global de Cabezas de Trigo es una colección de imágenes diseñada para apoyar el desarrollo de modelos precisos de detección de cabezas de trigo para aplicaciones en la fenotipificación del trigo y la gestión de cultivos. Las cabezas de trigo, también conocidas como espigas, son las partes de la planta de trigo que contienen el grano. La estimación precisa de la densidad y el tamaño de las cabezas de trigo es esencial para evaluar la salud del cultivo, la madurez y el potencial de rendimiento. El conjunto de datos, creado por una colaboración de nueve institutos de investigación de siete países, cubre múltiples regiones de cultivo para garantizar que los modelos se generalicen bien en diferentes entornos.

Características clave

El conjunto de datos contiene más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
Incluye aproximadamente 1000 imágenes de prueba de Australia, Japón y China.
Las imágenes son imágenes de campos al aire libre, que capturan la variabilidad natural en las apariencias de las espigas de trigo.
Las anotaciones incluyen cuadros delimitadores de cabezas de trigo para admitir tareas de detección de objetos.

Estructura del conjunto de datos

El conjunto de datos Global Wheat Head está organizado en dos subconjuntos principales:

Conjunto de entrenamiento: Este subconjunto contiene más de 3,000 imágenes de Europa y América del Norte. Las imágenes están etiquetadas con cuadros delimitadores de cabezas de trigo, proporcionando la verdad fundamental para entrenar modelos de detección de objetos.
Conjunto de prueba: Este subconjunto consta de aproximadamente 1000 imágenes de Australia, Japón y China. Estas imágenes se utilizan para evaluar el rendimiento de los modelos entrenados en genotipos, entornos y condiciones de observación no vistos.

Aplicaciones

El conjunto de datos Global Wheat Head se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de detección de cabezas de trigo. El diverso conjunto de imágenes del conjunto de datos, que captura una amplia gama de apariencias, entornos y condiciones, lo convierte en un recurso valioso para investigadores y profesionales en el campo de la fenotipificación de plantas y la gestión de cultivos.

YAML del conjunto de datos

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas, las clases y otra información relevante del conjunto de datos. En el caso del conjunto de datos Global Wheat Head, el GlobalWheat2020.yaml archivo se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Uso

Para entrenar un modelo YOLO26n en el conjunto de datos Global Wheat Head durante 100 épocas con un tamaño de imagen de 640, puede usar los siguientes fragmentos de código. Para una lista completa de argumentos disponibles, consulte la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo26n.pt epochs=100 imgsz=640

Datos de muestra y anotaciones

El conjunto de datos Global Wheat Head contiene un conjunto diverso de imágenes de campos al aire libre, que capturan la variabilidad natural en las apariencias, entornos y condiciones de las espigas de trigo. Aquí hay algunos ejemplos de datos del conjunto de datos, junto con sus anotaciones correspondientes:

Muestra del conjunto de datos Global Wheat que muestra la detección de espigas de trigo

Detección de espigas de trigo: Esta imagen muestra un ejemplo de detección de espigas de trigo, donde las espigas están anotadas con cuadros delimitadores. El conjunto de datos proporciona una variedad de imágenes para facilitar el desarrollo de modelos para esta tarea.

El ejemplo muestra la variedad y la complejidad de los datos en el Conjunto de Datos Global de Cabezas de Trigo y destaca la importancia de la detección precisa de cabezas de trigo para las aplicaciones en la fenotipificación del trigo y la gestión de cultivos.

Citas y agradecimientos

Si utiliza el conjunto de datos Global Wheat Head en su trabajo de investigación o desarrollo, cite el siguiente artículo:

BibTeX

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Nos gustaría reconocer a los investigadores e instituciones que contribuyeron a la creación y el mantenimiento del Conjunto de Datos Global de Cabezas de Trigo como un recurso valioso para la comunidad de investigación en fenotipado de plantas y gestión de cultivos. Para obtener más información sobre el conjunto de datos y sus creadores, visite el sitio web del Conjunto de Datos Global de Cabezas de Trigo.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos Global Wheat Head?

El conjunto de datos Global Wheat Head se utiliza principalmente para desarrollar y entrenar modelos de aprendizaje profundo destinados a la detección de cabezas de trigo. Esto es crucial para las aplicaciones en la fenotipificación del trigo y la gestión de cultivos, lo que permite estimaciones más precisas de la densidad de la cabeza de trigo, el tamaño y el potencial general de rendimiento del cultivo. Los métodos de detección precisos ayudan a evaluar la salud y la madurez del cultivo, lo cual es esencial para una gestión eficiente del cultivo.

¿Cómo entreno un modelo YOLO26n en el conjunto de datos Global Wheat Head?

Para entrenar un modelo YOLO26n en el conjunto de datos Global Wheat Head, puede usar los siguientes fragmentos de código. Asegúrese de tener el GlobalWheat2020.yaml archivo de configuración que especifica las rutas y clases del conjunto de datos:

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo26n.pt epochs=100 imgsz=640

Para obtener una lista completa de los argumentos disponibles, consulte la página de Entrenamiento del modelo.

¿Cuáles son las principales características del Global Wheat Head Dataset?

Las características clave del Conjunto de Datos Global de Cabezas de Trigo incluyen:

Más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
Aproximadamente 1.000 imágenes de prueba de Australia, Japón y China.
Alta variabilidad en la apariencia de las espigas de trigo debido a los diferentes entornos de cultivo.
Anotaciones detalladas con cuadros delimitadores de cabezas de trigo para ayudar a los modelos de detección de objetos.

Estas características facilitan el desarrollo de modelos robustos capaces de generalizar en múltiples regiones.

¿Dónde puedo encontrar el archivo YAML de configuración para el conjunto de datos Global Wheat Head?

El archivo YAML de configuración para el conjunto de datos Global Wheat Head, llamado GlobalWheat2020.yaml, está disponible en GitHub. Puedes acceder a él en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Este archivo contiene información necesaria sobre las rutas del conjunto de datos, las clases y otros detalles de configuración necesarios para el entrenamiento del modelo en Ultralytics YOLO.

¿Por qué es importante la detección de espigas de trigo en la gestión de cultivos?

La detección de espigas de trigo es fundamental en la gestión de cultivos porque permite una estimación precisa de la densidad y el tamaño de las espigas, lo cual es esencial para evaluar la salud, la madurez y el potencial de rendimiento del cultivo. Al aprovechar los modelos de aprendizaje profundo entrenados en conjuntos de datos como el Global Wheat Head Dataset, los agricultores e investigadores pueden monitorear y gestionar mejor los cultivos, lo que lleva a una mejora de la productividad y a un uso optimizado de los recursos en las prácticas agrícolas. Este avance tecnológico apoya la agricultura sostenible y las iniciativas de seguridad alimentaria.

Para obtener más información sobre las aplicaciones de la IA en la agricultura, visita IA en la Agricultura.

📅 Creado hace 2 años ✏️ Actualizado hace 3 meses