Conjunto de datos global de cabezas de trigo
El Conjunto Global de Datos de Cabezas de Trigo es una colección de imágenes diseñadas para apoyar el desarrollo de modelos precisos de detección de cabezas de trigo para aplicaciones en el fenotipado del trigo y la gestión de cultivos. Las cabezas de trigo, también conocidas como espigas, son las partes de la planta de trigo portadoras de granos. La estimación precisa de la densidad y el tamaño de las espigas es esencial para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. El conjunto de datos, creado por una colaboración de nueve institutos de investigación de siete países, abarca múltiples regiones de cultivo para garantizar que los modelos generalicen bien en distintos entornos.
Características principales
- El conjunto de datos contiene más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
- Incluye aproximadamente 1.000 imágenes de prueba de Australia, Japón y China.
- Las imágenes son imágenes de campo al aire libre, que captan la variabilidad natural del aspecto de las espigas de trigo.
- Las anotaciones incluyen cajas delimitadoras de cabezas de trigo para apoyar las tareas de detección de objetos.
Estructura del conjunto de datos
El Conjunto de Datos Global de Cabezas de Trigo está organizado en dos subconjuntos principales:
- Conjunto de entrenamiento: Este subconjunto contiene más de 3.000 imágenes de Europa y Norteamérica. Las imágenes están etiquetadas con cuadros delimitadores de cabezas de trigo, lo que proporciona la verdad básica para entrenar los modelos de detección de objetos.
- Conjunto de prueba: Este subconjunto consta de aproximadamente 1.000 imágenes de Australia, Japón y China. Estas imágenes se utilizan para evaluar el rendimiento de los modelos entrenados en genotipos, entornos y condiciones de observación no vistos.
Aplicaciones
El conjunto de datos global de cabezas de trigo se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de detección de cabezas de trigo. El variado conjunto de imágenes del conjunto de datos, que captura una amplia gama de apariencias, entornos y condiciones, lo convierte en un valioso recurso para investigadores y profesionales en el campo del fenotipado de plantas y la gestión de cultivos.
Conjunto de datos YAML
Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas del conjunto de datos, las clases y otra información relevante. En el caso del Conjunto de Datos Global de Cabezas de Trigo, el archivo GlobalWheat2020.yaml
se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from ultralytics.utils.downloads import download
from pathlib import Path
# Download
dir = Path(yaml['path']) # dataset root dir
urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
download(urls, dir=dir)
# Make Directories
for p in 'annotations', 'images', 'labels':
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
(dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p) # move to /images
f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json') # json file
if f.exists():
f.rename((dir / 'annotations' / p).with_suffix('.json')) # move to /annotations
Utilización
Para entrenar un modelo YOLOv8n en el Conjunto de datos global de cabezas de trigo durante 100 épocas con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.
Ejemplo de tren
Muestra de datos y anotaciones
El Conjunto de datos global de cabezas de trigo contiene un conjunto diverso de imágenes de campo al aire libre, que captan la variabilidad natural del aspecto, el entorno y las condiciones de las cabezas de trigo. He aquí algunos ejemplos de datos del conjunto de datos, junto con sus correspondientes anotaciones:
- Detección de cabezas de trigo: Esta imagen muestra un ejemplo de detección de cabezas de trigo, en el que las cabezas de trigo se anotan con cuadros delimitadores. El conjunto de datos proporciona una variedad de imágenes para facilitar el desarrollo de modelos para esta tarea.
El ejemplo muestra la variedad y complejidad de los datos del Conjunto de Datos Mundial sobre Cabezas de Trigo y destaca la importancia de una detección precisa de las cabezas de trigo para las aplicaciones en el fenotipado del trigo y la gestión de cultivos.
Citas y agradecimientos
Si utilizas el Conjunto de datos mundial sobre cabezas de trigo en tu trabajo de investigación o desarrollo, cita el siguiente documento:
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
Queremos expresar nuestro reconocimiento a los investigadores e instituciones que han contribuido a la creación y el mantenimiento del Conjunto de datos mundial sobre cabezas de trigo como valioso recurso para la comunidad de investigación sobre fenotipado de plantas y gestión de cultivos. Para más información sobre el conjunto de datos y sus creadores, visita el sitio web del Conjunto de datos mundial sobre cabezas de trigo.
PREGUNTAS FRECUENTES
¿Para qué se utiliza el Conjunto de Datos Global de Cabezas de Trigo?
El conjunto de datos global de cabezas de trigo se utiliza principalmente para desarrollar y entrenar modelos de aprendizaje profundo destinados a la detección de cabezas de trigo. Esto es crucial para las aplicaciones en el fenotipado del trigo y la gestión de cultivos, ya que permite realizar estimaciones más precisas de la densidad y el tamaño de las cabezas de trigo, así como del potencial general de rendimiento de los cultivos. Unos métodos de detección precisos ayudan a evaluar la salud y la madurez de los cultivos, algo esencial para una gestión eficaz de los mismos.
¿Cómo entreno un modelo YOLOv8n en el Conjunto de Datos Global de Cabezas de Trigo?
Para entrenar un modelo YOLOv8n en el Conjunto de datos global de cabezas de trigo, puedes utilizar los siguientes fragmentos de código. Asegúrate de que tienes el GlobalWheat2020.yaml
archivo de configuración que especifica las rutas de los conjuntos de datos y las clases:
Ejemplo de tren
Para obtener una lista completa de los argumentos disponibles, consulta la página de Formación del modelo.
¿Cuáles son las principales características del Conjunto de Datos Mundial sobre Cabezas de Trigo?
Entre las principales características del Conjunto de Datos Mundial sobre Cabezas de Trigo se incluyen:
- Más de 3.000 imágenes de entrenamiento de Europa (Francia, Reino Unido, Suiza) y Norteamérica (Canadá).
- Aproximadamente 1.000 imágenes de prueba de Australia, Japón y China.
- Gran variabilidad en el aspecto de las cabezas de trigo debido a los distintos entornos de cultivo.
- Anotaciones detalladas con cajas delimitadoras de cabezas de trigo para ayudar a los modelos de detección de objetos.
Estas características facilitan el desarrollo de modelos robustos capaces de generalizar en múltiples regiones.
¿Dónde puedo encontrar el archivo YAML de configuración del Conjunto de Datos Global de Cabezas de Trigo?
El archivo YAML de configuración del Conjunto de Datos Global de Cabezas de Trigo, denominado GlobalWheat2020.yaml
está disponible en GitHub. Puedes acceder a él en enlace. Este archivo contiene la información necesaria sobre rutas de conjuntos de datos, clases y otros detalles de configuración necesarios para el entrenamiento de modelos en Ultralytics YOLO .
¿Por qué es importante la detección de cabezas de trigo en la gestión de los cultivos?
La detección de cabezas de trigo es fundamental en la gestión de cultivos porque permite estimar con precisión la densidad y el tamaño de las cabezas de trigo, que son esenciales para evaluar la salud, la madurez y el potencial de rendimiento de los cultivos. Al aprovechar los modelos de aprendizaje profundo entrenados en conjuntos de datos como el Global Wheat Head Dataset, los agricultores y los investigadores pueden controlar y gestionar mejor los cultivos, lo que conduce a una mejora de la productividad y a un uso optimizado de los recursos en las prácticas agrícolas. Este avance tecnológico apoya la agricultura sostenible y las iniciativas de seguridad alimentaria.
Para más información sobre las aplicaciones de la IA en la agricultura, visita La IA en la Agricultura.