Salta para o conteĆŗdo

Conjunto de dados global de cabeƧas de trigo

O Global Wheat Head Dataset Ć© uma coleĆ§Ć£o de imagens concebida para apoiar o desenvolvimento de modelos precisos de deteĆ§Ć£o de cabeƧas de trigo para aplicaƧƵes em fenotipagem de trigo e gestĆ£o de culturas. As cabeƧas de trigo, tambĆ©m conhecidas como espigas, sĆ£o as partes da planta de trigo que contĆŖm os grĆ£os. A estimativa exacta da densidade e do tamanho das cabeƧas de trigo Ć© essencial para avaliar a saĆŗde, a maturidade e o potencial de rendimento das culturas. O conjunto de dados, criado por uma colaboraĆ§Ć£o de nove institutos de investigaĆ§Ć£o de sete paĆ­ses, abrange vĆ”rias regiƵes de cultivo para garantir que os modelos se generalizam bem em diferentes ambientes.

CaracterĆ­sticas principais

  • O conjunto de dados contĆ©m mais de 3.000 imagens de treino da Europa (FranƧa, Reino Unido, SuƭƧa) e da AmĆ©rica do Norte (CanadĆ”).
  • Inclui aproximadamente 1.000 imagens de teste da AustrĆ”lia, JapĆ£o e China.
  • As imagens sĆ£o imagens de campo exteriores, captando a variabilidade natural do aspeto das cabeƧas de trigo.
  • As anotaƧƵes incluem caixas delimitadoras de cabeƧas de trigo para apoiar tarefas de deteĆ§Ć£o de objectos.

Estrutura do conjunto de dados

O Global Wheat Head Dataset estĆ” organizado em dois subconjuntos principais:

  1. Conjunto de treino: Este subconjunto contĆ©m mais de 3.000 imagens da Europa e da AmĆ©rica do Norte. As imagens sĆ£o rotuladas com caixas delimitadoras de cabeƧas de trigo, fornecendo a verdade bĆ”sica para treinar modelos de deteĆ§Ć£o de objectos.
  2. Conjunto de teste: Este subconjunto consiste em aproximadamente 1.000 imagens da AustrĆ”lia, JapĆ£o e China. Estas imagens sĆ£o utilizadas para avaliar o desempenho dos modelos treinados em genĆ³tipos, ambientes e condiƧƵes de observaĆ§Ć£o nĆ£o vistos.

AplicaƧƵes

O Global Wheat Head Dataset Ć© amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de deteĆ§Ć£o de cabeƧas de trigo. O conjunto diversificado de imagens do conjunto de dados, capturando uma ampla gama de aparĆŖncias, ambientes e condiƧƵes, torna-o um recurso valioso para investigadores e profissionais no campo da fenotipagem de plantas e gestĆ£o de culturas.

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) Ć© utilizado para definir a configuraĆ§Ć£o do conjunto de dados. ContĆ©m informaƧƵes sobre os caminhos do conjunto de dados, classes e outras informaƧƵes relevantes. No caso do Global Wheat Head Dataset, o ficheiro GlobalWheat2020.yaml Ć© mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO šŸš€, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ā”œā”€ā”€ ultralytics
# ā””ā”€ā”€ datasets
#     ā””ā”€ā”€ GlobalWheat2020  ā† downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

UtilizaĆ§Ć£o

Para treinar um modelo YOLOv8n no Conjunto de dados global de cabeƧas de trigo para 100 Ć©pocas com um tamanho de imagem de 640, podes usar os seguintes trechos de cĆ³digo. Para obter uma lista abrangente dos argumentos disponĆ­veis, consulta a pĆ”gina Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Dados de amostra e anotaƧƵes

O Global Wheat Head Dataset contĆ©m um conjunto diversificado de imagens de campo ao ar livre, capturando a variabilidade natural das aparĆŖncias, ambientes e condiƧƵes das cabeƧas de trigo. Aqui estĆ£o alguns exemplos de dados do conjunto de dados, juntamente com as anotaƧƵes correspondentes:

Imagem de amostra do conjunto de dados

  • DeteĆ§Ć£o de cabeƧas de trigo: Esta imagem demonstra um exemplo de deteĆ§Ć£o de cabeƧas de trigo, em que as cabeƧas de trigo sĆ£o anotadas com caixas delimitadoras. O conjunto de dados fornece uma variedade de imagens para facilitar o desenvolvimento de modelos para esta tarefa.

O exemplo mostra a variedade e a complexidade dos dados no Global Wheat Head Dataset e realƧa a importĆ¢ncia da deteĆ§Ć£o exacta da cabeƧa de trigo para aplicaƧƵes em fenotipagem de trigo e gestĆ£o de culturas.

CitaƧƵes e agradecimentos

Se utilizares o Global Wheat Head Dataset no teu trabalho de investigaĆ§Ć£o ou desenvolvimento, cita o seguinte documento:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

GostarĆ­amos de agradecer aos investigadores e instituiƧƵes que contribuĆ­ram para a criaĆ§Ć£o e manutenĆ§Ć£o do Global Wheat Head Dataset como um recurso valioso para a comunidade de investigaĆ§Ć£o em fenotipagem de plantas e gestĆ£o de culturas. Para mais informaƧƵes sobre o conjunto de dados e os seus criadores, visita o sĆ­tio Web Global Wheat Head Dataset.



Criado em 2023-11-12, Atualizado em 2024-01-12
Autores: glenn-jocher (4), Laughing-q (1)

ComentƔrios