Salta para o conteúdo

Conjunto de dados global de cabeças de trigo

O Global Wheat Head Dataset é uma coleção de imagens concebida para apoiar o desenvolvimento de modelos precisos de deteção de cabeças de trigo para aplicações em fenotipagem de trigo e gestão de culturas. As cabeças de trigo, também conhecidas como espigas, são as partes da planta de trigo que contêm os grãos. A estimativa exacta da densidade e do tamanho das cabeças de trigo é essencial para avaliar a saúde, a maturidade e o potencial de rendimento das culturas. O conjunto de dados, criado por uma colaboração de nove institutos de investigação de sete países, abrange várias regiões de cultivo para garantir que os modelos se generalizam bem em diferentes ambientes.

Características principais

  • O conjunto de dados contém mais de 3.000 imagens de treino da Europa (França, Reino Unido, Suíça) e da América do Norte (Canadá).
  • Inclui aproximadamente 1.000 imagens de teste da Austrália, Japão e China.
  • As imagens são imagens de campo exteriores, captando a variabilidade natural do aspeto das cabeças de trigo.
  • As anotações incluem caixas delimitadoras de cabeças de trigo para apoiar tarefas de deteção de objectos.

Estrutura do conjunto de dados

O Global Wheat Head Dataset está organizado em dois subconjuntos principais:

  1. Conjunto de treino: Este subconjunto contém mais de 3.000 imagens da Europa e da América do Norte. As imagens são rotuladas com caixas delimitadoras de cabeças de trigo, fornecendo a verdade básica para treinar modelos de deteção de objectos.
  2. Conjunto de teste: Este subconjunto consiste em aproximadamente 1.000 imagens da Austrália, Japão e China. Estas imagens são utilizadas para avaliar o desempenho dos modelos treinados em genótipos, ambientes e condições de observação não vistos.

Aplicações

O Global Wheat Head Dataset é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de deteção de cabeças de trigo. O conjunto diversificado de imagens do conjunto de dados, capturando uma ampla gama de aparências, ambientes e condições, torna-o um recurso valioso para investigadores e profissionais no campo da fenotipagem de plantas e gestão de culturas.

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) é utilizado para definir a configuração do conjunto de dados. Contém informações sobre os caminhos do conjunto de dados, classes e outras informações relevantes. No caso do Global Wheat Head Dataset, o ficheiro GlobalWheat2020.yaml é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilização

Para treinar um modelo YOLOv8n no Conjunto de dados global de cabeças de trigo para 100 épocas com um tamanho de imagem de 640, podes usar os seguintes trechos de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Dados de amostra e anotações

O Global Wheat Head Dataset contém um conjunto diversificado de imagens de campo ao ar livre, capturando a variabilidade natural das aparências, ambientes e condições das cabeças de trigo. Aqui estão alguns exemplos de dados do conjunto de dados, juntamente com as anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Deteção de cabeças de trigo: Esta imagem demonstra um exemplo de deteção de cabeças de trigo, em que as cabeças de trigo são anotadas com caixas delimitadoras. O conjunto de dados fornece uma variedade de imagens para facilitar o desenvolvimento de modelos para esta tarefa.

O exemplo mostra a variedade e a complexidade dos dados no Global Wheat Head Dataset e realça a importância da deteção exacta da cabeça de trigo para aplicações em fenotipagem de trigo e gestão de culturas.

Citações e agradecimentos

Se utilizares o Global Wheat Head Dataset no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Gostaríamos de agradecer aos investigadores e instituições que contribuíram para a criação e manutenção do Global Wheat Head Dataset como um recurso valioso para a comunidade de investigação em fenotipagem de plantas e gestão de culturas. Para mais informações sobre o conjunto de dados e os seus criadores, visita o sítio Web Global Wheat Head Dataset.



Criado em 2023-11-12, Atualizado em 2024-01-12
Autores: glenn-jocher (4), Laughing-q (1)

Comentários