Vai al contenuto

Set di dati globale di teste di grano

Il Global Wheat Head Dataset è una raccolta di immagini progettata per supportare lo sviluppo di modelli accurati di rilevamento delle teste di grano per applicazioni nella fenotipizzazione del grano e nella gestione delle colture. Le teste di grano, note anche come spighe, sono le parti della pianta di grano che portano i chicchi. Una stima accurata della densità e delle dimensioni dei capolini di grano è essenziale per valutare la salute, la maturità e il potenziale di resa del raccolto. Il set di dati, creato da una collaborazione di nove istituti di ricerca di sette paesi, copre diverse regioni di coltivazione per garantire che i modelli si generalizzino bene in ambienti diversi.

Caratteristiche principali

  • Il set di dati contiene oltre 3.000 immagini di allenamento provenienti dall'Europa (Francia, Regno Unito, Svizzera) e dal Nord America (Canada).
  • Include circa 1.000 immagini di prova provenienti da Australia, Giappone e Cina.
  • Le immagini sono immagini di campo all'aperto, che catturano la naturale variabilità dell'aspetto dei cespi di grano.
  • Le annotazioni includono le caselle di delimitazione della testa del grano per supportare le attività di rilevamento degli oggetti.

Struttura del set di dati

Il Global Wheat Head Dataset è organizzato in due sottoinsiemi principali:

  1. Set di allenamento: Questo sottoinsieme contiene oltre 3.000 immagini provenienti dall'Europa e dal Nord America. Le immagini sono etichettate con i riquadri di delimitazione delle teste di grano, fornendo la verità di base per l'addestramento dei modelli di rilevamento degli oggetti.
  2. Set di prova: Questo sottoinsieme è composto da circa 1.000 immagini provenienti da Australia, Giappone e Cina. Queste immagini vengono utilizzate per valutare le prestazioni dei modelli addestrati su genotipi, ambienti e condizioni di osservazione mai visti.

Applicazioni

Il Global Wheat Head Dataset è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di rilevamento di teste di grano. La varietà di immagini del dataset, che cattura un'ampia gamma di apparenze, ambienti e condizioni, lo rende una risorsa preziosa per i ricercatori e i professionisti nel campo della fenotipizzazione delle piante e della gestione delle colture.

Set di dati YAML

Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Contiene informazioni sui percorsi del dataset, sulle classi e altre informazioni rilevanti. Nel caso del set di dati Global Wheat Head Dataset, il file GlobalWheat2020.yaml Il file viene mantenuto all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Utilizzo

Per addestrare un modello YOLOv8n sul dataset Global Wheat Head Dataset per 100 epoch con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Dati di esempio e annotazioni

Il Global Wheat Head Dataset contiene un insieme eterogeneo di immagini di campi all'aperto, che catturano la naturale variabilità delle apparenze, degli ambienti e delle condizioni dei cespi di grano. Ecco alcuni esempi di dati tratti dal dataset, insieme alle relative annotazioni:

Immagine campione del set di dati

  • Rilevamento delle teste di grano: Questa immagine mostra un esempio di rilevamento di cespi di grano, in cui i cespi di grano sono annotati con caselle di delimitazione. Il set di dati fornisce una varietà di immagini per facilitare lo sviluppo di modelli per questo compito.

L'esempio illustra la varietà e la complessità dei dati del Global Wheat Head Dataset e sottolinea l'importanza di un'accurata rilevazione delle teste di grano per le applicazioni di fenotipizzazione del grano e di gestione delle colture.

Citazioni e ringraziamenti

Se utilizzi il Global Wheat Head Dataset nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Desideriamo ringraziare i ricercatori e le istituzioni che hanno contribuito alla creazione e al mantenimento del Global Wheat Head Dataset come risorsa preziosa per la comunità di ricerca sulla fenotipizzazione delle piante e sulla gestione delle colture. Per maggiori informazioni sul dataset e sui suoi creatori, visita il sito web Global Wheat Head Dataset.



Creato 2023-11-12, Aggiornato 2024-01-12
Autori: glenn-jocher (4), Laughing-q (1)

Commenti