Перейти к содержимому

Глобальный набор данных о головках пшеницы

Global Wheat Head Dataset - это коллекция изображений, предназначенная для поддержки разработки точных моделей обнаружения пшеничных головок для применения в фенотипировании пшеницы и управлении посевами. Головки пшеницы, также известные как колосья, являются зерноносными частями растения пшеницы. Точная оценка плотности и размера пшеничной головки важна для оценки здоровья, зрелости и потенциала урожая. Набор данных, созданный совместными усилиями девяти исследовательских институтов из семи стран, охватывает несколько регионов выращивания, чтобы модели хорошо обобщались в различных условиях.

Основные характеристики

  • В датасете содержится более 3 000 тренировочных изображений из Европы (Франция, Великобритания, Швейцария) и Северной Америки (Канада).
  • В него входит около 1 000 тестовых изображений из Австралии, Японии и Китая.
  • Снимки сделаны на открытом воздухе и отражают естественную изменчивость внешнего вида пшеничных головок.
  • Аннотации включают ограничительные рамки пшеничной головы для поддержки задач по обнаружению объектов.

Структура набора данных

Глобальный датасет пшеничных головок разбит на два основных подмножества:

  1. Тренировочный набор: В этом подмножестве содержится более 3 000 изображений из Европы и Северной Америки. Изображения помечены ограничительными рамками в виде головок пшеницы, что позволяет получить достоверные данные для обучения моделей обнаружения объектов.
  2. Тестовый набор: Это подмножество состоит примерно из 1 000 изображений из Австралии, Японии и Китая. Эти изображения используются для оценки производительности обученных моделей на невидимых генотипах, средах и условиях наблюдения.

Приложения

Global Wheat Head Dataset широко используется для обучения и оценки моделей глубокого обучения в задачах обнаружения головок пшеницы. Разнообразный набор изображений, запечатлевших широкий спектр внешности, окружения и условий, делает эту базу данных ценным ресурсом для исследователей и практиков в области фенотипирования растений и управления посевами.

Набор данных YAML

Для определения конфигурации набора данных используется файл YAML (Yet Another Markup Language). Он содержит информацию о путях к набору данных, классах и другую необходимую информацию. В случае с набором данных Global Wheat Head Dataset это GlobalWheat2020.yaml файл хранится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Использование

Чтобы обучить модель YOLOv8n на Global Wheat Head Dataset в течение 100 эпох при размере изображения 640, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов ты найдешь на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Образцы данных и аннотации

Глобальный набор данных о пшеничных головках содержит разнообразные изображения, сделанные на открытом воздухе, которые отражают естественную изменчивость внешнего вида пшеничных головок, окружающей среды и условий. Вот несколько примеров данных из этого набора, а также соответствующие аннотации к ним:

Образец изображения из набора данных

  • Обнаружение головок пшеницы: Это изображение демонстрирует пример обнаружения головок пшеницы, где головки пшеницы аннотированы ограничительными рамками. В наборе данных представлены разнообразные изображения, чтобы облегчить разработку моделей для этой задачи.

Этот пример демонстрирует разнообразие и сложность данных в Global Wheat Head Dataset и подчеркивает важность точного определения пшеничной головки для применения в фенотипировании пшеницы и управлении посевами.

Цитаты и благодарности

Если ты используешь Global Wheat Head Dataset в своих исследованиях или разработках, пожалуйста, ссылайся на следующую статью:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Мы хотели бы выразить признательность исследователям и учреждениям, которые внесли свой вклад в создание и поддержание Global Wheat Head Dataset как ценного ресурса для сообщества исследователей фенотипирования растений и управления посевами. Чтобы узнать больше о наборе данных и его создателях, посети сайт Global Wheat Head Dataset.



Создано 2023-11-12, Обновлено 2024-01-12
Авторы: glenn-jocher (4), Laughing-q (1)

Комментарии