Набор данных Global Wheat Head Dataset

Global Wheat Head Dataset — это коллекция изображений, предназначенная для поддержки разработки точных моделей обнаружения колосьев пшеницы для применения в фенотипировании пшеницы и управлении посевами. Колосья пшеницы, также называемые колосками, — это зерносодержащие части растения пшеницы. Точная оценка плотности и размера колосьев пшеницы имеет решающее значение для определения здоровья, зрелости и потенциальной урожайности посевов. Набор данных, созданный в результате сотрудничества девяти исследовательских институтов из семи стран, охватывает множество регионов выращивания, чтобы гарантировать, что модели будут хорошо обобщаться в различных условиях.

Основные характеристики

  • Набор данных содержит более 3000 обучающих изображений из Европы (Франция, Великобритания, Швейцария) и Северной Америки (Канада).
  • Он включает около 1000 тестовых изображений из Австралии, Японии и Китая.
  • Изображения представляют собой снимки полей, сделанные на открытом воздухе, что отражает естественную изменчивость внешнего вида колосьев пшеницы.
  • Аннотации включают ограничивающие рамки (bounding boxes) колосьев пшеницы для поддержки задач обнаружения объектов.

Структура набора данных

Global Wheat Head Dataset организован в два основных подмножества:

  1. Обучающий набор (Training Set): Это подмножество содержит более 3000 изображений из Европы и Северной Америки. Изображения размечены ограничивающими рамками колосьев пшеницы, обеспечивая эталонные данные (ground truth) для обучения моделей обнаружения объектов.
  2. Тестовый набор (Test Set): Это подмножество состоит примерно из 1000 изображений из Австралии, Японии и Китая. Эти изображения используются для оценки производительности обученных моделей на невидимых ранее генотипах, средах и условиях наблюдения.

Приложения

Global Wheat Head Dataset широко используется для обучения и оценки моделей глубинного обучения в задачах обнаружения колосьев пшеницы. Разнообразный набор изображений, охватывающий широкий спектр внешнего вида, сред и условий, делает этот набор данных ценным ресурсом для исследователей и практиков в области фенотипирования растений и управления посевами.

YAML набора данных

Для определения конфигурации набора данных используется YAML-файл. Он содержит информацию о путях к набору данных, классах и другую соответствующую информацию. Для Global Wheat Head Dataset файл GlobalWheat2020.yaml поддерживается по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Использование

Чтобы обучить модель YOLO26n на наборе данных Global Wheat Head Dataset в течение 100 эпох с размером изображения 640, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице Обучение (Training) модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Примеры данных и аннотаций

Global Wheat Head Dataset содержит разнообразный набор снимков полей, сделанных на открытом воздухе, которые фиксируют естественную изменчивость внешнего вида, сред и условий выращивания колосьев пшеницы. Вот несколько примеров данных из набора вместе с соответствующими аннотациями:

Пример из набора данных Global Wheat, показывающий обнаружение колосьев пшеницы

  • Обнаружение колосьев пшеницы: Это изображение демонстрирует пример обнаружения колосьев пшеницы, где они аннотированы ограничивающими рамками. Набор данных предоставляет множество изображений, способствующих разработке моделей для этой задачи.

Пример демонстрирует разнообразие и сложность данных в Global Wheat Head Dataset и подчеркивает важность точного обнаружения колосьев пшеницы для применения в фенотипировании пшеницы и управлении посевами.

Цитирование и благодарности

Если ты используешь Global Wheat Head Dataset в своей исследовательской или проектной работе, пожалуйста, сошлися на следующую статью:

Цитата
@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Мы хотели бы выразить признательность исследователям и институтам, которые внесли свой вклад в создание и поддержку Global Wheat Head Dataset как ценного ресурса для сообщества исследователей фенотипирования растений и управления посевами. Для получения дополнительной информации о наборе данных и его создателях посети веб-сайт Global Wheat Head Dataset.

Часто задаваемые вопросы (FAQ)

Для чего используется Global Wheat Head Dataset?

Global Wheat Head Dataset в первую очередь используется для разработки и обучения моделей глубинного обучения, направленных на обнаружение колосьев пшеницы. Это критически важно для приложений в области фенотипирования пшеницы и управления посевами, позволяя получать более точные оценки плотности колосьев пшеницы, их размера и общего потенциала урожайности. Точные методы обнаружения помогают оценивать здоровье и зрелость посевов, что необходимо для эффективного управления ими.

Как мне обучить модель YOLO26n на Global Wheat Head Dataset?

Чтобы обучить модель YOLO26n на наборе данных Global Wheat Head Dataset, ты можешь использовать следующие фрагменты кода. Убедись, что у тебя есть файл конфигурации GlobalWheat2020.yaml, указывающий пути к набору данных и классы:

Пример обучения
from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Для полного списка доступных аргументов смотри страницу Обучение (Training) модели.

Каковы ключевые особенности Global Wheat Head Dataset?

К ключевым особенностям Global Wheat Head Dataset относятся:

  • Более 3000 обучающих изображений из Европы (Франция, Великобритания, Швейцария) и Северной Америки (Канада).
  • Примерно 1000 тестовых изображений из Австралии, Японии и Китая.
  • Высокая вариативность внешнего вида колосьев пшеницы из-за различных условий выращивания.
  • Detailed annotations with wheat head bounding boxes to aid object detection models.

Эти особенности способствуют разработке надежных моделей, способных к обобщению в различных регионах.

Где я могу найти конфигурационный YAML-файл для Global Wheat Head Dataset?

Конфигурационный YAML-файл для Global Wheat Head Dataset под названием GlobalWheat2020.yaml доступен на GitHub. Ты можешь получить к нему доступ по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Этот файл содержит необходимую информацию о путях к набору данных, классах и другие детали конфигурации, необходимые для обучения модели в Ultralytics YOLO.

Почему обнаружение колосьев пшеницы важно в управлении посевами?

Обнаружение колосьев пшеницы критически важно при управлении посевами, поскольку оно позволяет точно оценивать плотность и размер колосьев пшеницы, что необходимо для оценки здоровья, зрелости и потенциальной урожайности посевов. Используя модели глубинного обучения, обученные на таких наборах данных, как Global Wheat Head Dataset, фермеры и исследователи могут лучше контролировать и управлять посевами, что приводит к повышению продуктивности и оптимизации использования ресурсов в сельскохозяйственной практике. Это технологическое достижение поддерживает устойчивое сельское хозяйство и инициативы по продовольственной безопасности.

Для получения дополнительной информации о применении ИИ в сельском хозяйстве посети ИИ в сельском хозяйстве.

Комментарии