Global Wheat Head Dataset

Global Wheat Head Dataset 是一个图像集合,旨在支持开发准确的麦穗检测模型,应用于麦穗表型分析和作物管理。麦穗也称为穗子,是小麦植株结籽的部分。准确估计麦穗的密度和大小对于评估作物健康状况、成熟度和产量潜力至关重要。该数据集由来自七个国家的九个研究机构合作创建,涵盖了多个生长区域,以确保模型在不同环境下具有良好的泛化能力。

主要特性

  • 该数据集包含来自欧洲(法国、英国、瑞士)和北美(加拿大)的 3,000 多张训练图像。
  • 它包括约 1,000 张来自澳大利亚、日本和中国的测试图像。
  • 图像均为户外田间图像,捕捉了麦穗外观的自然变化。
  • 标注内容包含麦穗边界框,以支持 object detection 任务。

数据集结构

Global Wheat Head Dataset 被分为两个主要子集:

  1. 训练集:该子集包含来自欧洲和北美的 3,000 多张图像。这些图像标注了麦穗边界框,为训练目标检测模型提供了真值。
  2. 测试集:该子集由来自澳大利亚、日本和中国的约 1,000 张图像组成。这些图像用于评估训练好的模型在未见过的基因型、环境和观测条件下的表现。

应用场景

Global Wheat Head Dataset 被广泛用于训练和评估麦穗检测任务中的 deep learning 模型。该数据集拥有多样的图像,捕捉了广泛的外观、环境和条件,对于 plant phenotyping 和作物管理领域的研究人员和从业者来说,是一种宝贵的资源。

数据集 YAML

YAML 文件用于定义数据集配置。它包含有关数据集路径、类及其他相关信息。对于 Global Wheat Head Dataset,GlobalWheat2020.yaml 文件维护在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml

ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

使用方法

要使用 640 的图像尺寸在 Global Wheat Head Dataset 上训练 100 个 epochs 的 YOLO26n 模型,你可以使用以下代码片段。有关可用参数的完整列表,请参考模型 Training 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

示例数据和标注

Global Wheat Head Dataset 包含多样化的户外田间图像,捕捉了麦穗外观、环境和条件的自然变化。以下是来自该数据集的一些数据示例及其相应的标注:

显示麦穗检测的 Global Wheat 数据集样本

  • 麦穗检测:此图像展示了一个麦穗检测的例子,其中麦穗被边界框标注。该数据集提供了各种图像,以促进该任务模型的开发。

该示例展示了 Global Wheat Head Dataset 中数据的多样性和复杂性,并强调了准确的麦穗检测对于麦穗表型分析和作物管理应用的重要性。

引文与致谢

如果你在研究或开发工作中使用了 Global Wheat Head Dataset,请引用以下论文:

引用
@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

我们感谢为创建和维护 Global Wheat Head Dataset 做出贡献的研究人员和机构,他们将其打造为植物表型分析和作物管理研究社区的宝贵资源。有关该数据集及其创建者的更多信息,请访问 Global Wheat Head Dataset 网站

常见问题 (FAQ)

Global Wheat Head Dataset 的用途是什么?

Global Wheat Head Dataset 主要用于开发和训练旨在进行麦穗检测的深度学习模型。这对于 wheat phenotyping 和作物管理的应用至关重要,能够更准确地估计麦穗密度、大小和整体作物产量潜力。准确的检测方法有助于评估作物健康和成熟度,这对于高效的作物管理是必不可少的。

我该如何在 Global Wheat Head Dataset 上训练 YOLO26n 模型?

要在 Global Wheat Head Dataset 上训练 YOLO26n 模型,你可以使用以下代码片段。请确保你拥有指定数据集路径和类的 GlobalWheat2020.yaml 配置文件:

训练示例
from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

有关可用参数的完整列表,请参考模型 Training 页面。

Global Wheat Head Dataset 的主要特点是什么?

Global Wheat Head Dataset 的主要特点包括:

  • 来自欧洲(法国、英国、瑞士)和北美(加拿大)的 3,000 多张训练图像。
  • 来自澳大利亚、日本和中国的约 1,000 张测试图像。
  • 由于不同的生长环境,麦穗外观具有高度可变性。
  • 带有麦穗边界框的详细标注,以辅助 object detection 模型。

这些特点有助于开发能够在多个地区进行泛化的稳健模型。

我在哪里可以找到 Global Wheat Head Dataset 的配置文件 YAML?

Global Wheat Head Dataset 的配置文件 YAML(名为 GlobalWheat2020.yaml)可在 GitHub 上获取。你可以通过 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml 访问。该文件包含在 Ultralytics YOLO 中进行模型训练所需的关于数据集路径、类和其他配置详情的必要信息。

为什么麦穗检测在作物管理中很重要?

麦穗检测在作物管理中至关重要,因为它能实现对麦穗密度和大小的准确估计,而这对于评估作物健康、成熟度和产量潜力至关重要。通过利用在类似 Global Wheat Head Dataset 这样的数据集上训练的 deep learning models,农民和研究人员可以更好地监测和管理作物,从而提高生产力并优化农业实践中的资源利用。这一技术进步支持 sustainable agriculture 和粮食安全倡议。

有关人工智能在农业中应用的更多信息,请访问 AI in Agriculture

评论