Global Wheat Head Dataset
Global Wheat Head Dataset是一个图像集合,旨在支持开发精确的麦穗检测模型,用于小麦表型分析和作物管理。麦穗,也称为穗,是小麦植物的结穗部分。准确评估麦穗密度和大小对于评估作物健康状况、成熟度和产量潜力至关重要。该数据集由来自七个国家/地区的九个研究机构合作创建,涵盖多个生长区域,以确保模型在不同环境中具有良好的泛化能力。
主要功能
- 该数据集包含来自欧洲(法国、英国、瑞士)和北美(加拿大)的 3,000 多张训练图像。
- 它包括来自澳大利亚、日本和中国的大约 1,000 张测试图像。
- 图像是室外田地图像,捕捉了麦穗外观的自然变异性。
- 标注包括小麦头部边界框,以支持 对象检测 任务。
数据集结构
Global Wheat Head Dataset 分为两个主要子集:
- 训练集:此子集包含来自欧洲和北美的 3,000 多张图像。这些图像标有麦穗边界框,为训练目标检测模型提供真实数据。
- 测试集:此子集包含来自澳大利亚、日本和中国的大约 1,000 张图像。这些图像用于评估训练后的模型在新基因型、环境和观测条件下的性能。
应用
全球小麦穗数据集广泛用于训练和评估小麦穗检测任务中的深度学习模型。该数据集包含各种外观、环境和条件下的各种图像,使其成为植物表型分析和作物管理领域的研究人员和从业人员的宝贵资源。
数据集 YAML
YAML(Yet Another Markup Language)文件用于定义数据集配置。它包含有关数据集的路径、类别和其他相关信息。对于 Global Wheat Head Dataset, GlobalWheat2020.yaml
文件保存在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from pathlib import Path
from ultralytics.utils.downloads import download
# Download
dir = Path(yaml["path"]) # dataset root dir
urls = [
"https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
"https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
]
download(urls, dir=dir)
# Make Directories
for p in "annotations", "images", "labels":
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in (
"arvalis_1",
"arvalis_2",
"arvalis_3",
"ethz_1",
"rres_1",
"inrae_1",
"usask_1",
"utokyo_1",
"utokyo_2",
"nau_1",
"uq_1",
):
(dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p) # move to /images
f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json") # json file
if f.exists():
f.rename((dir / "annotations" / p).with_suffix(".json")) # move to /annotations
用法
要在 Global Wheat Head Dataset 上训练 YOLO11n 模型 100 个epoch,图像大小为 640,您可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。
训练示例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640
样本数据和注释
Global Wheat Head Dataset 包含各种各样的室外田地图像,捕捉了麦穗外观、环境和条件的自然变异性。以下是来自数据集的一些数据示例,以及它们对应的注释:
- 麦穗检测:此图像演示了麦穗检测的示例,其中麦穗用边界框进行注释。该数据集提供了各种图像,以促进此任务的模型开发。
该示例展示了 Global Wheat Head Dataset 中数据的多样性和复杂性,并强调了准确的麦穗检测对于小麦表型分析和作物管理应用的重要性。
引用和致谢
如果您在研究或开发工作中使用 Global Wheat Head Dataset,请引用以下论文:
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
我们要感谢那些为创建和维护全球小麦穗数据集做出贡献的研究人员和机构,该数据集是植物表型分析和作物管理研究领域的重要资源。有关该数据集及其创建者的更多信息,请访问全球小麦穗数据集网站。
常见问题
Global Wheat Head Dataset 用于什么?
全球小麦穗数据集主要用于开发和训练旨在进行小麦穗检测的深度学习模型。这对于小麦表型分析和作物管理中的应用至关重要,从而可以更准确地估计小麦穗密度、大小和整体作物产量潜力。准确的检测方法有助于评估作物健康和成熟度,这对于有效的作物管理至关重要。
如何在 Global Wheat Head Dataset 上训练 YOLO11n 模型?
要在全球小麦穗数据集上训练 YOLO11n 模型,您可以使用以下代码片段。请确保您已准备好 GlobalWheat2020.yaml
配置文件,其中指定了数据集路径和类别:
训练示例
from ultralytics import YOLO
# Load a pre-trained model (recommended for training)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640
有关可用参数的完整列表,请参阅模型训练页面。
Global Wheat Head Dataset 的主要特征是什么?
全球小麦穗数据集的主要特点包括:
- 超过 3,000 张来自欧洲(法国、英国、瑞士)和北美(加拿大)的训练图像。
- 大约 1,000 张来自澳大利亚、日本和中国的测试图像。
- 由于不同的生长环境,小麦穗外观具有高度的变异性。
- 包含小麦穗边界框的详细注释,以帮助目标检测模型。
这些特点有助于开发能够在多个区域推广的稳健模型。
在哪里可以找到 Global Wheat Head Dataset 的配置 YAML 文件?
全球小麦穗数据集的配置 YAML 文件,命名为 GlobalWheat2020.yaml
,可在 GitHub 上获取。您可以在以下位置访问它: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml。此文件包含关于数据集路径、类别以及在模型训练中所需的其他配置详情。 Ultralytics YOLO.
为什么麦穗检测在作物管理中如此重要?
麦穗检测在作物管理中至关重要,因为它能够准确估计麦穗的密度和大小,这对于评估作物健康、成熟度和产量潜力至关重要。通过利用在全球麦穗数据集等数据集上训练的深度学习模型,农民和研究人员可以更好地监测和管理作物,从而提高农业实践中的生产力和优化资源利用。这项技术进步支持可持续农业和粮食安全倡议。
有关人工智能在农业中应用的更多信息,请访问农业中的人工智能。