Global Wheat Head Dataset
Global Wheat Head Datasetは、小麦の表現型と作物管理のアプリケーション向けに、正確な小麦頭検出モデルの開発をサポートするために設計された画像のコレクションです。穂としても知られる小麦頭は、小麦植物の穀物を含む部分です。小麦頭の密度とサイズを正確に推定することは、作物の健康、成熟度、および収量ポテンシャルを評価するために不可欠です。7か国の9つの研究機関の共同研究によって作成されたデータセットは、複数の栽培地域をカバーし、モデルがさまざまな環境で適切に一般化されるようにします。
主な特徴
- データセットには、ヨーロッパ(フランス、イギリス、スイス)および北米(カナダ)からの3,000を超えるトレーニング画像が含まれています。
- これには、オーストラリア、日本、中国からの約1,000枚のテスト画像が含まれています。
- 画像は屋外のフィールド画像で、小麦の穂の外観の自然なばらつきを捉えています。
- アノテーションには、物体検出タスクをサポートするための小麦の穂のバウンディングボックスが含まれています。
データセットの構造
Global Wheat Head Datasetは、主に2つのサブセットに編成されています。
- Training Set: このサブセットには、ヨーロッパと北米からの3,000枚以上の画像が含まれています。画像には小麦の穂のバウンディングボックスがラベル付けされており、オブジェクト検出モデルをトレーニングするためのグラウンドトゥルースを提供します。
- テストセット:このサブセットは、オーストラリア、日本、中国からの約1,000枚の画像で構成されています。これらの画像は、トレーニングされたモデルの、未知の遺伝子型、環境、および観察条件に対するパフォーマンスを評価するために使用されます。
アプリケーション
Global Wheat Head Datasetは、小麦の穂の検出タスクにおける深層学習モデルのトレーニングと評価に広く使用されています。データセットの多様な画像セットは、幅広い外観、環境、および条件を捉えており、植物フェノタイピングおよび作物管理の分野の研究者や実務家にとって貴重なリソースとなっています。
データセット YAML
YAML(Yet Another Markup Language)ファイルは、データセットの構成を定義するために使用されます。これには、データセットのパス、クラス、およびその他の関連情報が含まれています。Global Wheat Head Datasetの場合、 GlobalWheat2020.yaml
fileは以下で管理されています: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from pathlib import Path
from ultralytics.utils.downloads import download
# Download
dir = Path(yaml["path"]) # dataset root dir
urls = [
"https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
"https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
]
download(urls, dir=dir)
# Make Directories
for p in "annotations", "images", "labels":
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in (
"arvalis_1",
"arvalis_2",
"arvalis_3",
"ethz_1",
"rres_1",
"inrae_1",
"usask_1",
"utokyo_1",
"utokyo_2",
"nau_1",
"uq_1",
):
(dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p) # move to /images
f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json") # json file
if f.exists():
f.rename((dir / "annotations" / p).with_suffix(".json")) # move to /annotations
使用法
画像サイズ640でGlobal Wheat Head Dataset上でYOLO11nモデルを100エポックトレーニングするには、次のコードスニペットを使用します。使用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640
サンプルデータとアノテーション
Global Wheat Head Datasetには、小麦の穂の外観、環境、状態の自然な変動を捉えた、多様な屋外フィールド画像が含まれています。以下は、データセットからのデータと、それに対応するアノテーションの例です。
- 小麦の穂の検出: この画像は、小麦の穂の検出の例を示しており、小麦の穂はバウンディングボックスでアノテーションされています。このデータセットは、このタスクのモデル開発を促進するために、さまざまな画像を提供します。
この例では、Global Wheat Head Dataset内のデータの多様性と複雑さを紹介し、コムギのフェノタイピングおよび作物管理における正確なコムギ穂検出の重要性を強調しています。
引用と謝辞
Global Wheat Head Dataset を研究または開発で使用する場合は、次の論文を引用してください。
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
植物の表現型解析および作物管理の研究コミュニティにとって貴重なリソースであるGlobal Wheat Head Datasetの作成と管理に貢献した研究者および研究機関に感謝いたします。データセットとその作成者の詳細については、Global Wheat Head DatasetのWebサイトをご覧ください。
よくある質問
Global Wheat Head Datasetは何に使用されますか?
Global Wheat Head Datasetは、主に小麦の穂の検出を目的とした深層学習モデルの開発およびトレーニングに使用されます。これは、小麦のフェノタイピングおよび作物管理におけるアプリケーションにとって非常に重要であり、小麦の穂の密度、サイズ、および全体的な収量ポテンシャルのより正確な推定を可能にします。正確な検出方法は、効率的な作物管理に不可欠な、作物の健康状態と成熟度を評価するのに役立ちます。
Global Wheat Head データセットで YOLO11n モデルをトレーニングするにはどうすればよいですか?
Global Wheat Head Dataset上でYOLO11nモデルをトレーニングするには、次のコードスニペットを使用します。必ず GlobalWheat2020.yaml
データセットのパスとクラスを指定する構成ファイル:
学習の例
from ultralytics import YOLO
# Load a pre-trained model (recommended for training)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640
利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
Global Wheat Head Datasetの主な特徴は何ですか?
Global Wheat Head Datasetの主な特徴:
- ヨーロッパ(フランス、イギリス、スイス)と北米(カナダ)からの3,000枚以上のトレーニング画像。
- オーストラリア、日本、中国からの約1,000枚のテスト画像。
- 生育環境の違いにより、小麦の穂の外観に大きなばらつきがあります。
- 物体検出モデルを支援するための小麦の穂のバウンディングボックスによる詳細なアノテーション。
これらの機能は、複数の地域にわたって汎化できる堅牢なモデルの開発を促進します。
Global Wheat Head Datasetの構成YAMLファイルはどこにありますか?
Global Wheat Head Datasetの構成YAMLファイルの名前は GlobalWheat2020.yaml
はGitHubで入手できます。こちらからアクセスできます: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yamlこのファイルには、データセットのパス、クラス、およびYOLOでのモデルトレーニングに必要なその他の構成に関する必要な情報が含まれています。 Ultralytics YOLO.
作物管理において、小麦の穂の検出が重要なのはなぜですか?
小麦の穂の検出は、小麦の穂の密度とサイズを正確に推定できるため、作物管理において非常に重要です。これらは、作物の健全性、成熟度、および収量 potential を評価するために不可欠です。Global Wheat Head Datasetのようなデータセットでトレーニングされた深層学習モデルを活用することにより、農家や研究者は作物をより適切に監視および管理し、農業慣行における生産性の向上とリソースの最適化につながります。この技術の進歩は、持続可能な農業と食料安全保障の取り組みをサポートします。
農業における AI の応用に関する詳細については、AI in Agricultureをご覧ください。