コンテンツへスキップ

世界の小麦頭データセット

Global Wheat Head Datasetは、小麦の表現型判定や作物管理に応用するための、正確な小麦の頭部検出モデルの開発をサポートするために設計された画像コレクションです。小麦の頭部は、スパイクとしても知られ、小麦植物の穀粒をつける部分です。小麦の頭部の密度と大きさを正確に推定することは、作物の健全性、成熟度、収量の可能性を評価するために不可欠である。このデータセットは、7カ国の9つの研究機関の共同研究によって作成されたもので、モデルが異なる環境でもうまく一般化できるように、複数の栽培地域をカバーしている。

主な特徴

  • このデータセットには、ヨーロッパ(フランス、イギリス、スイス)と北米(カナダ)の3,000枚以上のトレーニング画像が含まれている。
  • オーストラリア、日本、中国で撮影された約1,000枚のテスト画像が収録されている。
  • 画像は屋外のフィールド画像で、小麦の頭の外観の自然なばらつきを捉えている。
  • 注釈は、オブジェクト検出タスクをサポートするための小麦の頭のバウンディングボックスを含む。

データセット構造

Global Wheat Head Datasetは2つのサブセットに分かれている:

  1. トレーニングセット:このサブセットには、ヨーロッパと北米の3,000枚以上の画像が含まれている。画像には小麦の頭部のバウンディングボックスがラベル付けされており、物体検出モデルのトレーニングのためのグランドトゥルースとなる。
  2. テストセット:このサブセットは、オーストラリア、日本、中国の画像約1,000枚から構成される。これらの画像は、未知の遺伝子型、環境、観察条件に対する学習済みモデルの性能を評価するために使用される。

アプリケーション

Global Wheat Head Datasetは、小麦の頭部検出タスクにおけるディープラーニングモデルのトレーニングと評価に広く使用されています。このデータセットの多様な画像セットは、幅広い外観、環境、条件を捉えており、植物表現型や作物管理の分野の研究者や実務家にとって貴重なリソースとなっている。

データセット YAML

YAML (Yet Another Markup Language) ファイルはデータセットの設定を定義するために使われる。このファイルには、データセットのパス、クラス、その他の関連情報が含まれている。Global Wheat Head Datasetの場合は GlobalWheat2020.yaml ファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

使用方法

Global Wheat Head DatasetのYOLOv8n モデルを、画像サイズ640で100エポック学習させるには、以下のコード・スニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

サンプルデータと注釈

Global Wheat Head Datasetには、小麦の頭部の外観、環境、条件における自然なばらつきを捉えた、屋外のフィールド画像の多様なセットが含まれています。このデータセットに含まれるデータの例を、対応するアノテーションとともに紹介します:

データセットサンプル画像

  • 小麦の頭の検出:この画像は小麦の頭部検出の例を示しており、小麦の頭部はバウンディングボックスで注釈されている。データセットは、このタスクのモデル開発を容易にするために、様々な画像を提供する。

この例は、Global Wheat Head Datasetに含まれるデータの多様性と複雑性を示し、小麦の表現型解析や作物管理への応用における、正確な小麦の頭部検出の重要性を強調している。

引用と謝辞

研究開発においてGlobal Wheat Head Datasetを使用する場合は、以下の論文を引用してください:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

植物表現型解析および作物管理研究コミュニティの貴重なリソースとして、Global Wheat Head Datasetの作成と維持にご協力いただいた研究者および研究機関に感謝いたします。データセットとその作成者についての詳細は、Global Wheat Head Datasetのウェブサイトをご覧ください。



作成日:2023-11-12 更新日:2024-01-12
作成者:glenn-jocher(4),Laughing-q(1)

コメント