コンテンツへスキップ

世界の小麦頭データセット

Global Wheat Head Datasetは、小麦の表現型判定や作物管理に応用するための、正確な小麦の頭部検出モデルの開発をサポートするために設計された画像コレクションです。小麦の頭部は、スパイクとしても知られ、小麦植物の穀粒をつける部分です。小麦の頭部の密度と大きさを正確に推定することは、作物の健全性、成熟度、収量の可能性を評価するために不可欠である。このデータセットは、7カ国の9つの研究機関の共同研究によって作成されたもので、モデルが異なる環境でもうまく一般化できるように、複数の栽培地域をカバーしている。

主な特徴

  • このデータセットには、ヨーロッパ(フランス、イギリス、スイス)と北米(カナダ)の3,000枚以上のトレーニング画像が含まれている。
  • オーストラリア、日本、中国で撮影された約1,000枚のテスト画像が収録されている。
  • 画像は屋外のフィールド画像で、小麦の頭の外観の自然なばらつきを捉えている。
  • 注釈は、オブジェクト検出タスクをサポートするための小麦の頭のバウンディングボックスを含む。

データセット構造

Global Wheat Head Datasetは2つのサブセットに分かれている:

  1. トレーニングセット:このサブセットには、ヨーロッパと北米の3,000枚以上の画像が含まれている。画像には小麦の頭部のバウンディングボックスがラベル付けされており、物体検出モデルのトレーニングのためのグランドトゥルースとなる。
  2. テストセット:このサブセットは、オーストラリア、日本、中国の画像約1,000枚から構成される。これらの画像は、未知の遺伝子型、環境、観察条件に対する学習済みモデルの性能を評価するために使用される。

アプリケーション

Global Wheat Head Datasetは、小麦の頭部検出タスクにおけるディープラーニングモデルのトレーニングと評価に広く使用されています。このデータセットの多様な画像セットは、幅広い外観、環境、条件を捉えており、植物表現型や作物管理の分野の研究者や実務家にとって貴重なリソースとなっている。

データセット YAML

YAML (Yet Another Markup Language) ファイルはデータセットの設定を定義するために使われる。このファイルには、データセットのパス、クラス、その他の関連情報が含まれている。Global Wheat Head Datasetの場合は GlobalWheat2020.yaml ファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

使用方法

Global Wheat Head DatasetのYOLOv8n モデルを、画像サイズ640で100エポック学習させるには、以下のコード・スニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

サンプルデータと注釈

Global Wheat Head Datasetには、小麦の頭部の外観、環境、条件における自然なばらつきを捉えた、屋外のフィールド画像の多様なセットが含まれています。このデータセットに含まれるデータの例を、対応するアノテーションとともに紹介します:

データセットサンプル画像

  • 小麦の頭の検出:この画像は小麦の頭部検出の例を示しており、小麦の頭部はバウンディングボックスで注釈されている。データセットは、このタスクのモデル開発を容易にするために、様々な画像を提供する。

この例は、Global Wheat Head Datasetに含まれるデータの多様性と複雑性を示し、小麦の表現型解析や作物管理への応用における、正確な小麦の頭部検出の重要性を強調している。

引用と謝辞

研究開発においてGlobal Wheat Head Datasetを使用する場合は、以下の論文を引用してください:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

植物表現型解析および作物管理研究コミュニティの貴重なリソースとして、Global Wheat Head Datasetの作成と維持にご協力いただいた研究者および研究機関に感謝いたします。データセットとその作成者についての詳細は、Global Wheat Head Datasetのウェブサイトをご覧ください。

よくあるご質問

グローバル小麦ヘッド・データセットは何に使われるのか?

Global Wheat Head Datasetは、主に小麦の頭部検出を目的としたディープラーニングモデルの開発とトレーニングに使用される。これは、小麦の表現型分類と作物管理におけるアプリケーションにとって極めて重要であり、小麦の頭部密度、サイズ、および作物全体の潜在収量をより正確に推定することを可能にする。正確な検出方法は、効率的な作物管理に不可欠な作物の健全性と成熟度の評価に役立ちます。

Global Wheat Head DatasetでYOLOv8n モデルをトレーニングするには?

Global Wheat Head DatasetでYOLOv8n モデルを学習するには、以下のコード・スニペットを使用できます。必ず GlobalWheat2020.yaml データセットのパスとクラスを指定する設定ファイル:

列車の例

from ultralytics import YOLO

# Load a pre-trained model (recommended for training)
model = YOLO("yolov8n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

世界の小麦頭データセットの主な特徴は?

世界小麦頭データセットの主な特徴は以下の通り:

  • ヨーロッパ(フランス、イギリス、スイス)と北米(カナダ)の3,000以上のトレーニング画像。
  • オーストラリア、日本、中国で撮影された約1,000枚のテスト画像。
  • 生育環境の違いによる小麦の頭部外観のばらつきが大きい。
  • 物体検出モデルを支援するための、小麦の頭部のバウンディングボックスによる詳細な注釈。

これらの特徴により、複数の領域にまたがる汎化が可能なロバストモデルの開発が容易になる。

Global Wheat Head Datasetの設定YAMLファイルはどこにありますか?

Global Wheat Head DatasetのコンフィギュレーションYAMLファイル。 GlobalWheat2020.yamlをGitHubで公開している。こちらからアクセスできる。 リンク.このファイルには,Ultralytics YOLO のモデル学習に必要なデータセットパス,クラス,その他の設定詳細に関する必要な情報が含まれています.

なぜ小麦の頭部検出が作物管理で重要なのか?

小麦の頭部検出は、作物の健全性、成熟度、収量の可能性を評価するために不可欠な、小麦の頭部の密度とサイズを正確に推定できるため、作物管理において非常に重要である。Global Wheat Head Datasetのようなデータセットで訓練されたディープラーニングモデルを活用することで、農家や研究者は作物をよりよく監視・管理できるようになり、農業実践における生産性の向上と資源利用の最適化につながります。この技術的進歩は、持続可能な農業と食料安全保障の取り組みを支援する。

農業におけるAIの応用についての詳細は、農業におけるAIをご覧ください。



作成日:2023-11-12 更新日:2024-07-04
作成者:glenn-jocher(7),Laughing-q(1)

コメント