Global Wheat Head Dataset

The Global Wheat Head Dataset は、小麦の表現型解析や作物管理のアプリケーションに向けた、高精度な小麦の穂の検出モデルの開発を支援するために設計された画像コレクションです。「スパイク」とも呼ばれる小麦の穂は、小麦の穀物を含む部分です。小麦の穂の密度とサイズの正確な推定は、作物の健康状態、成熟度、収穫の可能性を評価するために不可欠です。7か国の9つの研究機関の協力によって作成されたこのデータセットは、モデルが異なる環境間で汎化性能を維持できるよう、複数の生育地域をカバーしています。

主な特徴

  • このデータセットには、ヨーロッパ(フランス、イギリス、スイス)および北米(カナダ)から提供された3,000枚以上のトレーニング画像が含まれています。
  • これには、オーストラリア、日本、中国からの約1,000枚のテスト画像が含まれています。
  • 画像は屋外の圃場で撮影されたものであり、小麦の穂の見た目における自然な多様性を捉えています。
  • アノテーションには、物体検出 タスクをサポートするための小麦の穂のバウンディングボックスが含まれています。

データセットの構造

Global Wheat Head Dataset は、主に2つのサブセットで構成されています。

  1. トレーニングセット: このサブセットには、ヨーロッパおよび北米からの3,000枚以上の画像が含まれています。画像には小麦の穂のバウンディングボックスがラベル付けされており、物体検出モデルのトレーニングのための正解データを提供します。
  2. テストセット: このサブセットは、オーストラリア、日本、および中国からの約1,000枚の画像で構成されています。これらの画像は、未知の遺伝子型、環境、および観測条件下での学習済みモデルのパフォーマンスを評価するために使用されます。

アプリケーション

Global Wheat Head Dataset は、小麦の穂の検出タスクにおける ディープラーニング モデルのトレーニングと評価に広く使用されています。多様な見た目、環境、条件を捉えたこのデータセットの豊富な画像群は、植物表現型解析 や作物管理の分野の研究者や実務者にとって貴重なリソースとなっています。

データセットYAML

データセットの設定を定義するためにYAML (Yet Another Markup Language) ファイルが使用されます。これには、データセットのパス、クラス、およびその他の関連情報が含まれています。Global Wheat Head Dataset の場合、GlobalWheat2020.yaml ファイルが https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml で管理されています。

ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

使用方法

Global Wheat Head Dataset 上で画像サイズ640を使用してYOLO26nモデルを100 エポック トレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細リストについては、モデルの トレーニング ページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

サンプルデータとアノテーション

Global Wheat Head Dataset には、小麦の穂の見た目、環境、および条件における自然な多様性を捉えた、多様な屋外圃場画像が含まれています。データセットからのデータの例と、それに対応するアノテーションを以下に示します。

Global Wheat dataset sample showing wheat head detection

  • 小麦の穂の検出: この画像は小麦の穂の検出例を示しており、小麦の穂がバウンディングボックスでアノテーションされています。データセットは、このタスクに向けたモデル開発を促進するためにさまざまな画像を提供します。

この例は、Global Wheat Head Dataset 内のデータの多様性と複雑さを示しており、小麦の表現型解析や作物管理のアプリケーションにおける正確な小麦の穂の検出の重要性を強調しています。

引用と謝辞

Global Wheat Head Dataset を研究や開発業務で使用する場合は、以下の論文を引用してください。

引用
@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

私たちは、植物表現型解析および作物管理の研究コミュニティにとって貴重なリソースである Global Wheat Head Dataset の作成と維持に貢献した研究者および機関に感謝の意を表します。データセットとその作成者に関する詳細については、Global Wheat Head Dataset ウェブサイト をご覧ください。

FAQ

Global Wheat Head Dataset は何に使用されますか?

Global Wheat Head Dataset は、主に小麦の穂の検出を目的としたディープラーニングモデルの開発とトレーニングに使用されます。これは、小麦の表現型解析 や作物管理のアプリケーションにおいて極めて重要であり、小麦の穂の密度、サイズ、および全体的な収穫の可能性をより正確に推定することを可能にします。正確な検出手法は作物の健康状態や成熟度の評価に役立ち、効率的な作物管理に不可欠です。

Global Wheat Head Dataset でYOLO26nモデルをトレーニングするにはどうすればよいですか?

Global Wheat Head Dataset でYOLO26nモデルをトレーニングするには、以下のコードスニペットを使用できます。データセットのパスとクラスを指定する GlobalWheat2020.yaml 設定ファイルがあることを確認してください。

トレーニングの例
from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

利用可能な引数の詳細リストについては、モデルの トレーニング ページを参照してください。

Global Wheat Head Dataset の主な特徴は何ですか?

Global Wheat Head Dataset の主な特徴は以下の通りです。

  • ヨーロッパ(フランス、イギリス、スイス)および北米(カナダ)から提供された3,000枚以上のトレーニング画像。
  • オーストラリア、日本、および中国からの約1,000枚のテスト画像。
  • 生育環境の違いによる、小麦の穂の見た目の高い変動性。
  • Detailed annotations with wheat head bounding boxes to aid object detection models.

これらの機能は、複数の地域にわたって汎用可能な堅牢なモデルの開発を促進します。

Global Wheat Head Dataset の設定YAMLファイルはどこで見つけられますか?

Global Wheat Head Dataset 用の設定YAMLファイルである GlobalWheat2020.yaml はGitHubで公開されています。アクセス先は https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml です。このファイルには、Ultralytics YOLO でのモデルトレーニングに必要な、データセットのパス、クラス、およびその他の設定の詳細が含まれています。

なぜ作物管理において小麦の穂の検出が重要なのでしょうか?

小麦の穂の検出は、作物の健康状態、成熟度、収穫の可能性を評価するために不可欠な、穂の密度とサイズの正確な推定を可能にするため、作物管理において極めて重要です。Global Wheat Head Dataset のようなデータセットでトレーニングされた ディープラーニングモデル を活用することで、農家や研究者は作物をより適切に監視および管理でき、生産性の向上や農業活動におけるリソース利用の最適化につながります。この技術革新は、持続可能な農業 と食料安全保障の取り組みをサポートします。

農業におけるAIの応用に関する詳細については、AI in Agriculture をご覧ください。

コメント