Bộ dữ liệu Global Wheat Head

Global Wheat Head Dataset là một bộ sưu tập hình ảnh được thiết kế để hỗ trợ phát triển các model phát hiện bông lúa chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng. Bông lúa, còn được gọi là gié lúa, là các phần mang hạt của cây lúa mì. Việc ước tính chính xác mật độ và kích thước bông lúa là rất cần thiết để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bộ dữ liệu này, được tạo ra từ sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao phủ nhiều vùng canh tác khác nhau để đảm bảo các model có khả năng tổng quát hóa tốt trên nhiều môi trường khác nhau.

Các tính năng chính

  • Bộ dữ liệu chứa hơn 3.000 hình ảnh huấn luyện từ Châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
  • Bộ dữ liệu bao gồm khoảng 1.000 hình ảnh kiểm thử từ Úc, Nhật Bản và Trung Quốc.
  • Hình ảnh là các hình ảnh thực địa ngoài trời, ghi lại sự biến đổi tự nhiên về hình dáng của bông lúa.
  • Các chú thích bao gồm bbox bông lúa để hỗ trợ các tác vụ object detection.

Cấu trúc tập dữ liệu

Global Wheat Head Dataset được tổ chức thành hai tập hợp con chính:

  1. Training Set: Tập hợp con này chứa hơn 3.000 hình ảnh từ Châu Âu và Bắc Mỹ. Các hình ảnh được dán nhãn với bbox bông lúa, cung cấp dữ liệu thực tế (ground truth) để huấn luyện các model object detection.
  2. Test Set: Tập hợp con này bao gồm khoảng 1.000 hình ảnh từ Úc, Nhật Bản và Trung Quốc. Những hình ảnh này được sử dụng để đánh giá hiệu suất của các model đã được huấn luyện trên các kiểu gen, môi trường và điều kiện quan sát chưa từng thấy trước đó.

Ứng dụng

Global Wheat Head Dataset được sử dụng rộng rãi để huấn luyện và đánh giá các model deep learning trong các tác vụ phát hiện bông lúa. Tập hợp hình ảnh đa dạng của bộ dữ liệu, ghi lại nhiều hình dáng, môi trường và điều kiện khác nhau, tạo nên một nguồn tài nguyên quý giá cho các nhà nghiên cứu và thực nghiệm trong lĩnh vực plant phenotyping và quản lý cây trồng.

Dataset YAML

Một tệp YAML được sử dụng để định nghĩa cấu hình bộ dữ liệu. Nó chứa thông tin về đường dẫn, các class và các thông tin liên quan khác của bộ dữ liệu. Đối với trường hợp Global Wheat Head Dataset, tệp GlobalWheat2020.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Cách sử dụng

Để huấn luyện model YOLO26n trên Global Wheat Head Dataset trong 100 epochs với kích thước ảnh 640, bạn có thể sử dụng các đoạn code sau. Để có danh sách đầy đủ các đối số, hãy tham khảo trang Training của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Dữ liệu mẫu và Chú thích

Global Wheat Head Dataset chứa một tập hợp đa dạng các hình ảnh thực địa ngoài trời, ghi lại sự biến đổi tự nhiên về hình dáng, môi trường và điều kiện của bông lúa. Dưới đây là một số ví dụ về dữ liệu từ bộ dữ liệu, cùng với các chú thích tương ứng:

Mẫu Global Wheat Dataset hiển thị phát hiện bông lúa

  • Wheat Head Detection: Hình ảnh này minh họa một ví dụ về phát hiện bông lúa, trong đó các bông lúa được chú thích bằng bbox. Bộ dữ liệu cung cấp nhiều loại hình ảnh để hỗ trợ việc phát triển các model cho tác vụ này.

Ví dụ này cho thấy sự đa dạng và phức tạp của dữ liệu trong Global Wheat Head Dataset và làm nổi bật tầm quan trọng của việc phát hiện bông lúa chính xác cho các ứng dụng trong lĩnh vực kiểu hình lúa mì và quản lý cây trồng.

Trích dẫn và Ghi nhận

Nếu bạn sử dụng Global Wheat Head Dataset trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Chúng tôi muốn gửi lời cảm ơn đến các nhà nghiên cứu và các tổ chức đã đóng góp vào việc tạo lập và duy trì Global Wheat Head Dataset như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu về kiểu hình thực vật và quản lý cây trồng. Để biết thêm thông tin về bộ dữ liệu và những người tạo ra nó, hãy truy cập trang web Global Wheat Head Dataset.

Câu hỏi thường gặp (FAQ)

Global Wheat Head Dataset được sử dụng để làm gì?

Global Wheat Head Dataset chủ yếu được sử dụng để phát triển và huấn luyện các model deep learning nhằm mục đích phát hiện bông lúa. Điều này rất quan trọng cho các ứng dụng trong wheat phenotyping và quản lý cây trồng, cho phép ước tính chính xác hơn mật độ, kích thước bông lúa và tiềm năng năng suất tổng thể của cây trồng. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và độ chín của cây trồng, điều cần thiết cho việc quản lý cây trồng hiệu quả.

Làm thế nào để tôi huấn luyện model YOLO26n trên Global Wheat Head Dataset?

Để huấn luyện model YOLO26n trên Global Wheat Head Dataset, bạn có thể sử dụng các đoạn code sau. Đảm bảo rằng bạn có tệp cấu hình GlobalWheat2020.yaml chỉ định các đường dẫn bộ dữ liệu và các class:

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Để có danh sách đầy đủ các đối số, hãy tham khảo trang Training của model.

Các tính năng chính của Global Wheat Head Dataset là gì?

Các tính năng chính của Global Wheat Head Dataset bao gồm:

  • Hơn 3.000 hình ảnh huấn luyện từ Châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
  • Khoảng 1.000 hình ảnh kiểm thử từ Úc, Nhật Bản và Trung Quốc.
  • Độ biến thiên cao về hình dáng bông lúa do các môi trường canh tác khác nhau.
  • Chú thích chi tiết với bbox bông lúa để hỗ trợ các model object detection.

Những tính năng này tạo điều kiện thuận lợi cho việc phát triển các model mạnh mẽ có khả năng tổng quát hóa trên nhiều khu vực khác nhau.

Tôi có thể tìm tệp YAML cấu hình cho Global Wheat Head Dataset ở đâu?

Tệp YAML cấu hình cho Global Wheat Head Dataset, có tên GlobalWheat2020.yaml, có sẵn trên GitHub. Bạn có thể truy cập tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Tệp này chứa thông tin cần thiết về đường dẫn bộ dữ liệu, các class và các chi tiết cấu hình khác cần thiết cho việc huấn luyện model trong Ultralytics YOLO.

Tại sao phát hiện bông lúa lại quan trọng trong quản lý cây trồng?

Phát hiện bông lúa là yếu tố then chốt trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước bông lúa, những yếu tố cần thiết để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bằng cách tận dụng các deep learning models được huấn luyện trên các bộ dữ liệu như Global Wheat Head Dataset, nông dân và các nhà nghiên cứu có thể giám sát và quản lý cây trồng tốt hơn, dẫn đến tăng năng suất và tối ưu hóa việc sử dụng tài nguyên trong thực tiễn canh tác. Sự tiến bộ công nghệ này hỗ trợ các sáng kiến về sustainable agriculture và an ninh lương thực.

Để biết thêm thông tin về các ứng dụng của AI trong nông nghiệp, hãy truy cập AI in Agriculture.

Bình luận