Bỏ để qua phần nội dung

Bộ dữ liệu đầu lúa mì toàn cầu

Bộ dữ liệu đầu lúa mì toàn cầu là một tập hợp các hình ảnh được thiết kế để hỗ trợ phát triển các mô hình phát hiện đầu lúa mì chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng. Đầu lúa mì, còn được gọi là gai, là bộ phận mang hạt của cây lúa mì. Ước tính chính xác mật độ và kích thước đầu lúa mì là điều cần thiết để đánh giá sức khỏe, sự trưởng thành và tiềm năng năng suất của cây trồng. Bộ dữ liệu, được tạo ra bởi sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao gồm nhiều khu vực đang phát triển để đảm bảo các mô hình khái quát hóa tốt trên các môi trường khác nhau.

Các tính năng chính

  • Bộ dữ liệu chứa hơn 3.000 hình ảnh đào tạo từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
  • Nó bao gồm khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
  • Hình ảnh là hình ảnh thực địa ngoài trời, ghi lại sự thay đổi tự nhiên trong sự xuất hiện của đầu lúa mì.
  • Chú thích bao gồm các hộp giới hạn đầu lúa mì để hỗ trợ các tác vụ phát hiện đối tượng.

Cấu trúc tập dữ liệu

Bộ dữ liệu đầu lúa mì toàn cầu được tổ chức thành hai tập hợp con chính:

  1. Bộ đào tạo: Tập hợp con này chứa hơn 3.000 hình ảnh từ Châu Âu và Bắc Mỹ. Các hình ảnh được dán nhãn với các hộp giới hạn đầu lúa mì, cung cấp sự thật cơ bản cho các mô hình phát hiện đối tượng huấn luyện.
  2. Bộ thử nghiệm: Tập hợp con này bao gồm khoảng 1.000 hình ảnh từ Úc, Nhật Bản và Trung Quốc. Những hình ảnh này được sử dụng để đánh giá hiệu suất của các mô hình được đào tạo trên các kiểu gen, môi trường và điều kiện quan sát không nhìn thấy.

Ứng dụng

Bộ dữ liệu đầu lúa mì toàn cầu được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các nhiệm vụ phát hiện đầu lúa mì. Bộ hình ảnh đa dạng của bộ dữ liệu, ghi lại một loạt các hình thức, môi trường và điều kiện, làm cho nó trở thành một nguồn tài nguyên quý giá cho các nhà nghiên cứu và các học viên trong lĩnh vực kiểu hình thực vật và quản lý cây trồng.

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, lớp và thông tin liên quan khác của tập dữ liệu. Đối với trường hợp của Bộ dữ liệu đầu lúa mì toàn cầu, GlobalWheat2020.yaml Tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/yolov5/releases/download/v1.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Sử dụng

Để đào tạo một YOLOv8n mô hình trên Tập dữ liệu đầu lúa mì toàn cầu cho 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='GlobalWheat2020.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Dữ liệu mẫu và chú thích

Bộ dữ liệu đầu lúa mì toàn cầu chứa một bộ hình ảnh cánh đồng ngoài trời đa dạng, ghi lại sự biến đổi tự nhiên về hình thức, môi trường và điều kiện của đầu lúa mì. Dưới đây là một số ví dụ về dữ liệu từ tập dữ liệu, cùng với các chú thích tương ứng của chúng:

Hình ảnh mẫu tập dữ liệu

  • Phát hiện đầu lúa mì: Hình ảnh này minh họa một ví dụ về phát hiện đầu lúa mì, trong đó đầu lúa mì được chú thích bằng các hộp giới hạn. Bộ dữ liệu cung cấp nhiều hình ảnh khác nhau để tạo điều kiện phát triển các mô hình cho nhiệm vụ này.

Ví dụ này cho thấy sự đa dạng và phức tạp của dữ liệu trong Bộ dữ liệu đầu lúa mì toàn cầu và nhấn mạnh tầm quan trọng của việc phát hiện đầu lúa mì chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng.

Trích dẫn và xác nhận

Nếu bạn sử dụng Bộ dữ liệu đầu lúa mì toàn cầu trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Chúng tôi muốn ghi nhận các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo ra và duy trì Bộ dữ liệu đầu lúa mì toàn cầu như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu quản lý cây trồng và kiểu hình cây trồng. Để biết thêm thông tin về tập dữ liệu và người tạo ra nó, hãy truy cập trang web Tập dữ liệu đầu lúa mì toàn cầu.



Đã tạo 2023-11-12, Cập nhật 2024-01-12
Tác giả: glenn-jocher (4), Laughing-q (1)

Ý kiến