Bỏ để qua phần nội dung

Bộ dữ liệu đầu lúa mì toàn cầu

Bộ dữ liệu đầu lúa mì toàn cầu là một tập hợp các hình ảnh được thiết kế để hỗ trợ phát triển các mô hình phát hiện đầu lúa mì chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng. Đầu lúa mì, còn được gọi là gai, là bộ phận mang hạt của cây lúa mì. Ước tính chính xác mật độ và kích thước đầu lúa mì là điều cần thiết để đánh giá sức khỏe, sự trưởng thành và tiềm năng năng suất của cây trồng. Bộ dữ liệu, được tạo ra bởi sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao gồm nhiều khu vực đang phát triển để đảm bảo các mô hình khái quát hóa tốt trên các môi trường khác nhau.

Các tính năng chính

  • Bộ dữ liệu chứa hơn 3.000 hình ảnh đào tạo từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
  • Nó bao gồm khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
  • Hình ảnh là hình ảnh thực địa ngoài trời, ghi lại sự thay đổi tự nhiên trong sự xuất hiện của đầu lúa mì.
  • Chú thích bao gồm các hộp giới hạn đầu lúa mì để hỗ trợ các tác vụ phát hiện đối tượng.

Cấu trúc tập dữ liệu

Bộ dữ liệu đầu lúa mì toàn cầu được tổ chức thành hai tập hợp con chính:

  1. Bộ đào tạo: Tập hợp con này chứa hơn 3.000 hình ảnh từ Châu Âu và Bắc Mỹ. Các hình ảnh được dán nhãn với các hộp giới hạn đầu lúa mì, cung cấp sự thật cơ bản cho các mô hình phát hiện đối tượng huấn luyện.
  2. Bộ thử nghiệm: Tập hợp con này bao gồm khoảng 1.000 hình ảnh từ Úc, Nhật Bản và Trung Quốc. Những hình ảnh này được sử dụng để đánh giá hiệu suất của các mô hình được đào tạo trên các kiểu gen, môi trường và điều kiện quan sát không nhìn thấy.

Ứng dụng

Bộ dữ liệu đầu lúa mì toàn cầu được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các nhiệm vụ phát hiện đầu lúa mì. Bộ hình ảnh đa dạng của bộ dữ liệu, ghi lại một loạt các hình thức, môi trường và điều kiện, làm cho nó trở thành một nguồn tài nguyên quý giá cho các nhà nghiên cứu và các học viên trong lĩnh vực kiểu hình thực vật và quản lý cây trồng.

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, lớp và thông tin liên quan khác của tập dữ liệu. Đối với trường hợp của Bộ dữ liệu đầu lúa mì toàn cầu, GlobalWheat2020.yaml Tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

Sử dụng

Để đào tạo một YOLOv8n mô hình trên Tập dữ liệu đầu lúa mì toàn cầu cho 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Dữ liệu mẫu và chú thích

Bộ dữ liệu đầu lúa mì toàn cầu chứa một bộ hình ảnh cánh đồng ngoài trời đa dạng, ghi lại sự biến đổi tự nhiên về hình thức, môi trường và điều kiện của đầu lúa mì. Dưới đây là một số ví dụ về dữ liệu từ tập dữ liệu, cùng với các chú thích tương ứng của chúng:

Hình ảnh mẫu tập dữ liệu

  • Phát hiện đầu lúa mì: Hình ảnh này minh họa một ví dụ về phát hiện đầu lúa mì, trong đó đầu lúa mì được chú thích bằng các hộp giới hạn. Bộ dữ liệu cung cấp nhiều hình ảnh khác nhau để tạo điều kiện phát triển các mô hình cho nhiệm vụ này.

Ví dụ này cho thấy sự đa dạng và phức tạp của dữ liệu trong Bộ dữ liệu đầu lúa mì toàn cầu và nhấn mạnh tầm quan trọng của việc phát hiện đầu lúa mì chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng.

Trích dẫn và xác nhận

Nếu bạn sử dụng Bộ dữ liệu đầu lúa mì toàn cầu trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Chúng tôi muốn ghi nhận các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo ra và duy trì Bộ dữ liệu đầu lúa mì toàn cầu như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu quản lý cây trồng và kiểu hình cây trồng. Để biết thêm thông tin về tập dữ liệu và người tạo ra nó, hãy truy cập trang web Tập dữ liệu đầu lúa mì toàn cầu.

FAQ

Bộ dữ liệu đầu lúa mì toàn cầu được sử dụng để làm gì?

Bộ dữ liệu đầu lúa mì toàn cầu chủ yếu được sử dụng để phát triển và đào tạo các mô hình học sâu nhằm phát hiện đầu lúa mì. Điều này rất quan trọng đối với các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng, cho phép ước tính chính xác hơn về mật độ, kích thước và tiềm năng năng suất cây trồng tổng thể. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và sự trưởng thành của cây trồng, điều cần thiết để quản lý cây trồng hiệu quả.

Làm cách nào để đào tạo một YOLOv8n mô hình trên Bộ dữ liệu đầu lúa mì toàn cầu?

Để đào tạo một YOLOv8n mô hình trên Tập dữ liệu đầu lúa mì toàn cầu, bạn có thể sử dụng các đoạn mã sau. Hãy chắc chắn rằng bạn có GlobalWheat2020.yaml Tệp cấu hình chỉ định đường dẫn và lớp tập dữ liệu:

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a pre-trained model (recommended for training)
model = YOLO("yolov8n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolov8n.pt epochs=100 imgsz=640

Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Các tính năng chính của Bộ dữ liệu đầu lúa mì toàn cầu là gì?

Các tính năng chính của Bộ dữ liệu đầu lúa mì toàn cầu bao gồm:

  • Hơn 3.000 hình ảnh đào tạo từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
  • Khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
  • Sự thay đổi cao trong sự xuất hiện của đầu lúa mì do môi trường phát triển khác nhau.
  • Chú thích chi tiết với các hộp giới hạn đầu lúa mì để hỗ trợ các mô hình phát hiện đối tượng.

Những tính năng này tạo điều kiện cho sự phát triển của các mô hình mạnh mẽ có khả năng khái quát hóa trên nhiều khu vực.

Tôi có thể tìm tệp YAML cấu hình cho Tập dữ liệu đầu lúa mì toàn cầu ở đâu?

Tệp YAML cấu hình cho Tập dữ liệu đầu lúa mì toàn cầu, được đặt tên GlobalWheat2020.yaml, có sẵn trên GitHub. Bạn có thể truy cập nó tại đây liên kết. Tệp này chứa thông tin cần thiết về đường dẫn tập dữ liệu, lớp và các chi tiết cấu hình khác cần thiết cho việc đào tạo mô hình trong Ultralytics YOLO.

Tại sao phát hiện đầu lúa mì lại quan trọng trong quản lý cây trồng?

Phát hiện đầu lúa mì rất quan trọng trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước đầu lúa mì, điều này rất cần thiết để đánh giá sức khỏe, sự trưởng thành và tiềm năng năng suất của cây trồng. Bằng cách tận dụng các mô hình học sâu được đào tạo trên các bộ dữ liệu như Bộ dữ liệu đầu lúa mì toàn cầu, nông dân và nhà nghiên cứu có thể giám sát và quản lý cây trồng tốt hơn, dẫn đến cải thiện năng suất và tối ưu hóa việc sử dụng tài nguyên trong thực hành nông nghiệp. Tiến bộ công nghệ này hỗ trợ các sáng kiến nông nghiệp bền vững và an ninh lương thực.

Để biết thêm thông tin về các ứng dụng của AI trong nông nghiệp, hãy truy cập AI trong Nông nghiệp.



Đã tạo 2023-11-12, Cập nhật 2024-07-04
Tác giả: glenn-jocher (7), Laughing-q (1)

Ý kiến