No license

Link to this sectionBộ dữ liệu Global Wheat Head Dataset#

Global Wheat Head Dataset (GWHD) là một tập dữ liệu object detection đơn lớp dùng để phát hiện wheat heads (bông lúa mì) — các nhánh mang hạt của cây lúa mì — trong các hình ảnh thực tế ngoài đồng. Tập dữ liệu này cung cấp 3.422 ảnh huấn luyện, 748 ảnh xác thực và 1.276 ảnh kiểm tra được thu thập từ nhiều vùng canh tác khác nhau, và được tạo ra bởi sự hợp tác của chín viện nghiên cứu từ bảy quốc gia để giúp các model có khả năng tổng quát hóa trên nhiều môi trường khác nhau. Việc phát hiện chính xác bông lúa mì là nền tảng cho các ước tính về mật độ bông, kích thước và tiềm năng năng suất trong plant phenotyping và quản lý cây trồng.

Link to this sectionTính năng chính#

Hình ảnh thực tế ngoài đồng nắm bắt sự biến đổi tự nhiên về hình dáng, ánh sáng và giai đoạn sinh trưởng của bông lúa mì.
Được xây dựng bởi chín viện nghiên cứu trên bảy quốc gia, bao gồm các vùng canh tác tại Châu Âu, Bắc Mỹ, Châu Á và Úc để đạt được khả năng tổng quát hóa mạnh mẽ giữa các môi trường.
Các chú thích BBox cho một lớp duy nhất, wheat_head, sẵn sàng cho các quy trình object detection và tracking.
Các hình ảnh kiểm tra đến từ các kiểu gen và vùng địa lý chưa từng xuất hiện trong quá trình huấn luyện, mang lại một chuẩn đánh giá tổng quát hóa thực sự.

Link to this sectionCấu trúc tập dữ liệu#

Global Wheat Head Dataset được tổ chức thành ba tập con được xác định bởi cấu hình GlobalWheat2020.yaml, tất cả đều được chú thích với một lớp duy nhất, wheat_head:

Split	Hình ảnh	Các vùng
Huấn luyện (Train)	3.422	Châu Âu (Pháp, Anh, Thụy Sĩ), Bắc Mỹ (Canada)
Validation	748	Thụy Sĩ (ETH Zürich)
Kiểm thử	1.276	Úc, Nhật Bản, Trung Quốc

Tập xác thực

Tập xác thực (748 hình ảnh) là tập con ethz_1, cũng là một phần của các miền huấn luyện — do đó các chỉ số xác thực phản ánh hiệu suất trong cùng miền. Tập kiểm tra tách biệt từ Úc, Nhật Bản và Trung Quốc đo lường khả năng tổng quát hóa đối với các môi trường chưa từng thấy trong quá trình huấn luyện.

Link to this sectionỨng dụng#

Global Wheat Head Dataset được sử dụng rộng rãi để huấn luyện và đánh giá các model deep learning cho nhiệm vụ phát hiện bông lúa mì. Hình ảnh đa dạng giữa các vùng, kiểu gen và điều kiện làm cho nó trở thành một tài nguyên quý giá cho plant phenotyping và quản lý cây trồng — hỗ trợ ước tính năng suất, theo dõi sức khỏe cây trồng và phân tích kiểu hình.

Để chú thích hình ảnh ngoài đồng, huấn luyện và quản lý các phiên bản tập dữ liệu trong trình duyệt, hãy chạy quy trình làm việc đầy đủ với Ultralytics Platform.

Link to this sectionYAML tập dữ liệu#

Tệp YAML được sử dụng để xác định cấu hình tập dữ liệu. Nó định nghĩa các đường dẫn, lớp và các chi tiết cấu hình khác của tập dữ liệu. Đối với Global Wheat Head Dataset, tệp GlobalWheat2020.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020 ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  urls = [
      "https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
      "https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
  ]
  download(urls, dir=dir)

  # Make Directories
  for p in "annotations", "images", "labels":
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in (
      "arvalis_1",
      "arvalis_2",
      "arvalis_3",
      "ethz_1",
      "rres_1",
      "inrae_1",
      "usask_1",
      "utokyo_1",
      "utokyo_2",
      "nau_1",
      "uq_1",
  ):
      (dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p)  # move to /images
      f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json")  # json file
      if f.exists():
          f.rename((dir / "annotations" / p).with_suffix(".json"))  # move to /annotations

Link to this sectionCách sử dụng#

Để huấn luyện model YOLO26n trên Global Wheat Head Dataset trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn code sau. Tập dữ liệu (~7.0 GB) sẽ tự động tải xuống trong lần sử dụng đầu tiên. Để có danh sách đầy đủ các đối số, hãy tham khảo trang Training của model.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Link to this sectionHình ảnh mẫu và chú thích#

Global Wheat Head Dataset chứa một tập hợp đa dạng các hình ảnh thực tế ngoài đồng, ghi lại sự biến đổi tự nhiên về hình dáng, môi trường và điều kiện của bông lúa mì. Dưới đây là một ví dụ hình ảnh từ tập dữ liệu, cùng với các chú thích tương ứng của nó:

Mẫu dữ liệu Global Wheat cho thấy khả năng phát hiện bông lúa

Wheat Head Detection: Các bông lúa mì được chú thích bằng BBox cho nhiệm vụ object detection, trong nhiều điều kiện đồng ruộng khác nhau phản ánh sự đa dạng và phức tạp của tập dữ liệu.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng Global Wheat Head Dataset trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn

@article{david2020global,
         title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
         author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
         journal={arXiv preprint arXiv:2005.02162},
         year={2020}
}

Chúng tôi muốn ghi nhận các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo và duy trì Global Wheat Head Dataset như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu về kiểu hình thực vật và quản lý cây trồng. Để biết thêm thông tin về bộ dữ liệu và những người tạo ra nó, hãy truy cập trang web Global Wheat Head Dataset.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionGlobal Wheat Head Dataset được sử dụng để làm gì?#

Global Wheat Head Dataset chủ yếu được sử dụng để phát triển và huấn luyện các model deep learning nhắm vào nhiệm vụ phát hiện bông lúa mì. Điều này rất quan trọng đối với các ứng dụng trong wheat phenotyping và quản lý cây trồng, cho phép ước tính chính xác hơn về mật độ bông lúa mì, kích thước và tiềm năng năng suất cây trồng tổng thể. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và độ chín của cây trồng, điều cần thiết cho việc quản lý cây trồng hiệu quả.

Link to this sectionGlobal Wheat Head Dataset có bao nhiêu hình ảnh và lớp?#

Global Wheat Head Dataset có một lớp duy nhất, wheat_head, và được chia thành ba tập con: 3.422 ảnh huấn luyện, 748 ảnh xác thực và 1.276 ảnh kiểm tra. Ảnh huấn luyện và xác thực đến từ Châu Âu và Bắc Mỹ, trong khi tập kiểm tra được lấy từ Úc, Nhật Bản và Trung Quốc để đánh giá khả năng tổng quát hóa với các môi trường chưa từng thấy.

Link to this sectionLàm thế nào để tôi huấn luyện model YOLO26n trên Global Wheat Head Dataset?#

Để huấn luyện model YOLO26n trên Global Wheat Head Dataset, bạn có thể sử dụng các đoạn mã sau. Hãy đảm bảo bạn có tệp cấu hình GlobalWheat2020.yaml chỉ định các đường dẫn bộ dữ liệu và các lớp:

Ví dụ về Training

from ultralytics import YOLO

# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)

Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.

Link to this sectionLàm thế nào để tải xuống Global Wheat Head Dataset?#

Tập dữ liệu (~7.0 GB) sẽ tự động tải xuống vào lần đầu tiên bạn huấn luyện với data="GlobalWheat2020.yaml" — không cần thực hiện bước thủ công nào. Ultralytics sẽ tìm nạp các hình ảnh và nhãn, sau đó giải nén chúng vào thư mục datasets cục bộ của bạn. Bạn có thể duyệt qua các tập dữ liệu liên quan trong detection datasets overview.

Link to this sectionTôi có thể tìm tệp YAML cấu hình cho Global Wheat Head Dataset ở đâu?#

Tệp YAML cấu hình cho Global Wheat Head Dataset, có tên GlobalWheat2020.yaml, hiện có sẵn trên GitHub. Bạn có thể truy cập tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Tệp này chứa các đường dẫn tập dữ liệu, các lớp và các chi tiết cấu hình khác cần thiết để huấn luyện model trong Ultralytics YOLO.

Link to this sectionTại sao việc phát hiện bông lúa lại quan trọng trong quản lý cây trồng?#

Phát hiện bông lúa mì rất quan trọng trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước của bông lúa mì, vốn là yếu tố thiết yếu để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bằng cách tận dụng các deep learning models được huấn luyện trên các tập dữ liệu như Global Wheat Head Dataset, nông dân và các nhà nghiên cứu có thể giám sát và quản lý cây trồng tốt hơn, dẫn đến năng suất cải thiện và tối ưu hóa việc sử dụng tài nguyên trong thực tiễn nông nghiệp. Sự tiến bộ công nghệ này hỗ trợ các sáng kiến sustainable agriculture và an ninh lương thực.

Để biết thêm thông tin về các ứng dụng của AI trong nông nghiệp, hãy truy cập AI in Agriculture.

Người đóng góp

GLglenn-jocher¹⁷ RAraimbekovm³ MImiles-deans-ultralytics¹ PDpderrenger¹ MAMatthewNoyce¹ RIRizwanMunawar¹

Đã tạo 12 thg 11, 2023Đã cập nhật 3 ngày trước