Link to this sectionBộ dữ liệu Global Wheat Head Dataset#
Global Wheat Head Dataset là tập hợp các hình ảnh được thiết kế để hỗ trợ phát triển các model phát hiện bông lúa chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng. Bông lúa, còn được gọi là gié lúa, là các bộ phận mang hạt của cây lúa mì. Việc ước tính chính xác mật độ và kích thước bông lúa là rất cần thiết để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bộ dữ liệu này, được tạo ra từ sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao gồm nhiều khu vực trồng trọt để đảm bảo các model có khả năng tổng quát hóa tốt trên các môi trường khác nhau.
Link to this sectionTính năng chính#
- Bộ dữ liệu chứa hơn 3.000 hình ảnh huấn luyện từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Nó bao gồm khoảng 1.000 hình ảnh kiểm thử từ Úc, Nhật Bản và Trung Quốc.
- Hình ảnh là các hình ảnh ngoài trời trên đồng ruộng, ghi lại sự biến đổi tự nhiên về diện mạo của bông lúa.
- Các chú thích bao gồm BBox của bông lúa mì để hỗ trợ các tác vụ object detection.
Link to this sectionCấu trúc tập dữ liệu#
Global Wheat Head Dataset được tổ chức thành hai tập hợp con chính:
- Tập huấn luyện: Tập hợp con này chứa hơn 3.000 hình ảnh từ châu Âu và Bắc Mỹ. Các hình ảnh được dán nhãn với khung bao bông lúa, cung cấp dữ liệu cơ sở (ground truth) để huấn luyện các model phát hiện đối tượng.
- Tập kiểm thử: Tập hợp con này bao gồm khoảng 1.000 hình ảnh từ Úc, Nhật Bản và Trung Quốc. Những hình ảnh này được sử dụng để đánh giá hiệu suất của các model đã huấn luyện trên các kiểu gen, môi trường và điều kiện quan sát chưa từng gặp.
Link to this sectionỨng dụng#
Global Wheat Head Dataset được sử dụng rộng rãi để huấn luyện và đánh giá các model deep learning trong các tác vụ phát hiện bông lúa. Bộ dữ liệu đa dạng các hình ảnh, nắm bắt nhiều diện mạo, môi trường và điều kiện khác nhau, tạo thành nguồn tài nguyên quý giá cho các nhà nghiên cứu và thực hành trong lĩnh vực kiểu hình thực vật và quản lý cây trồng.
Link to this sectionYAML tập dữ liệu#
Một tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình bộ dữ liệu. Nó chứa thông tin về đường dẫn của bộ dữ liệu, các lớp và các thông tin liên quan khác. Đối với trường hợp Global Wheat Head Dataset, tệp GlobalWheat2020.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from pathlib import Path
from ultralytics.utils.downloads import download
# Download
dir = Path(yaml["path"]) # dataset root dir
urls = [
"https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
"https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
]
download(urls, dir=dir)
# Make Directories
for p in "annotations", "images", "labels":
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in (
"arvalis_1",
"arvalis_2",
"arvalis_3",
"ethz_1",
"rres_1",
"inrae_1",
"usask_1",
"utokyo_1",
"utokyo_2",
"nau_1",
"uq_1",
):
(dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p) # move to /images
f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json") # json file
if f.exists():
f.rename((dir / "annotations" / p).with_suffix(".json")) # move to /annotationsLink to this sectionCách sử dụng#
Để huấn luyện model YOLO26n trên Global Wheat Head Dataset trong 100 epoch với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)Link to this sectionDữ liệu mẫu và Chú thích#
Global Wheat Head Dataset chứa một tập hợp đa dạng các hình ảnh ngoài trời trên đồng ruộng, ghi lại sự biến đổi tự nhiên về diện mạo, môi trường và điều kiện của bông lúa. Dưới đây là một số ví dụ về dữ liệu từ bộ dữ liệu, cùng với các chú thích tương ứng:

- Phát hiện bông lúa: Hình ảnh này minh họa một ví dụ về phát hiện bông lúa, trong đó các bông lúa được chú thích bằng các khung bao. Bộ dữ liệu cung cấp nhiều hình ảnh để tạo điều kiện phát triển các model cho tác vụ này.
Ví dụ này thể hiện sự đa dạng và phức tạp của dữ liệu trong Global Wheat Head Dataset và nhấn mạnh tầm quan trọng của việc phát hiện bông lúa chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng.
Link to this sectionTrích dẫn và Ghi nhận#
Nếu bạn sử dụng Global Wheat Head Dataset trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}Chúng tôi muốn ghi nhận các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo và duy trì Global Wheat Head Dataset như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu về kiểu hình thực vật và quản lý cây trồng. Để biết thêm thông tin về bộ dữ liệu và những người tạo ra nó, hãy truy cập trang web Global Wheat Head Dataset.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionGlobal Wheat Head Dataset được sử dụng để làm gì?#
Global Wheat Head Dataset chủ yếu được sử dụng để phát triển và huấn luyện các model deep learning nhằm mục đích phát hiện bông lúa. Điều này rất quan trọng đối với các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng, cho phép ước tính chính xác hơn về mật độ, kích thước bông lúa và tiềm năng năng suất cây trồng tổng thể. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và độ chín của cây trồng, điều cần thiết cho việc quản lý cây trồng hiệu quả.
Link to this sectionLàm thế nào để tôi huấn luyện model YOLO26n trên Global Wheat Head Dataset?#
Để huấn luyện model YOLO26n trên Global Wheat Head Dataset, bạn có thể sử dụng các đoạn mã sau. Hãy đảm bảo bạn có tệp cấu hình GlobalWheat2020.yaml chỉ định các đường dẫn bộ dữ liệu và các lớp:
from ultralytics import YOLO
# Load a pretrained model (recommended for training)
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.
Link to this sectionCác tính năng chính của Global Wheat Head Dataset là gì?#
Các tính năng chính của Global Wheat Head Dataset bao gồm:
- Hơn 3.000 hình ảnh huấn luyện từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Khoảng 1.000 hình ảnh kiểm thử từ Úc, Nhật Bản và Trung Quốc.
- Độ biến thiên cao về diện mạo bông lúa do các môi trường trồng trọt khác nhau.
- Chú thích chi tiết với các khung bao bông lúa để hỗ trợ các model phát hiện đối tượng.
Những tính năng này tạo điều kiện cho việc phát triển các model mạnh mẽ có khả năng tổng quát hóa trên nhiều khu vực.
Link to this sectionTôi có thể tìm tệp YAML cấu hình cho Global Wheat Head Dataset ở đâu?#
Tệp YAML cấu hình cho Global Wheat Head Dataset, có tên GlobalWheat2020.yaml, hiện đã có trên GitHub. Bạn có thể truy cập tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Tệp này chứa thông tin cần thiết về đường dẫn tập dữ liệu, các lớp và các chi tiết cấu hình khác cần thiết cho việc huấn luyện model trong Ultralytics YOLO.
Link to this sectionTại sao việc phát hiện bông lúa lại quan trọng trong quản lý cây trồng?#
Phát hiện bông lúa mì rất quan trọng trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước của bông lúa mì, vốn là yếu tố thiết yếu để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bằng cách tận dụng các deep learning models được huấn luyện trên các tập dữ liệu như Global Wheat Head Dataset, nông dân và các nhà nghiên cứu có thể giám sát và quản lý cây trồng tốt hơn, dẫn đến năng suất cải thiện và tối ưu hóa việc sử dụng tài nguyên trong thực tiễn nông nghiệp. Sự tiến bộ công nghệ này hỗ trợ các sáng kiến sustainable agriculture và an ninh lương thực.
Để biết thêm thông tin về các ứng dụng của AI trong nông nghiệp, hãy truy cập AI trong Nông nghiệp.