Bộ dữ liệu Đầu lúa mì toàn cầu (Global Wheat Head Dataset)
Bộ dữ liệu Đầu lúa mì toàn cầu (Global Wheat Head Dataset) là một tập hợp các hình ảnh được thiết kế để hỗ trợ phát triển các mô hình phát hiện đầu lúa mì chính xác cho các ứng dụng trong việc định kiểu hình lúa mì và quản lý cây trồng. Đầu lúa mì, còn được gọi là bông lúa, là bộ phận mang hạt của cây lúa mì. Ước tính chính xác mật độ và kích thước đầu lúa mì là điều cần thiết để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bộ dữ liệu, được tạo ra bởi sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao gồm nhiều vùng trồng trọt để đảm bảo các mô hình khái quát hóa tốt trên các môi trường khác nhau.
Các tính năng chính
- Bộ dữ liệu chứa hơn 3.000 hình ảnh huấn luyện từ Châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Bộ dữ liệu này bao gồm khoảng 1.000 ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
- Ảnh là ảnh chụp ngoài trời, ghi lại sự thay đổi tự nhiên về hình dạng của bông lúa mì.
- Các chú thích bao gồm các hộp giới hạn đầu lúa mì để hỗ trợ các tác vụ phát hiện đối tượng.
Cấu trúc bộ dữ liệu
Bộ dữ liệu Global Wheat Head được tổ chức thành hai tập hợp con chính:
- Tập huấn luyện: Tập hợp con này chứa hơn 3.000 ảnh từ Châu Âu và Bắc Mỹ. Các ảnh được gắn nhãn bằng các hộp giới hạn bông lúa mì, cung cấp ground truth để huấn luyện các mô hình phát hiện đối tượng.
- Tập kiểm tra: Tập hợp con này bao gồm khoảng 1.000 ảnh từ Úc, Nhật Bản và Trung Quốc. Những ảnh này được sử dụng để đánh giá hiệu suất của các mô hình đã huấn luyện trên các kiểu gen, môi trường và điều kiện quan sát chưa từng thấy.
Các ứng dụng
Bộ dữ liệu Global Wheat Head được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ phát hiện đầu lúa mì. Tập hợp hình ảnh đa dạng của bộ dữ liệu, ghi lại nhiều hình thức, môi trường và điều kiện khác nhau, làm cho nó trở thành một nguồn tài nguyên có giá trị cho các nhà nghiên cứu và người thực hành trong lĩnh vực định kiểu hình thực vật và quản lý cây trồng.
YAML bộ dữ liệu
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó chứa thông tin về đường dẫn, lớp và các thông tin liên quan khác của bộ dữ liệu. Đối với trường hợp của Bộ dữ liệu Global Wheat Head, GlobalWheat2020.yaml
tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from pathlib import Path
from ultralytics.utils.downloads import download
# Download
dir = Path(yaml["path"]) # dataset root dir
urls = [
"https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip",
"https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip",
]
download(urls, dir=dir)
# Make Directories
for p in "annotations", "images", "labels":
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in (
"arvalis_1",
"arvalis_2",
"arvalis_3",
"ethz_1",
"rres_1",
"inrae_1",
"usask_1",
"utokyo_1",
"utokyo_2",
"nau_1",
"uq_1",
):
(dir / "global-wheat-codalab-official" / p).rename(dir / "images" / p) # move to /images
f = (dir / "global-wheat-codalab-official" / p).with_suffix(".json") # json file
if f.exists():
f.rename((dir / "annotations" / p).with_suffix(".json")) # move to /annotations
Cách sử dụng
Để huấn luyện mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640
Dữ liệu mẫu và Chú thích
Bộ dữ liệu Global Wheat Head chứa một tập hợp đa dạng các ảnh chụp ngoài trời, ghi lại sự thay đổi tự nhiên về hình dạng, môi trường và điều kiện của bông lúa mì. Dưới đây là một số ví dụ về dữ liệu từ bộ dữ liệu, cùng với các chú thích tương ứng của chúng:
- Phát hiện bông lúa mì: Hình ảnh này minh họa một ví dụ về phát hiện bông lúa mì, trong đó các bông lúa mì được chú thích bằng các hộp giới hạn. Bộ dữ liệu cung cấp nhiều hình ảnh khác nhau để tạo điều kiện phát triển các mô hình cho tác vụ này.
Ví dụ này thể hiện sự đa dạng và phức tạp của dữ liệu trong Bộ dữ liệu Global Wheat Head và nhấn mạnh tầm quan trọng của việc phát hiện bông lúa mì chính xác cho các ứng dụng trong định hình kiểu hình lúa mì và quản lý cây trồng.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng Bộ dữ liệu Global Wheat Head trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
Chúng tôi xin ghi nhận công lao của các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo ra và duy trì Bộ dữ liệu Global Wheat Head như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu về định hình kiểu hình thực vật và quản lý cây trồng. Để biết thêm thông tin về bộ dữ liệu và những người tạo ra nó, hãy truy cập trang web của Bộ dữ liệu Global Wheat Head.
Câu hỏi thường gặp
Bộ dữ liệu Đầu lúa mì toàn cầu (Global Wheat Head Dataset) được sử dụng để làm gì?
Bộ dữ liệu Global Wheat Head chủ yếu được sử dụng để phát triển và huấn luyện các mô hình học sâu nhằm mục đích phát hiện đầu lúa mì. Điều này rất quan trọng đối với các ứng dụng trong định kiểu hình lúa mì và quản lý cây trồng, cho phép ước tính chính xác hơn về mật độ đầu lúa mì, kích thước và tiềm năng năng suất cây trồng tổng thể. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và độ chín của cây trồng, điều này rất cần thiết để quản lý cây trồng hiệu quả.
Làm cách nào để huấn luyện mô hình YOLO11n trên Bộ dữ liệu Đầu lúa mì toàn cầu (Global Wheat Head Dataset)?
Để huấn luyện mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head, bạn có thể sử dụng các đoạn mã sau. Hãy đảm bảo bạn có GlobalWheat2020.yaml
tệp cấu hình chỉ định đường dẫn và lớp của bộ dữ liệu:
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a pre-trained model (recommended for training)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640
Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.
Các tính năng chính của Bộ dữ liệu Đầu lúa mì toàn cầu (Global Wheat Head Dataset) là gì?
Các tính năng chính của Bộ dữ liệu Global Wheat Head bao gồm:
- Hơn 3.000 ảnh huấn luyện từ Châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Khoảng 1.000 ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
- Độ biến thiên cao về hình dạng bông lúa mì do các môi trường sinh trưởng khác nhau.
- Các chú thích chi tiết với khung giới hạn đầu lúa mì để hỗ trợ các mô hình phát hiện đối tượng.
Những tính năng này tạo điều kiện thuận lợi cho việc phát triển các mô hình mạnh mẽ có khả năng khái quát hóa trên nhiều khu vực.
Tôi có thể tìm tệp YAML cấu hình cho Bộ dữ liệu Đầu lúa mì toàn cầu (Global Wheat Head Dataset) ở đâu?
Tệp YAML cấu hình cho Bộ dữ liệu Đầu lúa mì Toàn cầu, có tên là GlobalWheat2020.yaml
, có sẵn trên GitHub. Bạn có thể truy cập nó tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml. Tệp này chứa thông tin cần thiết về đường dẫn dataset, các class và các chi tiết cấu hình khác cần thiết cho việc huấn luyện mô hình trong Ultralytics YOLO.
Tại sao việc phát hiện đầu lúa mì lại quan trọng trong quản lý cây trồng?
Việc phát hiện bông lúa mì đóng vai trò quan trọng trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước bông lúa mì, điều này rất cần thiết để đánh giá sức khỏe, độ chín và tiềm năng năng suất của cây trồng. Bằng cách tận dụng các mô hình deep learning được đào tạo trên các bộ dữ liệu như Global Wheat Head Dataset, nông dân và nhà nghiên cứu có thể theo dõi và quản lý cây trồng tốt hơn, dẫn đến năng suất được cải thiện và sử dụng tài nguyên tối ưu trong các hoạt động nông nghiệp. Sự tiến bộ công nghệ này hỗ trợ nền nông nghiệp bền vững và các sáng kiến an ninh lương thực.
Để biết thêm thông tin về các ứng dụng của AI trong nông nghiệp, hãy truy cập AI trong Nông nghiệp.