Bộ dữ liệu đầu lúa mì toàn cầu
Bộ dữ liệu đầu lúa mì toàn cầu là một tập hợp các hình ảnh được thiết kế để hỗ trợ phát triển các mô hình phát hiện đầu lúa mì chính xác cho các ứng dụng trong phân tích kiểu hình lúa mì và quản lý cây trồng. Đầu lúa mì, còn được gọi là gai, là các bộ phận mang hạt của cây lúa mì. Việc ước tính chính xác mật độ và kích thước đầu lúa mì là điều cần thiết để đánh giá sức khỏe cây trồng, độ chín và tiềm năng năng suất. Bộ dữ liệu, được tạo ra bởi sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao gồm nhiều vùng trồng trọt để đảm bảo các mô hình có thể khái quát tốt trên các môi trường khác nhau.
Các tính năng chính
- Bộ dữ liệu chứa hơn 3.000 hình ảnh đào tạo từ Châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Nó bao gồm khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
- Hình ảnh là hình ảnh ngoài trời, ghi lại sự thay đổi tự nhiên của hình dáng bông lúa mì.
- Chú thích bao gồm các hộp giới hạn đầu lúa mì để hỗ trợ nhiệm vụ phát hiện đối tượng.
Cấu trúc tập dữ liệu
Bộ dữ liệu Đầu lúa mì toàn cầu được tổ chức thành hai tập hợp con chính:
- Bộ đào tạo : Tập hợp con này chứa hơn 3.000 hình ảnh từ Châu Âu và Bắc Mỹ. Các hình ảnh được gắn nhãn bằng hộp giới hạn đầu lúa mì, cung cấp sự thật cơ bản để đào tạo các mô hình phát hiện đối tượng.
- Bộ kiểm tra : Tập hợp con này bao gồm khoảng 1.000 hình ảnh từ Úc, Nhật Bản và Trung Quốc. Những hình ảnh này được sử dụng để đánh giá hiệu suất của các mô hình đã được đào tạo trên các kiểu gen, môi trường và điều kiện quan sát chưa từng thấy.
Ứng dụng
Bộ dữ liệu Global Wheat Head được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các nhiệm vụ phát hiện đầu lúa mì. Bộ dữ liệu hình ảnh đa dạng của bộ dữ liệu, ghi lại nhiều hình dạng, môi trường và điều kiện khác nhau, khiến nó trở thành nguồn tài nguyên có giá trị cho các nhà nghiên cứu và học viên trong lĩnh vực phân tích kiểu hình thực vật và quản lý cây trồng.
Bộ dữ liệu YAML
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Tệp này chứa thông tin về các đường dẫn, lớp và các thông tin liên quan khác của tập dữ liệu. Đối với trường hợp của Tập dữ liệu Global Wheat Head, GlobalWheat2020.yaml
tập tin được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics /cfg/datasets/GlobalWheat2020.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from ultralytics.utils.downloads import download
from pathlib import Path
# Download
dir = Path(yaml['path']) # dataset root dir
urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
download(urls, dir=dir)
# Make Directories
for p in 'annotations', 'images', 'labels':
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
(dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p) # move to /images
f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json') # json file
if f.exists():
f.rename((dir / 'annotations' / p).with_suffix('.json')) # move to /annotations
Cách sử dụng
Để đào tạo mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Dữ liệu mẫu và chú thích
Bộ dữ liệu Global Wheat Head chứa một tập hợp đa dạng các hình ảnh ngoài trời, ghi lại sự thay đổi tự nhiên về hình dạng, môi trường và điều kiện của đầu lúa mì. Sau đây là một số ví dụ về dữ liệu từ bộ dữ liệu, cùng với các chú thích tương ứng của chúng:
- Phát hiện đầu lúa mì : Hình ảnh này minh họa một ví dụ về phát hiện đầu lúa mì, trong đó đầu lúa mì được chú thích bằng hộp giới hạn. Bộ dữ liệu cung cấp nhiều hình ảnh khác nhau để tạo điều kiện thuận lợi cho việc phát triển các mô hình cho nhiệm vụ này.
Ví dụ này cho thấy sự đa dạng và phức tạp của dữ liệu trong Bộ dữ liệu bông lúa mì toàn cầu và nhấn mạnh tầm quan trọng của việc phát hiện bông lúa mì chính xác để ứng dụng trong phân tích kiểu hình lúa mì và quản lý cây trồng.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng Bộ dữ liệu Global Wheat Head trong công tác nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
Chúng tôi muốn ghi nhận các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo ra và duy trì Bộ dữ liệu Global Wheat Head như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về kiểu hình thực vật và quản lý cây trồng. Để biết thêm thông tin về bộ dữ liệu và những người tạo ra nó, hãy truy cập trang web Global Wheat Head Dataset .
CÂU HỎI THƯỜNG GẶP
Bộ dữ liệu Global Wheat Head được sử dụng để làm gì?
Bộ dữ liệu Global Wheat Head chủ yếu được sử dụng để phát triển và đào tạo các mô hình học sâu nhằm phát hiện đầu lúa mì. Điều này rất quan trọng đối với các ứng dụng trong phân tích kiểu hình lúa mì và quản lý cây trồng, cho phép ước tính chính xác hơn về mật độ, kích thước và tiềm năng năng suất cây trồng nói chung. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và độ chín của cây trồng, điều cần thiết để quản lý cây trồng hiệu quả.
Làm thế nào để đào tạo mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head?
Để đào tạo mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head, bạn có thể sử dụng các đoạn mã sau. Đảm bảo bạn có GlobalWheat2020.yaml
tệp cấu hình chỉ định đường dẫn và lớp dữ liệu:
Ví dụ về tàu hỏa
Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mô hình.
Những tính năng chính của Bộ dữ liệu Đầu lúa mì toàn cầu là gì?
Các tính năng chính của Bộ dữ liệu Đầu lúa mì toàn cầu bao gồm:
- Hơn 3.000 hình ảnh đào tạo từ Châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
- Sự thay đổi lớn về hình dạng của bông lúa mì do môi trường trồng trọt khác nhau.
- Chú thích chi tiết với các hộp giới hạn đầu lúa mì để hỗ trợ mô hình phát hiện đối tượng .
Những tính năng này tạo điều kiện thuận lợi cho việc phát triển các mô hình mạnh mẽ có khả năng khái quát hóa trên nhiều khu vực.
Tôi có thể tìm tệp YAML cấu hình cho Bộ dữ liệu Global Wheat Head ở đâu?
Tệp YAML cấu hình cho Bộ dữ liệu Đầu lúa mì toàn cầu, có tên là GlobalWheat2020.yaml
, có sẵn trên GitHub. Bạn có thể truy cập nó tại đây liên kết. Tệp này chứa thông tin cần thiết về đường dẫn tập dữ liệu, lớp và các chi tiết cấu hình khác cần thiết cho việc đào tạo mô hình trong Ultralytics YOLO .
Tại sao việc phát hiện bông lúa mì lại quan trọng trong quản lý cây trồng?
Phát hiện đầu lúa mì rất quan trọng trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước đầu lúa mì, những yếu tố cần thiết để đánh giá sức khỏe cây trồng, độ chín và tiềm năng năng suất. Bằng cách tận dụng các mô hình học sâu được đào tạo trên các tập dữ liệu như Bộ dữ liệu đầu lúa mì toàn cầu, nông dân và nhà nghiên cứu có thể theo dõi và quản lý cây trồng tốt hơn, dẫn đến năng suất được cải thiện và sử dụng tài nguyên được tối ưu hóa trong các hoạt động nông nghiệp. Tiến bộ công nghệ này hỗ trợ các sáng kiến về nông nghiệp bền vững và an ninh lương thực.
Để biết thêm thông tin về ứng dụng AI trong nông nghiệp, hãy truy cập AI trong nông nghiệp .