Bộ dữ liệu đầu lúa mì toàn cầu
Bộ dữ liệu đầu lúa mì toàn cầu là một tập hợp các hình ảnh được thiết kế để hỗ trợ phát triển các mô hình phát hiện đầu lúa mì chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng. Đầu lúa mì, còn được gọi là gai, là bộ phận mang hạt của cây lúa mì. Ước tính chính xác mật độ và kích thước đầu lúa mì là điều cần thiết để đánh giá sức khỏe, sự trưởng thành và tiềm năng năng suất của cây trồng. Bộ dữ liệu, được tạo ra bởi sự hợp tác của chín viện nghiên cứu từ bảy quốc gia, bao gồm nhiều khu vực đang phát triển để đảm bảo các mô hình khái quát hóa tốt trên các môi trường khác nhau.
Các tính năng chính
- Bộ dữ liệu chứa hơn 3.000 hình ảnh đào tạo từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Nó bao gồm khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
- Hình ảnh là hình ảnh thực địa ngoài trời, ghi lại sự thay đổi tự nhiên trong sự xuất hiện của đầu lúa mì.
- Chú thích bao gồm các hộp giới hạn đầu lúa mì để hỗ trợ các tác vụ phát hiện đối tượng.
Cấu trúc tập dữ liệu
Bộ dữ liệu đầu lúa mì toàn cầu được tổ chức thành hai tập hợp con chính:
- Bộ đào tạo: Tập hợp con này chứa hơn 3.000 hình ảnh từ Châu Âu và Bắc Mỹ. Các hình ảnh được dán nhãn với các hộp giới hạn đầu lúa mì, cung cấp sự thật cơ bản cho các mô hình phát hiện đối tượng huấn luyện.
- Bộ thử nghiệm: Tập hợp con này bao gồm khoảng 1.000 hình ảnh từ Úc, Nhật Bản và Trung Quốc. Những hình ảnh này được sử dụng để đánh giá hiệu suất của các mô hình được đào tạo trên các kiểu gen, môi trường và điều kiện quan sát không nhìn thấy.
Ứng dụng
Bộ dữ liệu Global Wheat Head được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các nhiệm vụ phát hiện đầu lúa mì. Bộ dữ liệu hình ảnh đa dạng của bộ dữ liệu, ghi lại nhiều hình dạng, môi trường và điều kiện khác nhau, khiến nó trở thành nguồn tài nguyên có giá trị cho các nhà nghiên cứu và học viên trong lĩnh vực phân tích kiểu hình thực vật và quản lý cây trồng.
Tập dữ liệu YAML
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, lớp và thông tin liên quan khác của tập dữ liệu. Đối với trường hợp của Bộ dữ liệu đầu lúa mì toàn cầu, GlobalWheat2020.yaml
Tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml.
ultralytics/cfg/datasets/GlobalWheat2020.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
# └── GlobalWheat2020 ← downloads here (7.0 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
- images/arvalis_1
- images/arvalis_2
- images/arvalis_3
- images/ethz_1
- images/rres_1
- images/inrae_1
- images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
- images/ethz_1
test: # test images (optional) 1276 images
- images/utokyo_1
- images/utokyo_2
- images/nau_1
- images/uq_1
# Classes
names:
0: wheat_head
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
from ultralytics.utils.downloads import download
from pathlib import Path
# Download
dir = Path(yaml['path']) # dataset root dir
urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
download(urls, dir=dir)
# Make Directories
for p in 'annotations', 'images', 'labels':
(dir / p).mkdir(parents=True, exist_ok=True)
# Move
for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
(dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p) # move to /images
f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json') # json file
if f.exists():
f.rename((dir / 'annotations' / p).with_suffix('.json')) # move to /annotations
Sử dụng
Để đào tạo mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Dữ liệu mẫu và chú thích
Bộ dữ liệu đầu lúa mì toàn cầu chứa một bộ hình ảnh cánh đồng ngoài trời đa dạng, ghi lại sự biến đổi tự nhiên về hình thức, môi trường và điều kiện của đầu lúa mì. Dưới đây là một số ví dụ về dữ liệu từ tập dữ liệu, cùng với các chú thích tương ứng của chúng:
- Phát hiện đầu lúa mì: Hình ảnh này minh họa một ví dụ về phát hiện đầu lúa mì, trong đó đầu lúa mì được chú thích bằng các hộp giới hạn. Bộ dữ liệu cung cấp nhiều hình ảnh khác nhau để tạo điều kiện phát triển các mô hình cho nhiệm vụ này.
Ví dụ này cho thấy sự đa dạng và phức tạp của dữ liệu trong Bộ dữ liệu đầu lúa mì toàn cầu và nhấn mạnh tầm quan trọng của việc phát hiện đầu lúa mì chính xác cho các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng.
Trích dẫn và xác nhận
Nếu bạn sử dụng Bộ dữ liệu đầu lúa mì toàn cầu trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{david2020global,
title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods},
author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others},
journal={arXiv preprint arXiv:2005.02162},
year={2020}
}
Chúng tôi muốn ghi nhận các nhà nghiên cứu và tổ chức đã đóng góp vào việc tạo ra và duy trì Bộ dữ liệu đầu lúa mì toàn cầu như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu quản lý cây trồng và kiểu hình cây trồng. Để biết thêm thông tin về tập dữ liệu và người tạo ra nó, hãy truy cập trang web Tập dữ liệu đầu lúa mì toàn cầu.
FAQ
Bộ dữ liệu đầu lúa mì toàn cầu được sử dụng để làm gì?
Bộ dữ liệu đầu lúa mì toàn cầu chủ yếu được sử dụng để phát triển và đào tạo các mô hình học sâu nhằm phát hiện đầu lúa mì. Điều này rất quan trọng đối với các ứng dụng trong kiểu hình lúa mì và quản lý cây trồng, cho phép ước tính chính xác hơn về mật độ, kích thước và tiềm năng năng suất cây trồng tổng thể. Các phương pháp phát hiện chính xác giúp đánh giá sức khỏe và sự trưởng thành của cây trồng, điều cần thiết để quản lý cây trồng hiệu quả.
Làm thế nào để đào tạo mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head?
Để đào tạo mô hình YOLO11n trên Bộ dữ liệu Global Wheat Head, bạn có thể sử dụng các đoạn mã sau. Đảm bảo bạn có GlobalWheat2020.yaml
Tệp cấu hình chỉ định đường dẫn và lớp tập dữ liệu:
Ví dụ về tàu hỏa
Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.
Các tính năng chính của Bộ dữ liệu đầu lúa mì toàn cầu là gì?
Các tính năng chính của Bộ dữ liệu đầu lúa mì toàn cầu bao gồm:
- Hơn 3.000 hình ảnh đào tạo từ châu Âu (Pháp, Anh, Thụy Sĩ) và Bắc Mỹ (Canada).
- Khoảng 1.000 hình ảnh thử nghiệm từ Úc, Nhật Bản và Trung Quốc.
- Sự thay đổi cao trong sự xuất hiện của đầu lúa mì do môi trường phát triển khác nhau.
- Chú thích chi tiết với các hộp giới hạn đầu lúa mì để hỗ trợ mô hình phát hiện đối tượng .
Những tính năng này tạo điều kiện cho sự phát triển của các mô hình mạnh mẽ có khả năng khái quát hóa trên nhiều khu vực.
Tôi có thể tìm tệp YAML cấu hình cho Tập dữ liệu đầu lúa mì toàn cầu ở đâu?
Tệp YAML cấu hình cho Tập dữ liệu đầu lúa mì toàn cầu, được đặt tên GlobalWheat2020.yaml
, có sẵn trên GitHub. Bạn có thể truy cập nó tại đây liên kết. Tệp này chứa thông tin cần thiết về đường dẫn tập dữ liệu, lớp và các chi tiết cấu hình khác cần thiết cho việc đào tạo mô hình trong Ultralytics YOLO.
Tại sao phát hiện đầu lúa mì lại quan trọng trong quản lý cây trồng?
Phát hiện đầu lúa mì rất quan trọng trong quản lý cây trồng vì nó cho phép ước tính chính xác mật độ và kích thước đầu lúa mì, điều này rất cần thiết để đánh giá sức khỏe, sự trưởng thành và tiềm năng năng suất của cây trồng. Bằng cách tận dụng các mô hình học sâu được đào tạo trên các bộ dữ liệu như Bộ dữ liệu đầu lúa mì toàn cầu, nông dân và nhà nghiên cứu có thể giám sát và quản lý cây trồng tốt hơn, dẫn đến cải thiện năng suất và tối ưu hóa việc sử dụng tài nguyên trong thực hành nông nghiệp. Tiến bộ công nghệ này hỗ trợ các sáng kiến nông nghiệp bền vững và an ninh lương thực.
Để biết thêm thông tin về các ứng dụng của AI trong nông nghiệp, hãy truy cập AI trong Nông nghiệp.