Tập dữ liệu DOTA8
Giới thiệu
Ultralytics DOTA8 là một tập dữ liệu phát hiện đối tượng định hướng nhỏ nhưng linh hoạt bao gồm 8 hình ảnh đầu tiên trong số 8 hình ảnh của bộ DOTAv1 chia tách, 4 để đào tạo và 4 để xác thực. Tập dữ liệu này lý tưởng để thử nghiệm và gỡ lỗi các mô hình phát hiện đối tượng hoặc để thử nghiệm các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ quản lý, nhưng đủ đa dạng để kiểm tra các đường ống đào tạo để tìm lỗi và hoạt động như một kiểm tra tính hợp lý trước khi đào tạo các tập dữ liệu lớn hơn.
Bộ dữ liệu này được dự định sử dụng với Ultralytics HUB và YOLO11 .
Tập dữ liệu YAML
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, lớp và thông tin liên quan khác của tập dữ liệu. Trong trường hợp tập dữ liệu DOTA8, dota8.yaml
Tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
ultralytics/cfg/datasets/dota8.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip
Sử dụng
Để đào tạo mô hình YOLO11n-obb trên tập dữ liệu DOTA8 trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu DOTA8, cùng với các chú thích tương ứng của chúng:
- Hình ảnh khảm: Hình ảnh này thể hiện một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Điều này giúp cải thiện khả năng khái quát hóa mô hình cho các kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau.
Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong tập dữ liệu DOTA8 và lợi ích của việc sử dụng khảm trong quá trình đào tạo.
Trích dẫn và xác nhận
Nếu bạn sử dụng bộ dữ liệu DOTA trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Một lưu ý đặc biệt về lòng biết ơn đối với nhóm đằng sau các bộ dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý bộ dữ liệu này. Để hiểu toàn diện về tập dữ liệu và các sắc thái của nó, vui lòng truy cập trang web chính thức của DOTA.
FAQ
Tập dữ liệu DOTA8 là gì và nó có thể được sử dụng như thế nào?
Bộ dữ liệu DOTA8 là một bộ dữ liệu phát hiện đối tượng định hướng nhỏ, linh hoạt được tạo thành từ 8 hình ảnh đầu tiên từ bộ chia tách DOTAv1, với 4 hình ảnh được chỉ định để đào tạo và 4 hình ảnh để xác thực. Nó lý tưởng để thử nghiệm và gỡ lỗi các mô hình phát hiện đối tượng như Ultralytics YOLO11. Do có kích thước và tính đa dạng có thể quản lý được, nó giúp xác định lỗi đường ống và chạy kiểm tra tính hợp lý trước khi triển khai các tập dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện đối tượng với Ultralytics YOLO11 .
Làm thế nào để đào tạo mô hình YOLO11 bằng bộ dữ liệu DOTA8?
Để đào tạo mô hình YOLO11n-obb trên tập dữ liệu DOTA8 trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết các tùy chọn đối số toàn diện, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Các tính năng chính của tập dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?
Bộ dữ liệu DOTA được biết đến với điểm chuẩn quy mô lớn và những thách thức mà nó đưa ra để phát hiện đối tượng trong hình ảnh trên không. Tập hợp con DOTA8 là một tập dữ liệu nhỏ hơn, có thể quản lý lý tưởng cho các thử nghiệm ban đầu. Bạn có thể truy cập dota8.yaml
tệp, chứa đường dẫn, lớp và chi tiết cấu hình, tại đây Liên kết GitHub.
Làm thế nào để khảm tăng cường đào tạo mô hình với tập dữ liệu DOTA8?
Khảm kết hợp nhiều hình ảnh thành một trong quá trình đào tạo, tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi đợt. Điều này cải thiện khả năng khái quát hóa của mô hình theo các kích thước đối tượng, tỷ lệ khung hình và cảnh khác nhau. Kỹ thuật này có thể được thể hiện trực quan thông qua một đợt đào tạo bao gồm các hình ảnh tập dữ liệu DOTA8 được khảm, giúp phát triển mô hình mạnh mẽ. Khám phá thêm về khảm và kỹ thuật đào tạo trên trang Đào tạo của chúng tôi.
Tại sao tôi nên sử dụng Ultralytics YOLO11 dùng cho nhiệm vụ phát hiện đối tượng?
Ultralytics YOLO11 cung cấp khả năng phát hiện đối tượng theo thời gian thực tiên tiến, bao gồm các tính năng như hộp giới hạn định hướng (OBB), phân đoạn thể hiện và đường ống đào tạo cực kỳ linh hoạt. Nó phù hợp với nhiều ứng dụng khác nhau và cung cấp các mô hình được đào tạo trước để tinh chỉnh hiệu quả. Khám phá thêm về các lợi thế và cách sử dụng trong tài liệu YOLO11 Ultralytics .