Bộ dữ liệu DOTA8
Giới thiệu
Ultralytics DOTA8 là một bộ dữ liệu object detection có hướng nhỏ gọn nhưng linh hoạt, bao gồm 8 hình ảnh đầu tiên của bộ DOTAv1 được chia tách, với 4 ảnh dùng để huấn luyện và 4 ảnh để xác thực. Bộ dữ liệu này lý tưởng cho việc kiểm thử và gỡ lỗi các model object detection, hoặc để thử nghiệm các hướng tiếp cận phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ dàng quản lý, nhưng vẫn đủ đa dạng để kiểm tra các pipeline huấn luyện nhằm phát hiện lỗi và thực hiện kiểm tra sơ bộ trước khi huấn luyện trên các bộ dữ liệu lớn hơn.
Cấu trúc tập dữ liệu
-
Hình ảnh: 8 tile ảnh trên không (4 huấn luyện, 4 xác thực) được lấy từ DOTAv1.
-
Các lớp (Classes): Thừa hưởng 15 danh mục từ DOTAv1 như máy bay, tàu thủy và phương tiện lớn.
-
Nhãn: Các bounding box có hướng theo định dạng YOLO được lưu dưới dạng tệp
.txtđi kèm với mỗi hình ảnh. -
Bố cục đề xuất:
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
Tập dữ liệu này được thiết kế để sử dụng với Ultralytics Platform và YOLO26.
Dataset YAML
Một tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình bộ dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và các thông tin liên quan khác của bộ dữ liệu. Đối với bộ dữ liệu DOTA8, tệp dota8.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zipCách sử dụng
Để huấn luyện model YOLO26n-obb trên bộ dữ liệu DOTA8 trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã dưới đây. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training của model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Hình ảnh và chú thích mẫu
Dưới đây là một số ví dụ về các hình ảnh từ bộ dữ liệu DOTA8, cùng với các chú thích tương ứng của chúng:
- Mosaiced Image: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh tập dữ liệu được ghép lại (mosaic). Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các vật thể và cảnh quan trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và bối cảnh vật thể khác nhau.
Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong bộ dữ liệu DOTA8 cũng như lợi ích của việc sử dụng mosaicing trong quá trình huấn luyện.
Trích dẫn và Ghi nhận
Nếu bạn sử dụng bộ dữ liệu DOTA trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Một lời cảm ơn đặc biệt gửi đến đội ngũ đứng sau các bộ dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý bộ dữ liệu này. Để hiểu rõ hơn về bộ dữ liệu và các đặc điểm tinh tế của nó, vui lòng truy cập trang web chính thức của DOTA.
Câu hỏi thường gặp (FAQ)
Bộ dữ liệu DOTA8 là gì và nó có thể được sử dụng như thế nào?
Bộ dữ liệu DOTA8 là một bộ dữ liệu object detection có hướng nhỏ gọn, linh hoạt, được tạo thành từ 8 hình ảnh đầu tiên của bộ dữ liệu DOTAv1, với 4 hình ảnh dành cho huấn luyện và 4 hình ảnh cho xác thực. Nó lý tưởng để kiểm thử và gỡ lỗi các model object detection như Ultralytics YOLO26. Nhờ kích thước dễ quản lý và sự đa dạng, nó giúp xác định các lỗi trong pipeline và thực hiện kiểm tra sơ bộ trước khi triển khai với các bộ dữ liệu lớn hơn. Tìm hiểu thêm về object detection với Ultralytics YOLO26.
Làm thế nào để tôi huấn luyện model YOLO26 bằng bộ dữ liệu DOTA8?
Để huấn luyện model YOLO26n-obb trên bộ dữ liệu DOTA8 trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để xem các tùy chọn đối số đầy đủ, hãy tham khảo trang Training của model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Các tính năng chính của bộ dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?
Bộ dữ liệu DOTA nổi tiếng với quy mô benchmark lớn và những thách thức mà nó đặt ra cho việc phát hiện đối tượng trong ảnh trên không. Tập con DOTA8 là một bộ dữ liệu nhỏ hơn, dễ quản lý, lý tưởng cho các thử nghiệm ban đầu. Bạn có thể truy cập tệp dota8.yaml, chứa các đường dẫn, các lớp và chi tiết cấu hình, tại liên kết GitHub này.
Mosaicing nâng cao quá trình huấn luyện model với bộ dữ liệu DOTA8 như thế nào?
Mosaicing kết hợp nhiều hình ảnh thành một trong quá trình huấn luyện, làm tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch. Điều này cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và cảnh khác nhau. Kỹ thuật này có thể được trình diễn trực quan thông qua một batch huấn luyện bao gồm các hình ảnh từ bộ dữ liệu DOTA8 đã được ghép mosaiced, hỗ trợ quá trình phát triển model mạnh mẽ. Khám phá thêm về mosaicing và các kỹ thuật huấn luyện trên trang Training của chúng tôi.
Tại sao tôi nên sử dụng Ultralytics YOLO26 cho các tác vụ object detection?
Ultralytics YOLO26 cung cấp các khả năng object detection thời gian thực tiên tiến nhất, bao gồm các tính năng như oriented bounding boxes (OBB), instance segmentation và một pipeline huấn luyện linh hoạt cao. Nó phù hợp cho nhiều ứng dụng khác nhau và cung cấp các model đã huấn luyện trước để tinh chỉnh hiệu quả. Khám phá thêm về các ưu điểm và cách sử dụng trong tài liệu Ultralytics YOLO26.