Dataset DOTA128
Giới thiệu
Ultralytics DOTA128 là một tập dữ liệu object detection oriented object detection nhỏ gọn nhưng linh hoạt bao gồm 128 hình ảnh từ tập DOTAv1, với 128 hình ảnh dùng cho training và validation. Tập dữ liệu này rất lý tưởng để thử nghiệm và debug các model oriented bounding box (OBB), hoặc để thử nghiệm các hướng tiếp cận phát hiện đối tượng mới. Với 128 hình ảnh, nó đủ nhỏ để dễ dàng quản lý, nhưng vẫn đủ đa dạng để kiểm tra các pipeline training nhằm tìm lỗi và đóng vai trò như một bước kiểm tra sơ bộ trước khi training trên các tập dữ liệu lớn hơn.
Cấu trúc tập dữ liệu
- Images: 128 ảnh chụp trên không (tất cả nằm trong thư mục train, được sử dụng cho cả train và val) lấy từ DOTAv1.
- Lớp (Classes): Kế thừa 15 danh mục của DOTAv1 như máy bay, tàu thủy và các phương tiện lớn.
- Nhãn (Labels): Oriented bounding box định dạng YOLO được lưu dưới dạng
.txtfiles bên cạnh mỗi hình ảnh.
Dataset này được thiết kế để sử dụng với Ultralytics Platform và YOLO26.
YAML của tập dữ liệu
Một tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình tập dữ liệu. Tệp này chứa thông tin về đường dẫn, các class và các thông tin liên quan khác của tập dữ liệu. Đối với tập dữ liệu DOTA128, tệp dota128.yaml được lưu trữ tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipCách sử dụng
Để train một model YOLO26n-obb trên tập dữ liệu DOTA128 trong 100 epochs với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo Training của chúng tôi.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Hình ảnh và chú thích mẫu
Dưới đây là một số ví dụ về các hình ảnh từ tập dữ liệu DOTA128, cùng với các annotation tương ứng:
- Hình ảnh Mosaiced: Hình ảnh này minh họa một batch huấn luyện được tạo thành từ các hình ảnh dataset đã qua kỹ thuật mosaic. Mosaic là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một ảnh duy nhất để tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.
Ví dụ này thể hiện sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu DOTA128 cũng như những lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình training.
Trích dẫn và Ghi nhận
Nếu bạn sử dụng tập dữ liệu DOTA trong nghiên cứu hoặc công việc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Một lời cảm ơn đặc biệt đến đội ngũ đứng sau các tập dữ liệu DOTA vì nỗ lực đáng ghi nhận của họ trong việc tuyển tập dữ liệu này. Để hiểu rõ ràng và đầy đủ về tập dữ liệu cũng như các sắc thái của nó, vui lòng truy cập trang web chính thức của DOTA.
Câu hỏi thường gặp
Tập dữ liệu DOTA128 là gì và làm thế nào để sử dụng nó?
Tập dữ liệu DOTA128 là một tập dữ liệu oriented object detection linh hoạt bao gồm 128 hình ảnh từ tập DOTAv1, tất cả được lưu trữ trong thư mục train. Cả quá trình training và validation đều sử dụng chung một tập hợp hình ảnh, giúp nó trở nên lý tưởng cho các quy trình làm việc (workflow) thử nghiệm và debug nhanh chóng. Nó rất phù hợp để kiểm tra và debug các model OBB như Ultralytics YOLO26. Nhờ kích thước dễ quản lý và tính đa dạng, nó giúp ích trong việc xác định các lỗi pipeline và thực hiện kiểm tra sơ bộ trước khi triển khai trên các tập dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện OBB với Ultralytics YOLO26.
Làm cách nào để tôi train model YOLO26 sử dụng tập dữ liệu DOTA128?
Để train model YOLO26n-obb trên tập dữ liệu DOTA128 trong 100 epoch với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết các tùy chọn đối số toàn diện, hãy tham khảo Training của chúng tôi.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Các đặc điểm chính của tập dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?
Tập dữ liệu DOTA được biết đến với quy mô benchmark lớn và những thách thức mà nó đặt ra cho việc phát hiện đối tượng trong hình ảnh trên không. Tập con DOTA128 cung cấp độ đa dạng cao hơn so với DOTA8 trong khi vẫn duy trì được khả năng quản lý cho các thử nghiệm ban đầu. Bạn có thể truy cập tệp dota128.yaml chứa các đường dẫn, class và chi tiết cấu hình tại liên kết GitHub này.
DOTA128 so sánh với các biến thể tập dữ liệu DOTA khác như thế nào?
DOTA128 (128 hình ảnh) nằm giữa DOTA8 (8 hình ảnh) và dataset đầy đủ DOTA-v1 tập dữ liệu (1.869 hình ảnh) về mặt quy mô:
- DOTA8: Chứa chỉ 8 hình ảnh (4 train, 4 val) - lý tưởng cho việc kiểm tra nhanh và debug
- DOTA128: Chứa 128 hình ảnh (tất cả nằm trong thư mục train, sử dụng cho cả train và val) - cân bằng giữa quy mô và độ đa dạng
- Full DOTA-v1: Chứa 1.869 hình ảnh - toàn diện nhưng tốn kém tài nguyên
DOTA128 cung cấp một điểm trung gian tốt, mang lại độ đa dạng cao hơn DOTA8 trong khi vẫn dễ quản lý hơn nhiều so với tập dữ liệu DOTA đầy đủ phục vụ cho mục đích thử nghiệm và phát triển model ban đầu.
Kỹ thuật mosaicing tăng cường quá trình training model với tập dữ liệu DOTA128 như thế nào?
Mosaicing kết hợp nhiều hình ảnh thành một trong quá trình training, giúp tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch. Điều này cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và các cảnh khác nhau. Kỹ thuật này có thể được minh họa trực quan thông qua một batch training bao gồm các hình ảnh từ tập dữ liệu DOTA128 đã qua xử lý mosaicing, hỗ trợ xây dựng model mạnh mẽ hơn. Khám phá thêm về mosaicing và các kỹ thuật training trên Training của chúng tôi.
Tại sao tôi nên sử dụng Ultralytics YOLO26 cho các tác vụ oriented object detection?
Ultralytics YOLO26 cung cấp các khả năng phát hiện đối tượng thời gian thực hiện đại, bao gồm các tính năng như oriented bounding box (OBB), instance segmentation và một pipeline training cực kỳ linh hoạt. Nó phù hợp cho nhiều ứng dụng khác nhau và cung cấp các model đã được huấn luyện sẵn (pretrained) để tinh chỉnh (fine-tuning) hiệu quả. Khám phá thêm về các ưu điểm và cách sử dụng trong tài liệu Ultralytics YOLO26.