Bộ dữ liệu DOTA8
Giới thiệu
Ultralytics DOTA8 là một bộ dữ liệu phát hiện đối tượng có hướng nhỏ nhưng linh hoạt, bao gồm 8 hình ảnh đầu tiên của bộ DOTAv1 được chia, 4 hình ảnh cho huấn luyện và 4 hình ảnh cho xác thực. Bộ dữ liệu này lý tưởng để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng hoặc để thử nghiệm các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ quản lý, nhưng đủ đa dạng để kiểm tra các quy trình huấn luyện để tìm lỗi và hoạt động như một bước kiểm tra tính hợp lệ trước khi huấn luyện các bộ dữ liệu lớn hơn.
Bộ dữ liệu này được thiết kế để sử dụng với Ultralytics HUB và YOLO11.
YAML bộ dữ liệu
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và các thông tin liên quan khác của bộ dữ liệu. Trong trường hợp bộ dữ liệu DOTA8, dota8.yaml
tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip
Cách sử dụng
Để huấn luyện mô hình YOLO11n-obb trên tập dữ liệu DOTA8 trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Training (Huấn luyện) của mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640
Ảnh và Chú thích mẫu
Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu DOTA8, cùng với các annotation (chú thích) tương ứng của chúng:
- Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.
Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu DOTA8, cũng như lợi ích của việc sử dụng kỹ thuật ghép ảnh (mosaicing) trong quá trình huấn luyện.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng bộ dữ liệu DOTA trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Một lời cảm ơn đặc biệt đến nhóm đằng sau bộ dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý bộ dữ liệu này. Để hiểu thấu đáo về bộ dữ liệu và các sắc thái của nó, vui lòng truy cập trang web DOTA chính thức.
Câu hỏi thường gặp
Bộ dữ liệu DOTA8 là gì và nó có thể được sử dụng như thế nào?
Bộ dữ liệu DOTA8 là một bộ dữ liệu phát hiện đối tượng hướng nhỏ, linh hoạt, được tạo thành từ 8 hình ảnh đầu tiên từ bộ chia DOTAv1, với 4 hình ảnh được chỉ định để huấn luyện và 4 hình ảnh để xác thực. Nó lý tưởng để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng như Ultralytics YOLO11. Do kích thước và tính đa dạng dễ quản lý của nó, nó giúp xác định các lỗi pipeline và chạy kiểm tra tính hợp lệ trước khi triển khai các bộ dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện đối tượng với Ultralytics YOLO11.
Làm cách nào để huấn luyện mô hình YOLO11 bằng bộ dữ liệu DOTA8?
Để huấn luyện mô hình YOLO11n-obb trên tập dữ liệu DOTA8 trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết các tùy chọn đối số toàn diện, hãy tham khảo trang Training (Huấn luyện) của mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640
Các tính năng chính của bộ dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?
Bộ dữ liệu DOTA được biết đến là một chuẩn mực quy mô lớn và những thách thức mà nó đặt ra cho việc phát hiện đối tượng trong ảnh chụp từ trên không. Tập hợp con DOTA8 là một bộ dữ liệu nhỏ hơn, dễ quản lý, lý tưởng cho các thử nghiệm ban đầu. Bạn có thể truy cập dota8.yaml
tập tin, chứa đường dẫn, các lớp và chi tiết cấu hình, tại Liên kết GitHub.
Phương pháp khảm (mosaicing) tăng cường huấn luyện mô hình với bộ dữ liệu DOTA8 như thế nào?
Mosaic kết hợp nhiều hình ảnh thành một trong quá trình huấn luyện, làm tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi lô. Điều này cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và cảnh khác nhau của đối tượng. Kỹ thuật này có thể được minh họa trực quan thông qua một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu DOTA8 được ghép mosaic, giúp phát triển mô hình mạnh mẽ. Tìm hiểu thêm về kỹ thuật mosaic và huấn luyện trên trang Huấn luyện của chúng tôi.
Tại sao tôi nên sử dụng Ultralytics YOLO11 cho các tác vụ phát hiện đối tượng?
Ultralytics YOLO11 cung cấp các khả năng phát hiện đối tượng theo thời gian thực tiên tiến nhất, bao gồm các tính năng như hộp giới hạn xoay (OBB), phân đoạn thể hiện và quy trình huấn luyện rất linh hoạt. Nó phù hợp với nhiều ứng dụng khác nhau và cung cấp các mô hình được huấn luyện trước để tinh chỉnh hiệu quả. Tìm hiểu thêm về những lợi thế và cách sử dụng trong tài liệu Ultralytics YOLO11.