Link to this sectionDOTA128 数据集#
Link to this section介绍#
Ultralytics DOTA128 是一个小型但功能丰富的旋转目标检测数据集,由 DOTAv1 数据集中的 128 张图像组成,用于训练和验证。该数据集非常适合测试和调试旋转边界框 (OBB) 模型,或者用于尝试新的检测方法。由于只有 128 张图像,它既小巧易用,又足够多样化,可以用来测试训练流水线中的错误,并在训练大型数据集之前作为健全性检查。
Link to this section数据集结构#
- 图像:128 张航空遥感影像切片(全部位于 train 文件夹中,同时用于训练和验证),源自 DOTAv1。
- 类别:继承了 DOTAv1 的 15 个类别,例如飞机、船只和大型车辆。
- 标签:以 YOLO 格式存储的旋转边界框,保存为每张图像旁边的
.txt文件。
此数据集旨在与 Ultralytics Platform 和 YOLO26 配合使用。
Link to this section数据集 YAML#
YAML (Yet Another Markup Language) 文件用于定义数据集配置。它包含有关数据集路径、类别及其他相关信息。对于 DOTA128 数据集,dota128.yaml 文件维护在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipLink to this section使用方法#
若要在 DOTA128 数据集上使用 640 的图像尺寸训练 YOLO26n-obb 模型 100 个 epoch,你可以使用以下代码片段。有关可用参数的完整列表,请参考模型训练页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Link to this section样本图像和标注#
以下是 DOTA128 数据集中的一些图像示例及其相应的标注:
- 马赛克图像:此图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练期间使用的技术,它将多张图像合并为单张图像,以增加每个训练批次中目标和场景的多样性。这有助于提高模型对不同目标尺寸、长宽比和上下文的泛化能力。
该示例展示了 DOTA128 数据集中图像的多样性和复杂性,以及在训练过程中使用马赛克增强 (mosaicing) 的好处。
Link to this section引文与致谢#
如果你在研究或开发工作中使用了 DOTA 数据集,请引用以下论文:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}特别感谢 DOTA 数据集背后的团队在整理此数据集方面所做的卓越努力。如需全面了解数据集及其细节,请访问 DOTA 官方网站。
Link to this section常见问题 (FAQ)#
Link to this section什么是 DOTA128 数据集,它如何使用?#
DOTA128 数据集是一个通用的旋转目标检测数据集,由 DOTAv1 数据集中的 128 张图像组成,全部存储在 train 文件夹中。训练和验证均使用同一组图像,使其非常适合快速测试和调试工作流。它对于测试和调试 Ultralytics YOLO26 等 OBB 模型非常理想。由于其规模可控且具有多样性,它有助于识别流水线错误,并在部署大型数据集之前进行健全性检查。通过 Ultralytics YOLO26 了解更多关于 OBB 检测的信息。
Link to this section如何使用 DOTA128 数据集训练 YOLO26 模型?#
若要在 DOTA128 数据集上以 640 的图像尺寸训练 YOLO26n-obb 模型 100 个 epoch,你可以使用以下代码片段。有关完整的参数选项,请参阅模型训练页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Link to this sectionDOTA 数据集的主要特点是什么,在哪里可以访问 YAML 文件?#
The DOTA dataset is known for its large-scale benchmark and the challenges it presents for object detection in aerial images. The DOTA128 subset provides more diversity than DOTA8 while remaining manageable for initial tests. You can access the dota128.yaml file, which contains paths, classes, and configuration details, at this GitHub link.
Link to this sectionDOTA128 与其他 DOTA 数据集变体相比如何?#
就规模而言,DOTA128(128 张图像)介于 DOTA8(8 张图像)和完整的 DOTA-v1 数据集(1,869 张图像)之间:
- DOTA8:仅包含 8 张图像(4 张训练,4 张验证)——非常适合快速测试和调试。
- DOTA128:包含 128 张图像(全部在 train 文件夹中,同时用于训练和验证)——在规模和多样性之间取得了平衡。
- 完整版 DOTA-v1:包含 1,869 张图像——内容全面但资源消耗大。
DOTA128 提供了一个很好的折中方案,它比 DOTA8 更多样化,同时在进行实验和初期模型开发时比完整版 DOTA 数据集更易于管理。
Link to this section马赛克增强 (mosaicing) 如何增强使用 DOTA128 数据集的模型训练?#
马赛克增强在训练期间将多张图像合并为一张,从而增加了每个批次中物体和场景的多样性。这提高了模型对不同物体尺寸、长宽比和场景的泛化能力。该技术可以通过由马赛克化的 DOTA128 数据集图像组成的训练批次直观地展示,有助于稳健的模型开发。在我们的训练页面上探索更多关于马赛克增强和训练技术的知识。
Link to this section为什么我应该使用 Ultralytics YOLO26 进行旋转目标检测任务?#
Ultralytics YOLO26 提供最先进的实时目标检测能力,包括旋转边界框 (OBB)、实例分割和高度通用的训练流水线等功能。它适用于各种应用场景,并提供预训练模型以实现高效的微调。在 Ultralytics YOLO26 文档 中深入了解其优势和用法。