Link to this sectionDOTA128 数据集#
Link to this section简介#
Ultralytics DOTA128 是一个小型但功能丰富的旋转目标检测数据集,由来自 DOTAv1 的 128 张图像组成,用于训练和验证。该数据集非常适合测试和调试旋转边界框(OBB)模型,或用于尝试新的检测方法。由于仅包含 128 张图像,它既易于管理,又具有足够的差异性,足以用来测试训练流水线中的错误,并在训练更大规模的数据集之前作为一种完整性检查手段。
Link to this section数据集结构#
- 图像:128 张航拍图(全部位于 train 文件夹中,同时用于训练和验证),均来源于 DOTAv1。
- 类别:继承了 DOTAv1 的 15 个类别,例如飞机、船舶和大型车辆。
- 标签:YOLO 格式的旋转边界框,保存为每张图像旁边的
.txt文件。
此数据集旨在与 Ultralytics Platform 和 YOLO26 配合使用。
Link to this section数据集 YAML#
YAML (Yet Another Markup Language) 文件用于定义数据集的配置。它包含有关数据集路径、类别及其他相关信息。对于 DOTA128 数据集,dota128.yaml 文件托管在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipLink to this section用法#
若要使用 640 的图像尺寸在 DOTA128 数据集上训练 YOLO26n-obb 模型 100 个 epoch,你可以使用以下代码片段。有关可用参数的完整列表,请参考模型训练页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Link to this section样本图像和标注#
以下是来自 DOTA128 数据集的一些图像示例,以及它们对应的标注:
- 马赛克图像:此图像展示了一个由马赛克数据集图像组成的训练批次。马赛克是一种在训练期间使用的技术,它将多张图像合并为单张图像,以增加每个训练批次中物体和场景的多样性。这有助于提高模型对不同物体尺寸、宽高比和上下文的泛化能力。
该示例展示了 DOTA128 数据集中图像的多样性和复杂性,以及在训练过程中使用马赛克增强(mosaicing)带来的好处。
Link to this section引用与致谢#
如果你在研究或开发工作中使用 DOTA 数据集,请引用以下论文:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}特别感谢 DOTA 数据集背后的团队,他们为整理此数据集所做的努力值得称赞。如需全面了解该数据集及其细节,请访问 DOTA 官方网站。
Link to this section常见问题解答#
Link to this section什么是 DOTA128 数据集,它该如何使用?#
DOTA128 数据集是一个通用的旋转目标检测数据集,由来自 DOTAv1 的 128 张图像组成,全部存储在 train 文件夹中。训练和验证使用同一组图像,使其非常适合快速测试和调试工作流。它非常适合测试和调试像 Ultralytics YOLO26 这样的 OBB 模型。由于其大小适中且多样性强,它有助于识别流水线错误,并在部署更大规模数据集之前进行完整性检查。了解更多关于 Ultralytics YOLO26 的 OBB 检测信息。
Link to this section如何使用 DOTA128 数据集训练 YOLO26 模型?#
若要使用 640 的图像尺寸在 DOTA128 数据集上训练 YOLO26n-obb 模型 100 个 epoch,你可以使用以下代码片段。有关完整的参数选项,请参考模型训练页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Link to this sectionDOTA 数据集的主要特点是什么,我在哪里可以获取 YAML 文件?#
The DOTA dataset is known for its large-scale benchmark and the challenges it presents for object detection in aerial images. The DOTA128 subset provides more diversity than DOTA8 while remaining manageable for initial tests. You can access the dota128.yaml file, which contains paths, classes, and configuration details, at this GitHub link.
Link to this sectionDOTA128 与其他 DOTA 数据集变体相比如何?#
就规模而言,DOTA128(128 张图像)介于 DOTA8(8 张图像)和完整的 DOTA-v1 数据集(1,869 张图像)之间:
- DOTA8:仅包含 8 张图像(4 张训练,4 张验证)——非常适合快速测试和调试
- DOTA128:包含 128 张图像(全部位于 train 文件夹中,同时用于训练和验证)——在规模和多样性之间取得了平衡
- 完整版 DOTA-v1:包含 1,869 张图像——内容全面但资源消耗较大
DOTA128 提供了一个良好的折中方案,它比 DOTA8 提供了更多的多样性,同时在实验和初步模型开发方面,比完整版 DOTA 数据集更容易管理。
Link to this section马赛克增强如何增强 DOTA128 数据集的模型训练?#
马赛克增强在训练过程中将多张图像合并为一张,从而增加了每个批次中物体和上下文的多样性。这提高了模型对不同物体尺寸、纵横比和场景的泛化能力。通过由马赛克处理过的 DOTA128 数据集图像组成的训练批次,可以直观地展示该技术,从而帮助开发更稳健的模型。在我们的训练页面上探索更多关于马赛克增强和训练技术的内容。
Link to this section为什么我应该使用 Ultralytics YOLO26 进行旋转目标检测任务?#
Ultralytics YOLO26 提供最先进的实时目标检测能力,包括旋转边界框(OBB)、实例分割和功能高度通用的训练管线。它适用于各种应用场景,并提供用于高效微调的预训练模型。在 Ultralytics YOLO26 文档 中进一步探索其优势和用法。