DOTA128 数据集

简介

Ultralytics DOTA128 是一个小型但功能全面的旋转 目标检测 数据集,由来自 DOTAv1 集的 128 张图像组成,用于训练和验证。该数据集非常适合测试和调试旋转目标检测 (OBB) 模型,或用于试验新的检测方法。由于只有 128 张图像,它既易于管理,又具有足够的多样性,可用于测试训练流程是否存在错误,并在训练大型数据集前充当完整性检查。

数据集结构

  • 图像: 128 张航空瓦片(均位于 train 文件夹中,同时用于训练和验证),均来自 DOTAv1。
  • 类别: 继承了 DOTAv1 的 15 个类别,如飞机、船舶和大型车辆。
  • 标签: YOLO 格式的旋转框标注文件,保存在每张图像对应的 .txt 文件中。

此数据集旨在与 Ultralytics PlatformYOLO26.

数据集 YAML

YAML (Yet Another Markup Language) 文件用于定义数据集配置。它包含有关数据集路径、类别及其他相关信息。对于 DOTA128 数据集,dota128.yaml 文件维护在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

要开始训练 YOLO26 模型,请确保你的数据集格式正确,并在 YAML 文件中定义了路径。使用以下脚本开始训练:

要在 DOTA128 数据集上训练 YOLO26n-obb 模型 100 epochs 的训练,你可以使用以下代码片段。有关可用参数的完整列表,请参考模型 训练页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

样本图像和标注

以下是来自 DOTA128 数据集的一些图像示例及其相应的标注:

DOTA128 oriented bounding box dataset training mosaic
  • 马赛克图像:此图像展示了一个由马赛克数据集图像组成的训练批次。马赛克(Mosaic)是一种在训练过程中使用的技术,它将多张图像合并为一张图像,以增加每个训练批次中对象和场景的多样性。这有助于提高模型对不同对象尺寸、纵横比和上下文的泛化能力。

该示例展示了 DOTA128 数据集中图像的多样性和复杂性,以及在训练过程中使用镶嵌 (mosaicing) 技术的好处。

引用与致谢

如果你在研究或开发工作中使用 DOTA 数据集,请引用以下论文:

引用
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

特别感谢 DOTA 数据集背后的团队,感谢他们在策划该数据集方面所做的卓越贡献。欲全面了解该数据集及其细节,请访问 DOTA 官方网站.

FAQ

什么是 DOTA128 数据集,如何使用它?

DOTA128 数据集是一个通用的旋转目标检测数据集,由来自 DOTAv1 集的 128 张图像组成,全部存储在 train 文件夹中。训练和验证使用同一组图像,使其非常适合快速测试和调试工作流。它非常适合测试和调试 Ultralytics YOLO26 等 OBB 模型。由于其大小适中且具有多样性,它有助于在部署大型数据集之前识别流程错误并进行完整性检查。了解更多关于 OBB 检测的信息,请查看 Ultralytics YOLO26.

如何使用 DOTA128 数据集训练 YOLO26 模型?

要在 DOTA128 数据集上以 640 的图像尺寸训练 YOLO26n-obb 模型 100 个 epoch,你可以使用以下代码片段。有关完整的参数选项,请参阅模型 训练页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

DOTA 数据集的主要特点是什么,在哪里可以访问 YAML 文件?

DOTA 数据集以其大规模基准测试以及在航空图像目标检测中带来的挑战而闻名。DOTA128 子集比 DOTA8 提供了更多样性,同时对于初步测试而言依然易于管理。你可以访问 dota128.yaml 文件(包含路径、类别和配置详情)访问,链接地址为 GitHub 链接.

DOTA128 与其他 DOTA 数据集变体相比如何?

在规模上,DOTA128 (128 张图像) 介于 DOTA8(8 张图像)和完整 DOTA-v1 数据集 (1,869 张图像) 之间:

  • DOTA8: 仅包含 8 张图像(4 张训练,4 张验证)——是快速测试和调试的理想选择
  • DOTA128: 包含 128 张图像(均在 train 文件夹中,用于训练和验证)——在规模和多样性之间取得了平衡
  • Full DOTA-v1: 包含 1,869 张图像——内容全面但资源密集

DOTA128 提供了一个良好的中间地带,它比 DOTA8 提供了更多样性,同时在实验和初始模型开发方面比完整的 DOTA 数据集更易于管理。

镶嵌 (mosaicing) 如何增强使用 DOTA128 数据集的模型训练效果?

镶嵌技术在训练过程中将多张图像合并为一张,增加了每个批次中物体和上下文的多样性。这提高了模型对不同物体尺寸、长宽比和场景的泛化能力。通过由镶嵌后的 DOTA128 数据集图像组成的训练批次,可以直观地演示该技术,从而助力稳健的模型开发。探索更多关于镶嵌和训练技术的信息,请访问我们的 训练页面。

为什么你应该使用 Ultralytics YOLO26 来执行旋转目标检测任务?

Ultralytics YOLO26 提供前沿的实时目标检测能力,包括旋转框 (OBB)、实例分割 以及功能强大的训练流水线。它适用于各种应用场景,并提供预训练模型以实现高效的微调。探索更多关于其优势和用法,请参阅 Ultralytics YOLO26 文档.

评论