旋转框 (OBB) 数据集概览
训练一个精确的 目标检测 模型并使用旋转框 (OBB) 需要一个完整的数据集。本指南介绍了与 Ultralytics YOLO 模型兼容的各种 OBB 数据集格式,并提供了有关其结构、应用以及格式转换方法的见解。
支持的 OBB 数据集格式
YOLO OBB 格式
YOLO OBB 格式通过其四个角点坐标来指定边界框,坐标归一化在 0 到 1 之间。它遵循以下格式:
class_index x1 y1 x2 y2 x3 y3 x4 y4在内部,YOLO 以 xywhr 格式处理损失和输出,该格式表示 边界框 的中心点 (xy)、宽度、高度和旋转角度。

上述图像对应的 *.txt 标签文件示例(包含一个 OBB 格式的 0 类对象)如下所示:
0 0.780811 0.743961 0.782371 0.74686 0.777691 0.752174 0.776131 0.749758数据集 YAML 格式
Ultralytics 框架使用 YAML 文件格式来定义用于训练 OBB 模型的数据集和模型配置。以下是用于定义 OBB 数据集的 YAML 格式示例:
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip使用方法
要使用这些 OBB 格式训练模型:
from ultralytics import YOLO
# Create a new YOLO26n-OBB model from scratch
model = YOLO("yolo26n-obb.yaml")
# Train the model on the DOTAv1 dataset
results = model.train(data="DOTAv1.yaml", epochs=100, imgsz=1024)支持的数据集
目前支持以下带旋转框的数据集:
- DOTA-v1:DOTA 数据集的第一个版本,提供了一套全面的航拍图像,带有用于目标检测的旋转框。
- DOTA-v1.5:DOTA 数据集的中间版本,在 DOTA-v1 的基础上提供了额外的标注和改进,以增强目标检测任务的效果。
- DOTA-v2:DOTA(航拍图像目标检测大型数据集)第 2 版,强调从空中视角进行检测,包含 170 万个实例和 11,268 张带有旋转框的图像。
- DOTA8:完整 DOTA 数据集的一个小型 8 图像子集,适用于测试工作流以及在
ultralytics仓库中进行 OBB 训练的持续集成 (CI) 检查。 - DOTA128:DOTA 数据集的一个 128 图像子集,train 文件夹中的所有图像(同时用于训练和验证),在规模和多样性之间提供了良好的平衡,适合测试 OBB 模型。
集成你自己的 OBB 数据集
如果你想引入自己的带旋转框数据集,请确保与上述“YOLO OBB 格式”兼容。将你的标注转换为此所需格式,并在相应的 YAML 配置文件中详细说明路径、类别和类别名称。
转换标签格式
DOTA 数据集格式到 YOLO OBB 格式
使用此脚本可以将标签从 DOTA 数据集格式转换为 YOLO OBB 格式:
from ultralytics.data.converter import convert_dota_to_yolo_obb
convert_dota_to_yolo_obb("path/to/DOTA")这种转换机制对于 DOTA 格式的数据集非常有用,确保了与 Ultralytics YOLO OBB 格式的一致性。
必须验证数据集与模型的兼容性,并遵守必要的格式约定。结构良好的数据集对于训练高效的旋转框目标检测模型至关重要。
常见问题 (FAQ)
什么是旋转框 (OBB),它们如何在 Ultralytics YOLO 模型中使用?
旋转框 (OBB) 是一种边界框标注类型,它可以通过旋转来更紧密地贴合被检测对象,而不只是轴对齐的框。这在航空或卫星图像中特别有用,因为对象可能不会与图像轴对齐。在 Ultralytics YOLO 模型中,OBB 由 YOLO OBB 格式中的四个角点表示。这允许更精确的目标检测,因为边界框可以旋转以更好地适应对象。
如何将现有的 DOTA 数据集标签转换为 YOLO OBB 格式以用于 Ultralytics YOLO26?
你可以使用 Ultralytics 中的 convert_dota_to_yolo_obb 函数将 DOTA 数据集标签转换为 YOLO OBB 格式。这种转换确保了与 Ultralytics YOLO 模型的兼容性,使你能够利用 OBB 功能来增强目标检测。这是一个简单的示例:
from ultralytics.data.converter import convert_dota_to_yolo_obb
convert_dota_to_yolo_obb("path/to/DOTA")此脚本会将你的 DOTA 标注重新格式化为 YOLO 兼容的格式。
如何在我的数据集上训练带有旋转框 (OBB) 的 YOLO26 模型?
训练带有 OBB 的 YOLO26 模型需要确保你的数据集处于 YOLO OBB 格式,然后使用 Ultralytics API 进行训练。以下是 Python 和 CLI 的示例:
from ultralytics import YOLO
# Create a new YOLO26n-OBB model from scratch
model = YOLO("yolo26n-obb.yaml")
# Train the model on the custom dataset
results = model.train(data="your_dataset.yaml", epochs=100, imgsz=640)这确保了你的模型利用详细的 OBB 标注来提高检测 精度。
Ultralytics YOLO 模型中目前支持哪些用于 OBB 训练的数据集?
目前,Ultralytics 支持以下用于 OBB 训练的数据集:
- DOTA-v1:DOTA 数据集的第一个版本,提供了一套全面的航拍图像,带有用于目标检测的旋转框。
- DOTA-v1.5:DOTA 数据集的中间版本,在 DOTA-v1 的基础上提供了额外的标注和改进,以增强目标检测任务的效果。
- DOTA-v2:此数据集包含 170 万个带有旋转框的实例和 11,268 张图像,主要专注于空中目标检测。
- DOTA8:DOTA 数据集的一个较小的 8 图像子集,用于测试和 持续集成 (CI) 检查。
- DOTA128:一个 128 图像的子集,train 文件夹中的所有图像(同时用于训练和验证),与 DOTA8 相比提供了更多样性,同时仍易于管理,适合初步的 OBB 模型开发和实验。
这些数据集专为 OBB 具有显着优势的场景而定制,例如航空和卫星图像分析。
我可以使用自己的带旋转框数据集进行 YOLO26 训练吗?如果可以,怎么做?
可以,你可以使用自己的带旋转框数据集进行 YOLO26 训练。请确保你的数据集标注已转换为 YOLO OBB 格式,这涉及通过四个角点定义边界框。然后,你可以创建一个 YAML 配置文件,指定数据集路径、类别和其他必要细节。有关创建和配置数据集的更多信息,请参考 支持的数据集 部分。