旋转框 (OBB) 数据集概览

训练一个精确的 目标检测 模型并使用旋转框 (OBB) 需要一个完整的数据集。本指南介绍了与 Ultralytics YOLO 模型兼容的各种 OBB 数据集格式,并提供了有关其结构、应用以及格式转换方法的见解。

支持的 OBB 数据集格式

YOLO OBB 格式

YOLO OBB 格式通过其四个角点坐标来指定边界框,坐标归一化在 0 到 1 之间。它遵循以下格式:

class_index x1 y1 x2 y2 x3 y3 x4 y4

在内部,YOLO 以 xywhr 格式处理损失和输出,该格式表示 边界框 的中心点 (xy)、宽度、高度和旋转角度。

Oriented bounding box annotation format examples

上述图像对应的 *.txt 标签文件示例(包含一个 OBB 格式的 0 类对象)如下所示:

0 0.780811 0.743961 0.782371 0.74686 0.777691 0.752174 0.776131 0.749758

数据集 YAML 格式

Ultralytics 框架使用 YAML 文件格式来定义用于训练 OBB 模型的数据集和模型配置。以下是用于定义 OBB 数据集的 YAML 格式示例:

ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

使用方法

要使用这些 OBB 格式训练模型:

示例
from ultralytics import YOLO

# Create a new YOLO26n-OBB model from scratch
model = YOLO("yolo26n-obb.yaml")

# Train the model on the DOTAv1 dataset
results = model.train(data="DOTAv1.yaml", epochs=100, imgsz=1024)

支持的数据集

目前支持以下带旋转框的数据集:

  • DOTA-v1:DOTA 数据集的第一个版本,提供了一套全面的航拍图像,带有用于目标检测的旋转框。
  • DOTA-v1.5:DOTA 数据集的中间版本,在 DOTA-v1 的基础上提供了额外的标注和改进,以增强目标检测任务的效果。
  • DOTA-v2:DOTA(航拍图像目标检测大型数据集)第 2 版,强调从空中视角进行检测,包含 170 万个实例和 11,268 张带有旋转框的图像。
  • DOTA8:完整 DOTA 数据集的一个小型 8 图像子集,适用于测试工作流以及在 ultralytics 仓库中进行 OBB 训练的持续集成 (CI) 检查。
  • DOTA128:DOTA 数据集的一个 128 图像子集,train 文件夹中的所有图像(同时用于训练和验证),在规模和多样性之间提供了良好的平衡,适合测试 OBB 模型。

集成你自己的 OBB 数据集

如果你想引入自己的带旋转框数据集,请确保与上述“YOLO OBB 格式”兼容。将你的标注转换为此所需格式,并在相应的 YAML 配置文件中详细说明路径、类别和类别名称。

转换标签格式

DOTA 数据集格式到 YOLO OBB 格式

使用此脚本可以将标签从 DOTA 数据集格式转换为 YOLO OBB 格式:

示例
from ultralytics.data.converter import convert_dota_to_yolo_obb

convert_dota_to_yolo_obb("path/to/DOTA")

这种转换机制对于 DOTA 格式的数据集非常有用,确保了与 Ultralytics YOLO OBB 格式的一致性。

必须验证数据集与模型的兼容性,并遵守必要的格式约定。结构良好的数据集对于训练高效的旋转框目标检测模型至关重要。

常见问题 (FAQ)

什么是旋转框 (OBB),它们如何在 Ultralytics YOLO 模型中使用?

旋转框 (OBB) 是一种边界框标注类型,它可以通过旋转来更紧密地贴合被检测对象,而不只是轴对齐的框。这在航空或卫星图像中特别有用,因为对象可能不会与图像轴对齐。在 Ultralytics YOLO 模型中,OBB 由 YOLO OBB 格式中的四个角点表示。这允许更精确的目标检测,因为边界框可以旋转以更好地适应对象。

如何将现有的 DOTA 数据集标签转换为 YOLO OBB 格式以用于 Ultralytics YOLO26?

你可以使用 Ultralytics 中的 convert_dota_to_yolo_obb 函数将 DOTA 数据集标签转换为 YOLO OBB 格式。这种转换确保了与 Ultralytics YOLO 模型的兼容性,使你能够利用 OBB 功能来增强目标检测。这是一个简单的示例:

from ultralytics.data.converter import convert_dota_to_yolo_obb

convert_dota_to_yolo_obb("path/to/DOTA")

此脚本会将你的 DOTA 标注重新格式化为 YOLO 兼容的格式。

如何在我的数据集上训练带有旋转框 (OBB) 的 YOLO26 模型?

训练带有 OBB 的 YOLO26 模型需要确保你的数据集处于 YOLO OBB 格式,然后使用 Ultralytics API 进行训练。以下是 Python 和 CLI 的示例:

示例
from ultralytics import YOLO

# Create a new YOLO26n-OBB model from scratch
model = YOLO("yolo26n-obb.yaml")

# Train the model on the custom dataset
results = model.train(data="your_dataset.yaml", epochs=100, imgsz=640)

这确保了你的模型利用详细的 OBB 标注来提高检测 精度

Ultralytics YOLO 模型中目前支持哪些用于 OBB 训练的数据集?

目前,Ultralytics 支持以下用于 OBB 训练的数据集:

  • DOTA-v1:DOTA 数据集的第一个版本,提供了一套全面的航拍图像,带有用于目标检测的旋转框。
  • DOTA-v1.5:DOTA 数据集的中间版本,在 DOTA-v1 的基础上提供了额外的标注和改进,以增强目标检测任务的效果。
  • DOTA-v2:此数据集包含 170 万个带有旋转框的实例和 11,268 张图像,主要专注于空中目标检测。
  • DOTA8:DOTA 数据集的一个较小的 8 图像子集,用于测试和 持续集成 (CI) 检查。
  • DOTA128:一个 128 图像的子集,train 文件夹中的所有图像(同时用于训练和验证),与 DOTA8 相比提供了更多样性,同时仍易于管理,适合初步的 OBB 模型开发和实验。

这些数据集专为 OBB 具有显着优势的场景而定制,例如航空和卫星图像分析。

我可以使用自己的带旋转框数据集进行 YOLO26 训练吗?如果可以,怎么做?

可以,你可以使用自己的带旋转框数据集进行 YOLO26 训练。请确保你的数据集标注已转换为 YOLO OBB 格式,这涉及通过四个角点定义边界框。然后,你可以创建一个 YAML 配置文件,指定数据集路径、类别和其他必要细节。有关创建和配置数据集的更多信息,请参考 支持的数据集 部分。

评论