Meet YOLO26: next-gen vision AI.

Link to this section旋转目标检测框 Object Detection#

旋转目标检测比标准目标检测更进一步,它引入了一个额外的角度,以便更准确地定位图像中的物体。

旋转目标检测器的输出是一组旋转后的边界框,它们精确地包围了图像中的物体,并附带每个框的类标签和置信度得分。当物体以各种角度出现时(例如在航空影像中),旋转边界框特别有用,因为传统的轴对齐边界框可能会包含不必要的背景。

提示

YOLO26 OBB 模型使用 -obb 后缀,例如 yolo26n-obb.pt,并且是在 DOTAv1 上预训练的。



Watch: How to Detect & Track Objects with Ultralytics YOLO26 Oriented Bounding Boxes (OBB) | Ship Tracking 🚢

Link to this section视觉样本#

使用 OBB 进行船舶检测使用 OBB 进行车辆检测
使用 OBB 进行船舶检测使用 OBB 进行车辆检测

Link to this section模型#

此处展示了 YOLO26 预训练 OBB 模型,它们是在 DOTAv1 数据集上预训练的。

模型在首次使用时会自动从最新的 Ultralytics 发布中下载。

模型尺寸
(像素)
mAPtest
50-95(e2e)
mAPtest
50(e2e)
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLO26n-obb102452.478.997.7 ± 0.92.8 ± 0.02.514.0
YOLO26s-obb102454.880.9218.0 ± 1.44.9 ± 0.19.855.1
YOLO26m-obb102455.381.0579.2 ± 3.810.2 ± 0.321.2183.3
YOLO26l-obb102456.281.6735.6 ± 3.113.0 ± 0.225.6230.0
YOLO26x-obb102456.781.71485.7 ± 11.530.5 ± 0.957.6516.5
  • mAPtest 值适用于 DOTAv1 数据集上的单模型多尺度测试。
    通过 yolo val obb data=DOTAv1.yaml device=0 split=test 进行复现,并将合并后的结果提交给 DOTA evaluation
  • 速度是在 Amazon EC2 P4d 实例上对 DOTAv1 验证集图像进行平均计算的。
    通过 yolo val obb data=DOTAv1.yaml batch=1 device=0|cpu 进行复现
  • 参数FLOPs 值是 model.fuse() 之后融合模型的数值,它合并了 Conv 和 BatchNorm 层,并且对于端到端模型,移除了辅助的一对多检测头。预训练检查点保留了完整的训练架构,可能会显示更高的计数。

Link to this section训练#

在 DOTA8 数据集上,以 640 的图像尺寸训练 YOLO26n-obb 100 个 epochs。有关可用参数的完整列表,请参阅 Configuration 页面。

注意

OBB 及其 180° 旋转是完全相同的,因此旋转定义为模 180°,且该框没有方向性。在内部,角度以弧度存储并归一化为 [-π/4, 3π/4) ([-45°, 135°)),框的宽度 w 被视为较长的一边,角度定义为从正 x 轴到 w 方向的顺时针角度。[0°, 90°) 形式是正则化的 DOTA 风格约定,不在训练或推理时应用。

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.yaml")  # build a new model from YAML
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-obb.yaml").load("yolo26n-obb.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)


Watch: How to Train Ultralytics YOLO-OBB (Oriented Bounding Boxes) Models on DOTA Dataset using Ultralytics Platform

Link to this section数据集格式#

OBB 数据集格式可以在 Dataset Guide 中找到详细信息。YOLO OBB 格式通过其四个角点来指定边界框,坐标归一化在 0 到 1 之间,遵循此结构。Ultralytics Platform 支持使用专用的旋转边界框绘制工具进行 OBB 标注:

class_index x1 y1 x2 y2 x3 y3 x4 y4

在内部,YOLO 处理损失和输出时采用 xywhr 格式,该格式代表 bounding box 的中心点 (xy)、宽度、高度和旋转。

Link to this section验证#

在 DOTA8 数据集上验证训练后的 YOLO26n-obb 模型 accuracy。不需要额外的参数,因为 model 会保留其训练 data 和参数作为模型属性。

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val(data="dota8.yaml")  # no arguments needed, dataset and settings remembered
metrics.box.map  # map50-95(B)
metrics.box.map50  # map50(B)
metrics.box.map75  # map75(B)
metrics.box.maps  # a list containing mAP50-95(B) for each category
metrics.box.image_metrics  # per-image metrics dictionary with precision, recall, F1, TP, FP, and FN

Link to this section预测#

使用训练好的 YOLO26n-obb 模型对图像进行预测。

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/boats.jpg")  # predict on an image

# Access the results
for result in results:
    xywhr = result.obb.xywhr  # center-x, center-y, width, height, angle (radians)
    xyxyxyxy = result.obb.xyxyxyxy  # polygon format with 4-points
    names = [result.names[cls.item()] for cls in result.obb.cls.int()]  # class name of each box
    confs = result.obb.conf  # confidence score of each box


Watch: How to Detect and Track Storage Tanks using Ultralytics YOLO-OBB | Oriented Bounding Boxes | DOTA

See full predict mode details in the Predict page.

Link to this section结果输出#

旋转边界框检测为每张图像返回一个 Results 对象。主要的预测字段是 result.obb,它包含每个检测到的物体的旋转框、类 ID 和置信度得分。

属性类型形状描述
result.obbOBB(N)旋转框。
result.obb.datatorch.float32(N,7/8)带置信度/类别的原始旋转框。
result.obb.xywhrtorch.float32(N,5)xywhr 旋转框。
result.obb.xyxyxyxytorch.float32(N,4,2)四个角点。
result.obb.conftorch.float32(N,)置信度分数。

有关各项任务特定的 Results 字段,请参阅 按任务划分的预测结果 部分。

Link to this section导出#

将 YOLO26n-obb 模型导出为 ONNX、CoreML 等其他格式。

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom-trained model

# Export the model
model.export(format="onnx")

可用的 YOLO26-obb 导出格式如下表所示。你可以使用 format 参数导出为任何格式,例如 format='onnx'format='engine'。你可以直接在导出的模型上进行预测或验证,例如 yolo predict model=yolo26n-obb.onnx。导出完成后,将向你展示模型的使用示例。

格式format 参数模型元数据参数
PyTorch-yolo26n-obb.pt-
TorchScripttorchscriptyolo26n-obb.torchscriptimgsz, half, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-obb.onnximgsz, half, int8, dynamic, simplify, opset, nms, batch, data, fraction, device
OpenVINOopenvinoyolo26n-obb_openvino_model/imgsz, half, dynamic, int8, nms, batch, data, fraction, device
TensorRTengineyolo26n-obb.engineimgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-obb.mlpackageimgsz, dynamic, half, int8, nms, batch, device
TF SavedModelsaved_modelyolo26n-obb_saved_model/imgsz, keras, int8, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-obb.pbimgsz, batch, device
TF Litetfliteyolo26n-obb.tfliteimgsz, half, int8, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n-obb_edgetpu.tfliteimgsz, int8, data, fraction, device
TF.jstfjsyolo26n-obb_web_model/imgsz, half, int8, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n-obb_paddle_model/imgsz, batch, device
MNNmnnyolo26n-obb.mnnimgsz, batch, int8, half, device
NCNNncnnyolo26n-obb_ncnn_model/imgsz, half, batch, device
IMX500imxyolo26n-obb_imx_model/imgsz, int8, data, fraction, nms, device
RKNNrknnyolo26n-obb_rknn_model/imgsz, batch, name, int8, data, fraction, device
ExecuTorchexecutorchyolo26n-obb_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-obb_axelera_model/imgsz, batch, int8, data, fraction, device
DEEPXdeepxyolo26n-obb_deepx_model/imgsz, int8, data, optimize, device
Qualcomm QNNqnnyolo26n-obb_qnn_model/imgsz, batch, name, int8, data, fraction, device

See full export details in the Export page.

Link to this section实际应用场景#

YOLO26 的 OBB 检测在多个行业中有大量实际应用:

  • 海事与港口管理:针对 fleet management 和监控,以各种角度检测船舶和舰艇。
  • 城市规划:从航空影像分析建筑物和基础设施。
  • 农业:从无人机拍摄的视频中监测农作物和农业设备。
  • 能源领域:在不同方向上检查太阳能电池板和风力涡轮机。
  • 交通运输:从各种视角跟踪道路和停车场上的车辆。

这些应用受益于 OBB 能够精确拟合任何角度下的物体,提供比传统边界框更准确的检测效果。

Link to this section常见问题解答 (FAQ)#

Link to this section什么是旋转边界框(OBB),它们与普通边界框有何不同?#

旋转边界框(OBB)增加了一个角度,以提高图像中物体定位的准确性。与作为轴对齐矩形的普通边界框不同,OBB 可以旋转以更好地适应物体的方向。这对于需要精确物体放置的应用(例如航空或卫星图像)特别有用(参考 数据集指南)。

Link to this section如何使用自定义数据集训练 YOLO26n-obb 模型?#

要使用自定义数据集训练 YOLO26n-obb 模型,请参照以下 Python 或 CLI 示例:

示例
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-obb.pt")

# Train the model
results = model.train(data="path/to/custom_dataset.yaml", epochs=100, imgsz=640)

关于更多训练参数,请查看 配置 部分。

Link to this section我可以使用哪些数据集来训练 YOLO26-OBB 模型?#

YOLO26-OBB 模型已在 DOTAv1 等数据集上进行了预训练,但你也可以使用任何格式化为 OBB 的数据集。关于 OBB 数据集格式的详细信息,请参见 数据集指南

Link to this section如何将 YOLO26-OBB 模型导出为 ONNX 格式?#

使用 Python 或 CLI 将 YOLO26-OBB 模型导出为 ONNX 格式非常简单:

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")

# Export the model
model.export(format="onnx")

有关更多导出格式和详细信息,请参考 导出 页面。

Link to this section如何验证 YOLO26n-obb 模型的准确性?#

要验证 YOLO26n-obb 模型,你可以使用如下所示的 Python 或 CLI 命令:

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")

# Validate the model
metrics = model.val(data="dota8.yaml")

验证 部分查看完整的验证详情。

评论