实例分割数据集概览

Q: How can I convert COCO dataset annotations to the YOLO format?

使用 Ultralytics 工具将 COCO 格式标注转换为 YOLO 格式非常简单。您可以使用 ultralytics.data.converter 模块中的 convert_coco 函数：此脚本将您的 COCO 数据集标注转换为所需的 YOLO 格式，使其适用于训练您的 YOLO 模型。有关更多详细信息，请参阅移植或转换标签格式。

实例分割是一项计算机视觉任务，涉及识别和描绘图像中的各个对象。本指南概述了 Ultralytics YOLO 支持的实例分割任务的数据集格式，以及有关如何准备、转换和使用这些数据集来训练模型的说明。

支持的数据集格式

Ultralytics YOLO 格式

用于训练 YOLO 分割模型的数据集标签格式如下：

每个图像对应一个文本文件：数据集中的每个图像都有一个对应的文本文件，该文本文件与图像文件同名，扩展名为 ".txt"。
每行一个对象：文本文件中的每一行对应于图像中的一个对象实例。
每行包含的对象信息：每行包含关于对象实例的以下信息：
- 对象类别索引：一个整数，表示对象的类别（例如，0 代表人，1 代表汽车等）。
- 对象边界坐标：围绕掩码区域的边界坐标，已归一化到 0 和 1 之间。

分割数据集中单行的格式如下：

<class-index> <x1> <y1> <x2> <y2> ... <xn> <yn>

在这种格式中， <class-index> 是对象类别的索引，以及 <x1> <y1> <x2> <y2> ... <xn> <yn> 是对象segmentation掩码的归一化多边形坐标（值在 [0, 1] 相对于图像宽度和高度）。坐标之间用空格分隔。

以下是一个YOLO数据集格式的示例，用于包含两个对象的单张图像，其中一个对象由3点segment组成，另一个由5点segment组成。

0 0.681 0.485 0.670 0.487 0.676 0.487
1 0.504 0.000 0.501 0.004 0.498 0.004 0.493 0.010 0.492 0.0104

提示

每行的长度不必相等。
每个分割标签必须有一个 最少 3 个 (x, y) 点: <class-index> <x1> <y1> <x2> <y2> <x3> <y3>

数据集 YAML 格式

Ultralytics 框架使用 YAML 文件格式来定义训练分割模型的数据集和模型配置。以下是用于定义分割数据集的 YAML 格式示例：

Ultralytics/cfg/datasets/COCO8-seg.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-seg ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zip

字段 train 和 val 分别指定包含训练和验证图像的目录的路径。

names 是一个类名字典。名称的顺序应与 YOLO 数据集文件中对象类索引的顺序相匹配。

用法

示例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo segment train data=coco8-seg.yaml model=yolo26n-seg.pt epochs=100 imgsz=640

支持的数据集

Ultralytics YOLO 支持各种用于实例分割任务的数据集。以下是最常用的数据集列表：

Carparts-seg：一个专门用于汽车零件分割的数据集，非常适合汽车应用。它包括各种车辆，并对各个汽车组件进行了详细的标注。
COCO：一个用于目标检测、分割和图像描述的综合数据集，包含超过 20 万张带有标签的图像，涵盖各种类别。
COCO8-分割：COCO 的一个紧凑的 8 图像子集，专为快速测试分割模型训练而设计，非常适合 CI 检查和工作流程验证。 ultralytics 仓库。
COCO128-seg：一个较小的用于实例分割任务的数据集，包含 COCO 的 128 个带有分割注释的图像子集。
Crack-seg：一个专门用于分割各种表面裂缝的数据集。对于基础设施维护和质量控制至关重要，它提供了详细的图像，用于训练模型以识别结构弱点。
Package-seg：一个专门用于分割不同类型包装材料和形状的数据集。它对于物流和仓库自动化特别有用，有助于开发用于包装处理和分拣的系统。

添加您自己的数据集

如果您有自己的数据集并希望将其用于使用 Ultralytics YOLO 格式训练分割模型，请确保其遵循上述“Ultralytics YOLO 格式”中指定的格式。将您的标注转换为所需格式，并在 YAML 配置文件中指定路径、类别数量和类别名称。请将 images/ 和 labels/ 作为同一级别的独立文件夹，并具有匹配的子文件夹结构；将标签 .txt 文件放置在图像文件夹中可能会导致模型遗漏标签。

导入或转换标签格式

COCO 数据集格式转 YOLO 格式

您可以使用以下代码片段，轻松地将标签从流行的 COCO 数据集格式转换为 YOLO 格式：

示例

Python

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/", use_segments=True)

此转换工具可用于将 COCO 数据集或任何 COCO 格式的数据集转换为 Ultralytics YOLO 格式。

请务必仔细检查您要使用的数据集是否与您的模型兼容并遵循必要的格式约定。格式正确的数据集对于训练成功的分割模型至关重要。

自动标注

自动标注是一项关键功能，它允许您利用预训练的检测模型生成分割数据集。借助该功能，您可以快速、准确地对大量图像进行标注，无需人工标注，从而节省时间和精力。

使用检测模型生成分割数据集

要使用 Ultralytics 框架自动标注您的数据集，您可以使用 auto_annotate function 如下所示：

示例

Python

from ultralytics.data.annotator import auto_annotate

auto_annotate(data="path/to/images", det_model="yolo26x.pt", sam_model="sam_b.pt")

参数	类型	默认值	描述
`data`	`str`	必需	包含用于标注或分割的目标图像的目录路径。
`det_model`	`str`	`'yolo26x.pt'`	YOLO 检测模型路径，用于初始对象检测。
`sam_model`	`str`	`'sam_b.pt'`	SAM 模型路径，用于 segment（支持 SAM、SAM2 变体和 MobileSAM 模型）。
`device`	`str`	`''`	计算设备（例如，'cuda:0'、'cpu'，或者 '' 表示自动设备检测）。
`conf`	`float`	`0.25`	YOLO 检测置信度阈值，用于过滤弱检测。
`iou`	`float`	`0.45`	用于非极大值抑制的 IoU 阈值，以过滤重叠框。
`imgsz`	`int`	`640`	调整图像大小的输入尺寸（必须是 32 的倍数）。
`max_det`	`int`	`300`	为了提高内存效率，每张图像的最大检测数量。
`classes`	`list[int]`	`None`	要 detect 的类别索引列表（例如， `[0, 1]` 适用于人和自行车）。
`output_dir`	`str`	`None`	用于保存标注的目录（默认为相对于数据路径的 '.\/labels'）。

字段 auto_annotate 函数接受您的图像路径，以及用于指定预训练的 detect 模型的可选参数，例如： YOLO26, YOLO11 或其他模型以及分割模型，例如 SAM, SAM2 或 MobileSAM，运行模型的设备，以及用于保存带注释结果的输出目录。

通过利用预训练模型的强大功能，自动标注可以显著减少创建高质量分割数据集所需的时间和精力。此功能对于处理大量图像集合的研究人员和开发人员特别有用，因为它使他们能够专注于模型开发和评估，而不是手动标注。

可视化数据集标注

在训练模型之前，可视化数据集标注通常很有帮助，以确保它们的正确性。Ultralytics为此目的提供了一个实用函数：

from ultralytics.data.utils import visualize_image_annotations

label_map = {  # Define the label map with all annotated class labels.
    0: "person",
    1: "car",
}

# Visualize
visualize_image_annotations(
    "path/to/image.jpg",  # Input image path.
    "path/to/annotations.txt",  # Annotation file path for the image.
    label_map,
)

此函数绘制边界框，使用类名称标记对象，并调整文本颜色以提高可读性，从而帮助您在训练前识别并纠正任何注释错误。

将分割掩码转换为 YOLO 格式

如果您的分割掩码是二进制格式，您可以使用以下方法将其转换为 YOLO 分割格式：

from ultralytics.data.converter import convert_segment_masks_to_yolo_seg

# For datasets like COCO with 80 classes
convert_segment_masks_to_yolo_seg(masks_dir="path/to/masks_dir", output_dir="path/to/output_dir", classes=80)

此实用程序将二进制掩码图像转换为YOLO分割格式，并将其保存在指定的输出目录中。

常见问题

Ultralytics YOLO 支持哪些用于实例分割的数据集格式？

Ultralytics YOLO 支持多种实例分割数据集格式，其中主要格式是其自身的 Ultralytics YOLO 格式。数据集中的每张图像都需要一个对应的文本文件，其中包含对象信息，这些信息被分割成多行（每行一个对象），列出类别索引和归一化的边界框坐标。有关 YOLO 数据集格式的更多详细说明，请访问实例分割数据集概述。

如何将 COCO 数据集标注转换为 YOLO 格式？

使用 Ultralytics 工具将 COCO 格式标注转换为 YOLO 格式非常简单。您可以使用 convert_coco 中的 ultralytics.data.converter 模块：

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/", use_segments=True)

此脚本将您的COCO数据集标注转换为所需的YOLO格式，使其适用于训练您的YOLO模型。有关更多详细信息，请参阅移植或转换标签格式。

如何准备 YAML 文件以用于训练 Ultralytics YOLO 模型？

要准备一个 YAML 文件以使用 Ultralytics 训练 YOLO 模型，您需要定义数据集路径和类名。这是一个 YAML 配置示例：

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-seg ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zip

请确保根据您的数据集更新路径和类名。有关更多信息，请查看 Dataset YAML Format 部分。

Ultralytics YOLO 中的自动标注功能是什么？

Ultralytics YOLO 中的自动标注允许您使用预训练的检测模型为您的数据集生成分割标注。这显著减少了手动标注的需求。您可以使用 auto_annotate function 如下：

from ultralytics.data.annotator import auto_annotate

auto_annotate(data="path/to/images", det_model="yolo26x.pt", sam_model="sam_b.pt")  # or sam_model="mobile_sam.pt"