Meet YOLO26: next-gen vision AI.

Link to this section数据准备#

数据准备是成功的 计算机视觉 模型的基础。Ultralytics Platform 提供了全方位的工具,用于管理你的训练数据,涵盖从上传、标注到分析的整个流程。



Watch: Get Started with Ultralytics Platform - Data

Link to this section概览#

Ultralytics Platform 的“数据”部分旨在帮助你:

  • 上传 图片、视频及数据集文件(ZIP、TAR,包括 .tar.gz/.tgz、NDJSON)
  • 标注 使用手动绘图工具和由 SAM 驱动的智能标注功能——你可以选择 SAM 2.1 或全新的 SAM 3
  • 分析 通过统计数据和可视化分析你的数据
  • 导出NDJSON 格式 以进行本地训练

Ultralytics Platform 数据概览侧边栏数据集

Link to this section工作流程#

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
阶段描述
上传导入图片、视频或存档文件并自动处理
标注使用针对所有 6 种任务类型的手动工具标注数据,或者对检测、分割、语义和 OBB 任务使用 SAM 自动标注
分析查看类别分布、空间热力图和尺寸统计信息
导出下载 NDJSON 格式 以供离线使用

Link to this section支持的任务#

Ultralytics Platform 支持所有 6 种 YOLO 任务类型:

任务描述标注工具
检测带边界框的目标检测矩形工具
分割带像素掩码的实例分割多边形工具
语义针对各类的像素区域进行语义分割多边形工具
姿态使用内置和自定义骨架模板的关键点估计关键点工具
OBB用于旋转物体的定向边界框定向框工具
分类图像级分类类别选择器
任务类型选择

任务类型在创建数据集时设置,并决定了哪些标注工具可用。你可以在稍后通过数据集标题的任务选择器更改它,但在切换后不兼容的标注将不会显示。

Link to this section核心功能#

Link to this section智能存储#

Ultralytics Platform 使用内容寻址存储 (CAS) 来实现高效的数据管理:

  • 去重:通过 XXH3-128 哈希确保相同的图像仅存储一次
  • 完整性:基于哈希的寻址确保数据完整性
  • 效率:优化的存储和高速处理

Link to this section数据集 URI#

使用 ul:// URI 格式引用数据集(请参阅 使用平台数据集):

yolo train data=ul://username/datasets/my-dataset

这允许你在配置了 API key 的任何机器上对平台数据集进行训练。

从 Python 使用平台数据
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Link to this section数据集版本控制#

为你的数据集创建不可变的 NDJSON 快照以实现可复现的训练。每个版本在创建时都会捕获图像数量、类别数量和标注数量。详情请参阅 版本标签页

Link to this section数据集标签页#

根据数据集的状态和你的权限,数据集页面最多可以显示六个标签页:

标签页描述
图像以网格、紧凑或表格视图浏览带有标注叠加层的图像
类别查看并编辑类别名称、颜色和每个类别的标签数量
图表自动统计数据:拆分分布、类别统计、热力图
模型在此数据集上训练的 模型,包含指标和状态
版本创建并下载不可变的 NDJSON 快照以实现可复现的训练
错误处理失败的图像,包含错误详情和修复指导

Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.

Link to this section聚类#

将你的数据集作为交互式 2D 散点图进行探索,视觉上相似的图像会聚在一起——这对于发现聚类、重复项和离群值,以及检查拆分或类别在数据中的分布情况非常有用。通过在图表区域使用套索工具来筛选图库中的图像。详见 聚类

Link to this section统计与可视化#

The Charts tab provides automatic analysis including:

  • 拆分分布:训练集/验证集/测试集图像数量的环形图
  • 热门类别:最频繁标注类别的环形图
  • 图像尺寸:图像宽度和高度分布的直方图(像素单位)
  • 每个实例的点数:多边形顶点或关键点计数分布(针对分割/姿态数据集)
  • 标注位置:边界框中心位置的 2D 热力图
  • 图像尺寸 2D:宽度与高度的 2D 热力图,带有宽高比引导线

Link to this section快速链接#

  • 数据集:上传、管理并导出你的训练数据
  • 标注:使用手动及 AI 辅助工具标注数据
  • 云训练:在已标注的数据集上训练模型
  • 数据集 URI:使用 ul:// URI 从任何地方进行训练

Link to this section常见问题解答 (FAQ)#

Link to this section支持哪些文件格式上传?#

Ultralytics Platform 支持:

图像: JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(每张最大 50MB)

视频: MP4、WebM、MOV、AVI、MKV、M4V(最大 1GB,以 1 FPS 提取帧,最多 100 帧)

数据集文件: 包含图像的 ZIP 或 TAR 存档(包括 .tar.gz.tgz,Free 计划最大 10GB,Pro 计划 20GB,Enterprise 计划 50GB),可选择包含 YOLO 格式标签,以及 NDJSON 导出文件

Link to this section最大数据集大小是多少?#

存储限制取决于你的套餐:

套餐存储限制
免费100 GB
Pro500 GB
Enterprise无限制

单个文件限制:图像 50MB,视频 1GB,数据集在 Free 计划中为 10GB / Pro 计划 20GB / Enterprise 计划 50GB

Link to this section我可以使用我的平台数据集进行本地训练吗?#

可以!使用数据集 URI 格式进行本地训练:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

或者将你的数据集以 NDJSON 格式 导出,进行完全离线训练。

评论