Link to this section数据准备#
数据准备是成功构建 computer vision 模型的基础。Ultralytics Platform 提供了全套工具来管理你的训练数据,涵盖从上传、标注到分析的整个流程。
Watch: Get Started with Ultralytics Platform - Data
Link to this section概述#
Ultralytics Platform 的“数据”部分可帮你完成以下任务:
- 上传图像、视频和数据集文件(ZIP、TAR,包括
.tar.gz/.tgz、NDJSON) - 标注:使用手动绘图工具和由 SAM 驱动的智能标注——可选择 SAM 2.1 或全新的 SAM 3
- 分析:通过统计数据和可视化分析你的数据
- 导出:以 NDJSON format 导出以进行本地训练

Link to this section工作流#
graph LR
A[Upload]:::start --> B[Annotate]:::proc
B --> C[Analyze]:::proc
C --> D[Train]:::out
classDef start fill:#4CAF50,color:#fff
classDef proc fill:#2196F3,color:#fff
classDef out fill:#9C27B0,color:#fff| 阶段 | 描述 |
|---|---|
| 上传 | 导入图像、视频或压缩包,并进行自动处理 |
| 标注 | 使用手动工具对所有 6 种任务类型进行数据标注,或使用 SAM 标注进行检测、分割、语义分割和 OBB |
| 分析 | 查看类别分布、空间热力图和维度统计信息 |
| 导出 | 以 NDJSON format 下载以供离线使用 |
Link to this section支持的任务#
Ultralytics Platform 支持所有 6 种 YOLO 任务类型:
| 任务 | 描述 | 标注工具 |
|---|---|---|
| Detect | 带有边界框的目标检测 | 矩形工具 |
| Segment | 带有像素掩码的实例分割 | 多边形工具 |
| Semantic | 带有按类划分的像素区域的语义分割 | 多边形工具 |
| Pose | 带有内置和自定义骨架模板的关键点估计 | 关键点工具 |
| OBB | 用于旋转物体的定向边界框 | 定向框工具 |
| Classify | 图像级分类 | 类别选择器 |
任务类型是在创建数据集时设定的,它决定了可用的标注工具。你可以在之后通过数据集标题中的任务选择器进行修改,但切换后不兼容的标注将不再显示。
Link to this section主要特性#
Link to this section智能存储#
Ultralytics Platform 使用内容寻址存储(CAS)来实现高效的数据管理:
- 去重:相同的图像仅通过 XXH3-128 哈希存储一次
- 完整性:基于哈希的寻址确保了数据完整性
- 效率:优化的存储和快速的处理能力
Link to this section数据集 URI#
使用 ul:// URI 格式引用数据集(参见 Using Platform Datasets):
yolo train data=ul://username/datasets/my-dataset这允许你在配置了 API key 的任何机器上对平台数据集进行训练。
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this section数据集版本控制#
为你的数据集创建不可变的 NDJSON 快照以实现可重复的训练。每个版本都会在创建时捕获图像数量、类别数量和标注数量。详情请参阅 Versions Tab。
Link to this section数据集标签页#
根据数据集的状态和你的权限,数据集页面最多可显示六个选项卡:
| 标签页 | 描述 |
|---|---|
| 图像 | 以网格、紧凑或表格视图浏览带有标注叠加层的图像 |
| Classes | 查看并编辑类别名称、颜色和每类的标签数量 |
| 图表 | 自动统计:分割分布、类别计数、热力图 |
| 模型 | 在该数据集上训练的 Models,包括指标和状态 |
| 版本 | 创建并下载不可变的 NDJSON 快照以实现可重复的训练 |
| Errors | 处理失败的图像及其错误详情和修复指南 |
当数据集包含图像时,会出现 Classes(类别)和 Charts(图表)。仅在存在处理失败时才会出现 Errors(错误)。拥有者可以看到 Versions(版本),如果版本已存在,非拥有者也能看到。
Link to this section聚类#
将你的数据集作为交互式 2D 散点图进行探索,视觉上相似的图像会聚在一起——这对于发现聚类、重复项和异常值,以及检查数据集的划分或类别在数据中的分布情况非常有用。在绘图区域使用套索工具进行圈选,以过滤图库中显示的图像。详情请参阅 Clustering。
Link to this section统计与可视化#
Charts(图表)选项卡提供自动分析功能,包括:
- 分割分布:训练集/验证集/测试集图像数量的环形图
- 热门类别:出现频率最高的标注类别的环形图
- 图像维度:图像宽度和高度分布的直方图(单位:像素)
- 每个实例的点数:多边形顶点或关键点数量分布(用于分割/姿态数据集)
- 标注位置:边界框中心位置的 2D 热力图
- 图像维度 2D:宽度与高度的 2D 热力图,配有宽高比参考线
Link to this section快捷链接#
- Datasets:上传、管理和导出你的训练数据
- Annotation:使用手动和 AI 辅助工具进行数据标注
- Cloud Training:在你的标注数据集上训练模型
- Dataset URI:使用
ul://URI 从任何地方进行训练
Link to this section常见问题解答#
Link to this section支持上传哪些文件格式?#
Ultralytics Platform 支持:
图像: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO(每张最大 50MB)
视频: MP4、WebM、MOV、MKV、M4V(最大 1GB,以 1 FPS 提取帧,最多 100 帧)
数据集文件: ZIP 或 TAR 压缩包,包括 .tar.gz 和 .tgz(Free 版最大 10GB,Pro 版 20GB,Enterprise 版 50GB),其中包含图像以及可选的 YOLO-format labels,此外还支持 NDJSON 导出
Link to this section数据集的最大容量是多少?#
存储限制取决于你的套餐:
| 方案 | 存储限制 |
|---|---|
| 免费版 | 100 GB |
| Pro 版 | 500 GB |
| 企业版 | 无限制 |
单个文件限制:图像 50MB,视频 1GB,数据集在 Free 版上为 10GB / Pro 版 20GB / Enterprise 版 50GB
Link to this section我可以使用我的平台数据集进行本地训练吗?#
可以!使用数据集 URI 格式进行本地训练:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100或者以 NDJSON format 导出你的数据集,以进行完全离线训练。