数据准备
数据准备是成功构建计算机视觉模型的基础。Ultralytics Platform 提供全面的工具来管理您的训练数据,涵盖从上传、标注到分析的整个过程。
概述
Ultralytics Platform 的数据部分可帮助您:
- 上传图像、视频和 ZIP 归档文件
- 使用手动工具和 AI 辅助标注进行标注
- 通过统计数据和可视化分析您的数据
- 以标准格式导出,用于本地训练
工作流程
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| 阶段 | 描述 |
|---|---|
| 上传 | 导入图像、视频或ZIP压缩包,并进行自动处理 |
| 标注 | 使用边界框、多边形、关键点或分类来标注数据 |
| 分析 | 查看类别分布、空间热力图和维度统计 |
| 导出 | 下载NDJSON格式以供离线使用 |
支持的任务
Ultralytics平台支持所有5种YOLO任务类型:
| 任务 | 描述 | 标注工具 |
|---|---|---|
| 检测 | 使用边界框进行目标detect | 矩形工具 |
| 分割 | 使用像素掩码进行实例segment | 多边形工具 |
| 姿势估计 | 关键点估计(17点COCO格式) | 关键点工具 |
| OBB | 用于旋转对象的有向边界框 | 有向框工具 |
| 分类 | 图像级分类 | 类别选择器 |
主要功能
智能存储
Ultralytics平台采用高效存储技术:
- 重复数据删除:相同图像仅存储一次
- 完整性:校验和确保数据完整性
- 效率:优化存储和快速处理
数据集 URI
使用以下方式引用数据集 ul:// URI格式:
yolo train data=ul://username/datasets/my-dataset
这允许在任何配置了API密钥的机器上,对平台数据集进行训练。
统计与可视化
每个数据集都包含自动统计信息:
- 类别分布:按类别划分的标签计数条形图
- 位置热图:标注的空间分布
- 维度分析:图像宽度与高度分布
- 拆分明细:训练/验证/测试样本计数
快速链接
常见问题
支持哪些文件格式上传?
Ultralytics Platform 支持:
图片格式:JPEG、PNG、WebP、BMP、GIF、TIFF、HEIC、AVIF、JP2、DNG(每张最大50MB)
视频格式:MP4、WebM、MOV、AVI、MKV、M4V(最大1GB,以每秒1帧的速度提取帧,最多100帧)
存档:ZIP文件(最大50GB),内含图像及可选的YOLO标签
最大数据集大小是多少?
存储限制取决于您的套餐:
| 计划 | 存储限制 |
|---|---|
| 免费版 | 100 GB |
| Pro | 500 GB |
| 企业版 | 自定义 |
单个文件限制:图片50MB,视频1GB,ZIP压缩包50GB
我可以使用我的平台数据集进行本地训练吗?
可以!使用数据集URI格式进行本地训练:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
或者以NDJSON格式导出数据集,进行完全离线训练。
📅 创建于 20 天前 ✏️ 更新于 12 天前