数据准备
数据准备是计算机视觉模型成功的基石。Ultralytics 提供全面的工具来管理您的训练数据,涵盖从上传、标注到分析的完整流程。
概述
Ultralytics 的数据部分可帮助您:
- 上传图片、视频和ZIP压缩包
- 使用手动工具和人工智能辅助标注进行标注
- 运用统计分析和可视化技术分析您的数据
- 以标准格式导出用于本地培训
工作流
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| 舞台 | 描述 |
|---|---|
| 上传 | 导入图像、视频或ZIP压缩包并自动处理 |
| 标注 | 使用边界框、多边形、关键点或分类对数据进行标注 |
| 分析 | 查看类分布、空间热力图和维度统计 |
| 导出 | 下载NDJSON格式文件以供离线使用 |
支持的任务
Ultralytics 支持全部5种YOLO 类型:
| 任务 | 描述 | 注释工具 |
|---|---|---|
| 检测 | 带边界框的物体检测 | 矩形工具 |
| 分割 | 基于像素掩膜的实例分割 | 多边形工具 |
| 姿势估计 | 关键点估计(17点COCOCOCO ) | 关键点工具 |
| OBB | 旋转对象的定向边界框 | 定向盒工具 |
| 分类 | 图像级分类 | 类选择器 |
主要功能
智能存储
Ultralytics 采用高效存储技术:
- 重复数据删除:相同图像仅存储一次
- 完整性:校验和确保数据完整性
- 效率:优化存储与快速处理
数据集统一资源标识符
使用以下数据集进行参考: ul:// URI格式:
yolo train data=ul://username/datasets/my-dataset
这使得任何配置了您的API密钥的机器都能在平台数据集上进行训练。
统计与可视化
每个数据集都包含自动统计信息:
- 类分布:各类标签数量的条形图
- 位置热力图:注释的空间分布
- 维度分析:图像宽度与高度分布
- 分割细分:训练集/验证集/测试集样本数量
快速链接
常见问题
支持上传哪些文件格式?
Ultralytics :
- 图片格式:JPG、PNG、WebP、TIFF、BMP及其他常用格式
- 视频格式:MP4、AVI、MOV - 帧将自动提取
- 存档文件:包含图像的ZIP文件,可选含YOLO标签
最大数据集大小是多少?
存储限制取决于您的套餐:
| 计划 | 存储限制 |
|---|---|
| 免费 | 100 GB |
| Pro | 500 GB |
| 企业 | 自定义 |
我能否将平台数据集用于本地训练?
是的!使用数据集URI格式进行本地训练:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
或将数据集导出为NDJSON格式,以实现完全离线训练。
📅 0 天前创建 ✏️ 0 天前更新