跳转至内容

数据准备

数据准备是计算机视觉模型成功的基石。Ultralytics 提供全面的工具来管理您的训练数据,涵盖从上传、标注到分析的完整流程。

概述

Ultralytics 的数据部分可帮助您:

  • 上传图片、视频和ZIP压缩包
  • 使用手动工具和人工智能辅助标注进行标注
  • 运用统计分析和可视化技术分析您的数据
  • 以标准格式导出用于本地培训

工作流

graph LR
    A[📤 Upload] --> B[🏷️ Annotate]
    B --> C[📊 Analyze]
    C --> D[🚀 Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
舞台描述
上传导入图像、视频或ZIP压缩包并自动处理
标注使用边界框、多边形、关键点或分类对数据进行标注
分析查看类分布、空间热力图和维度统计
导出下载NDJSON格式文件以供离线使用

支持的任务

Ultralytics 支持全部5种YOLO 类型:

任务描述注释工具
检测带边界框的物体检测矩形工具
分割基于像素掩膜的实例分割多边形工具
姿势估计关键点估计(17点COCOCOCO )关键点工具
OBB旋转对象的定向边界框定向盒工具
分类图像级分类类选择器

主要功能

智能存储

Ultralytics 采用高效存储技术:

  • 重复数据删除:相同图像仅存储一次
  • 完整性:校验和确保数据完整性
  • 效率:优化存储与快速处理

数据集统一资源标识符

使用以下数据集进行参考: ul:// URI格式:

yolo train data=ul://username/datasets/my-dataset

这使得任何配置了您的API密钥的机器都能在平台数据集上进行训练。

统计与可视化

每个数据集都包含自动统计信息:

  • 类分布:各类标签数量的条形图
  • 位置热力图:注释的空间分布
  • 维度分析:图像宽度与高度分布
  • 分割细分:训练集/验证集/测试集样本数量
  • 数据集: 上传并管理您的训练数据
  • 注释: 使用人工和人工智能辅助工具标注数据

常见问题

支持上传哪些文件格式?

Ultralytics :

  • 图片格式:JPG、PNG、WebP、TIFF、BMP及其他常用格式
  • 视频格式:MP4、AVI、MOV - 帧将自动提取
  • 存档文件:包含图像的ZIP文件,可选含YOLO标签

最大数据集大小是多少?

存储限制取决于您的套餐:

计划存储限制
免费100 GB
Pro500 GB
企业自定义

我能否将平台数据集用于本地训练?

是的!使用数据集URI格式进行本地训练:

export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100

或将数据集导出为NDJSON格式,以实现完全离线训练。



📅 0 天前创建 ✏️ 0 天前更新
glenn-jocher

评论