云端训练
Ultralytics 训练服务提供单击式云GPU训练功能,无需复杂配置即可轻松启动模型训练。支持实时指标流传输与自动检查点保存,YOLO 高效训练。
观看: 基于Ultralytics 云端培训
从UI出发的列车
直接从平台开始云培训:
- 导航至您的项目
- 点击火车模型
- 配置训练参数
- 点击开始训练
步骤1:选择数据集
从您的上传文件中选择一个数据集:
| 选项 | 描述 |
|---|---|
| 您的数据集 | 您已上传的数据集 |
| 公共数据集 | 来自探索的共享数据集 |
步骤2:配置模型
选择基础模型和参数:
| 参数 | 描述 | 默认值 |
|---|---|---|
| 模型 | 基础架构(YOLO11n,s,m,l,x) | YOLO11n |
| 纪元 | 训练迭代次数 | 100 |
| 图像大小 | 输入分辨率 | 640 |
| 批量大小 | 每次迭代的样本数 | 汽车 |
步骤3:GPU
选择您的计算资源:
| GPU | 视频内存 | 速度 | 每小时成本 |
|---|---|---|---|
| RTX 6000 Pro | 96GB | 非常快 | 免费 |
| M4 Pro(Mac) | 64GB | 快速 | 免费 |
| RTX 3090 | 24GB | 好 | $0.44 |
| RTX 4090 | 24GB | 快速 | $0.74 |
| L40S | 48GB | 快速 | $1.14 |
| A100 40GB | 40GB | 非常快 | $1.29 |
| A100 80GB | 80GB | 非常快 | $1.99 |
| H100 80GB | 80GB | 最快 | $3.99 |
GPU
- RTX 6000 Pro(免费):适用于Ultralytics tralytics基础设施上的大多数训练任务
- M4 Pro(免费):适用于兼容工作负载的Apple Silicon选项
- RTX 4090:付费云端培训的最佳性价比之选
- A100 80GB:适用于大批量处理或大型模型
- H100:为时间敏感型训练提供最高性能
免费培训层级
RTX 6000 Pro Ada(96GB显存)和M4 Pro GPUUltralytics 免费使用,非常适合入门级和常规训练任务。
步骤4:开始训练
点击开始培训以启动您的工作。平台:
- GPU 分配资源
- 下载您的数据集
- 开始训练
- 实时流式传输指标
监视器培训
查看实时培训进度:
实时指标
| 指标 | 描述 |
|---|---|
| 损失 | 训练和验证损失 |
| mAP | 平均精度均值 |
| 精确度 | 正确的阳性预测 |
| 召回率 | 检测到的真实值 |
| GPU | GPU 百分比 |
| 内存 | GPU 使用情况 |
检查点
检查点会自动保存:
- 每个时代:最新权重已保存
- 最佳模型:保留最高mAP
- 最终模型:训练完成时的权重
暂停与继续
停止训练
点击“停止训练”可暂停您的任务:
- 当前检查点已保存
- GPU 已释放
- 费用停止计费
恢复训练
从您上次的检查点继续:
- 导航至模型
- 点击继续训练
- 确认继续
简历限制
您只能恢复明确停止的训练任务。失败的训练任务可能需要从头开始重新启动。
远程培训
在自有硬件上进行训练,同时将指标流式传输至平台。
软件包版本要求
平台集成需要ultralytics>= 8.4.0 版本。较低版本将无法与平台兼容。
pip install "ultralytics>=8.4.0"
设置API密钥
- 前往设置 > API密钥
- 创建具有训练作用域的新密钥
- 设置环境变量:
export ULTRALYTICS_API_KEY="your_api_key"
流媒体训练
使用 project 和 name 流式传输指标的参数:
yolo train model=yolo11n.pt data=coco.yaml epochs=100 \
project=username/my-project name=experiment-1
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.train(
data="coco.yaml",
epochs=100,
project="username/my-project",
name="experiment-1",
)
使用平台数据集
使用存储在平台上的数据集进行训练:
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
字段 ul:// URI格式会自动下载并配置您的数据集。
账单
培训成本基于GPU 情况:
成本计算
Total Cost = GPU Rate × Training Time (hours)
| 示例 | GPU | 时间 | 成本 |
|---|---|---|---|
| 小差事 | RTX 4090 | 1小时 | $0.74 |
| 中等工作 | A100 40GB | 4小时 | $5.16 |
| 大型项目 | H100 | 8小时 | $31.92 |
付款方式
| 方法 | 描述 |
|---|---|
| 账户余额 | 预装信用点 |
| 按任务付费 | 工作完成时收费 |
最低余额
启动基于纪元的训练需要至少5.00美元的余额。
查看培训费用
培训结束后,请在“计费”选项卡中查看详细费用:
- 每 epoch 成本细分
- 总GPU 时间
- 下载成本报告
训练技巧
选择合适的模型尺寸
| 模型 | 参数 | 最适合 |
|---|---|---|
| YOLO11n | 2.6M | 实时、边缘设备 |
| YOLO11s | 9.4M | 速度与精度的平衡 |
| YOLO11m | 20.1M | 更高精度 |
| YOLO11l | 25.3M | 生产精度 |
| YOLO11x | 56.9M | 最高精度 |
优化培训时间
- 从小处着手:先用较少的训练轮次进行测试
- 使用GPU:GPU 模型/批量大小GPU
- 验证数据集:确保训练前的数据质量
- 及早监控:若指标停滞则停止
故障排除
| 问题 | 解决方案 |
|---|---|
| 训练卡在0% | 检查数据集格式,重试 |
| 内存不足 | 减少批处理大小或使用GPU |
| 精度差 | 增加训练 epoch 数,检查数据质量 |
| 训练缓慢 | 考虑更快的GPU |
常见问题
培训需要多长时间?
培训时间取决于:
- 数据集大小
- 模型尺寸
- epoch数
- GPU
典型时间(1000张图像,100个 epoch):
| 模型 | RTX 4090 | A100 |
|---|---|---|
| YOLO11n | 30分钟 | 20分钟 |
| YOLO11m | 60分钟 | 40分钟 |
| YOLO11x | 120分钟 | 80分钟 |
我能通宵训练吗?
是的,训练将持续进行直至完成。训练结束后您将收到通知。请确保您的账户余额充足以支持基于 epoch 的训练。
如果我的积分用完了怎么办?
训练将在当前 epoch 结束时暂停。检查点已保存,您可在充值后继续训练。
我可以使用自定义训练参数吗?
是的,高级用户可以在训练配置中指定额外的参数。
训练参数参考
核心参数
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
epochs | int | 100 | 1+ | 训练 epoch 数 |
batch | int | 16 | -1 = 自动 | 批处理大小(-1表示自动) |
imgsz | int | 640 | 32+ | 输入图像尺寸 |
patience | int | 100 | 0+ | 提前终止的耐心 |
workers | int | 8 | 0+ | 数据加载器工作者 |
cache | 布尔值 | 虚假 | - | 缓存图像(内存/磁盘) |
学习率参数
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
lr0 | 浮点数 | 0.01 | 0.0-1.0 | 初始学习率 |
lrf | 浮点数 | 0.01 | 0.0-1.0 | 最终LR因子 |
momentum | 浮点数 | 0.937 | 0.0-1.0 | SGD |
weight_decay | 浮点数 | 0.0005 | 0.0-1.0 | L2正则化 |
warmup_epochs | 浮点数 | 3.0 | 0+ | 预热 epochs |
cos_lr | 布尔值 | 虚假 | - | 余弦LR调度器 |
增强参数
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
hsv_h | 浮点数 | 0.015 | 0.0-1.0 | HSV色相增强 |
hsv_s | 浮点数 | 0.7 | 0.0-1.0 | HSV饱和度 |
hsv_v | 浮点数 | 0.4 | 0.0-1.0 | HSV值 |
degrees | 浮点数 | 0.0 | - | 旋转角度 |
translate | 浮点数 | 0.1 | 0.0-1.0 | 翻译比例 |
scale | 浮点数 | 0.5 | 0.0-1.0 | 比例因子 |
fliplr | 浮点数 | 0.5 | 0.0-1.0 | 水平翻转探针 |
flipud | 浮点数 | 0.0 | 0.0-1.0 | 垂直翻转探针 |
mosaic | 浮点数 | 1.0 | 0.0-1.0 | 马赛克增强 |
mixup | 浮点数 | 0.0 | 0.0-1.0 | 混淆增强 |
copy_paste | 浮点数 | 0.0 | 0.0-1.0 | 复制粘贴(segment) |
优化器选择
| 价值 | 描述 |
|---|---|
auto | 自动选择(默认) |
SGD | 随机梯度下降法 |
Adam | Adam 优化器 |
AdamW | Adam 重量衰减 |
任务特定参数
某些参数仅适用于特定任务:
- 分割:
overlap_mask,mask_ratio,copy_paste - 姿势估计:
pose(减重)kobj(关键点客观性) - 分类:
dropout,erasing,auto_augment
📅 0 天前创建 ✏️ 0 天前更新