跳转至内容

云端训练

Ultralytics Platform 云训练提供云端GPU上的一键式训练,使模型训练无需复杂设置即可进行。训练YOLO模型时,可享受实时指标流和自动检查点保存功能。

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

训练对话

通过在任意项目页面上点击新建模型(或在数据集页面上点击训练)从平台UI启动训练。训练对话框有两个选项卡:云训练本地训练

Ultralytics 平台训练对话框云选项卡

步骤 1:选择基础模型

从官方 YOLO26 模型或您自己训练的模型中选择:

类别描述
官方所有25个YOLO26模型(5种尺寸 x 5种任务)
您的模型您已完成的用于微调的模型

官方模型按任务类型(DetectSegment姿势估计旋转框检测Classify)组织,尺寸从nano到xlarge。

步骤 2:选择数据集

选择要用于训练的数据集(参见 数据集):

选项描述
官方来自 Ultralytics 的精选数据集
您的数据集您已上传的数据集

数据集要求

数据集必须采用 ready 状态,其中训练集至少包含1张图像,验证集或测试集至少包含1张图像,并且至少有1张已标注图像。

任务不匹配

如果模型任务(例如,detect)与数据集任务(例如,segment)不匹配,将出现任务不匹配警告。如果您继续使用不匹配的任务,训练将失败。请确保模型和数据集都使用相同的任务类型,如任务指南中所述。

步骤 3:配置参数

设置核心训练参数:

参数描述默认值
训练轮次训练迭代次数100
批量大小每次迭代的样本数16
图像大小输入分辨率(320/416/512/640/1280 下拉菜单,或 YAML 编辑器中 32-4096)640
运行名称训练运行的可选名称自动

步骤 4:高级设置(可选)

展开高级设置以访问完整的基于yaml的参数编辑器,其中包含按组组织的40多个训练参数(参见配置参考):

参数
学习率lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
优化器SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax
损失权重框、类别、DFL、姿势估计、kobj、标签平滑
颜色增强hsv_h, hsv_s, hsv_v
几何增强度、平移、缩放、剪切、透视
翻转与混合增强上下翻转、左右翻转、马赛克、MixUp、复制粘贴
训练控制容忍度, 种子, 确定性, amp, cos_lr, close_mosaic, 保存周期
数据集比例, 冻结, 单类别, 矩形, 多尺度, 恢复

参数是任务感知的(例如, copy_paste 仅显示 segment 任务, pose/kobj 仅适用于姿势估计任务)。A 已修改 当值与默认值不同时,会出现徽章,您可以使用重置按钮将所有设置重置为默认值。

示例:为小型数据集调整数据增强

For small datasets (<1000 images), increase augmentation to reduce overfitting:

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

步骤 5:选择 GPU(云选项卡)

从 Ultralytics Cloud 中选择您的 GPU:

Ultralytics 平台训练对话框 GPU 选择器和成本

GPU显存每小时费用
RTX 2000 Ada16 GB$0.24
RTX A450020 GB$0.24
RTX A500024 GB$0.26
RTX 4000 Ada20 GB$0.38
L424 GB$0.39
A4048 GB$0.40
RTX 309024 GB$0.46
RTX A600048 GB$0.49
RTX 409024 GB$0.59
RTX 6000 Ada48 GB$0.77
L40S48 GB$0.86
RTX 509032 GB$0.89
L4048 GB$0.99
A100 PCIe80 GB$1.39
A100 SXM80 GB$1.49
RTX PRO 600096 GB$1.89
H100 PCIe80 GB$2.39
H100 SXM80 GB$2.69
H100 NVL94 GB$3.07
H200 NVL143 GB$3.39
H200 SXM141 GB$3.59
B200180 GB$4.99

GPU 选择

  • RTX PRO 6000: 96 GB Blackwell 代,大多数任务的推荐默认 GPU
  • A100 SXM: 大型批处理或大型模型所需
  • H100/H200:为对时间敏感的训练提供最佳性能(H200 需Pro 或 Enterprise 版本)
  • B200:适用于尖端工作负载的NVIDIA 架构(需Pro 或 Enterprise 版本)

对话框显示您当前的余额和一个充值按钮。估算成本和持续时间会根据您的配置(模型大小、数据集图像、训练轮次、GPU 速度)进行计算。

步骤 6:开始训练

点击 开始训练 以启动您的任务。平台将:

  1. 调配一个 GPU 实例
  2. 下载您的数据集
  3. 开始训练
  4. 实时传输指标

训练作业生命周期

训练任务会经历以下状态:

状态描述
待处理任务已提交,等待 GPU 分配
正在启动GPU 已配置,正在下载数据集和模型
正在运行训练进行中,指标实时流式传输
已完成训练成功完成
失败训练失败(详情请参阅控制台日志)
已取消训练已由用户取消

免费积分

新账户可获得注册积分——个人邮箱 5 美元,公司邮箱 25 美元。查看您的余额在“设置”>“账单”中。

Ultralytics 平台训练进度(含图表)

监控训练

在模型页面的训练选项卡上查看实时训练进度:

图表子选项卡

Ultralytics 平台模型训练实时图表

指标描述
损失训练和验证损失
mAP平均精度均值
精确度正确正向预测
召回率检测到的真实值

控制台子选项卡

支持ANSI颜色、进度条和错误检测的实时控制台输出。

系统子选项卡

实时GPU利用率、内存、温度、CPU和磁盘使用情况。

检查点

检查点自动保存:

  • 每个 epoch:保存最新权重
  • 最佳模型:保留 mAP 最高的检查点
  • 最终模型:训练完成时的权重

取消训练

在模型页面上点击 取消训练 以停止正在运行的任务:

  • 计算实例已终止
  • 积分停止计费
  • 在此之前保存的检查点都将得到保留

远程训练

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

在您自己的硬件上训练,同时将指标流式传输到平台。

软件包版本要求

平台集成需要ultralytics>=8.4.14。更低版本将无法与平台配合使用。

pip install -U ultralytics

设置API密钥

  1. 前往 Settings > Profile (API密钥部分)
  2. 创建新密钥(或者当您打开“本地训练”选项卡时,平台会自动创建一个)
  3. 设置环境变量:
export ULTRALYTICS_API_KEY="your_api_key"

使用流式传输进行训练

使用 projectname 用于流式传输指标的参数:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(
    data="coco.yaml",
    epochs=100,
    project="username/my-project",
    name="experiment-1",
)

训练对话框中的“本地训练”选项卡显示了一个预配置命令,其中包含您的 API 密钥、选定参数和高级参数。

使用平台数据集

使用存储在平台上的数据集进行训练,通过 ul:// URI格式:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(
    data="ul://username/datasets/my-dataset",
    epochs=100,
    project="username/my-project",
    name="exp1",
)

字段 ul:// URI格式会自动下载并配置您的数据集。模型会自动链接到平台上的数据集(参见 使用平台数据集)。

账单

训练成本基于 GPU 使用情况:

成本估算

在训练开始之前,平台会通过以下方式估算总成本:

  1. 估算每个epoch的秒数根据数据集大小、模型复杂度、图像尺寸、批处理大小和GPU速度
  2. 计算总训练时间:将每轮秒数乘以轮数,然后加上启动开销
  3. 计算估算成本:总训练小时数乘以GPU的每小时费率。

影响成本的因素:

因素影响
数据集大小更多图像 = 更长的训练时间(基准:在RTX 4090上每1000张图像计算约2.8秒)
模型大小大型模型(m、l、x)训练速度比(n、s)慢
Epochs 数量直接影响训练时间
图像大小更大的 imgsz 会增加计算量:320px=0.25倍,640px=1.0倍(基准),1280px=4.0倍
批量大小更大的批次更高效(批次大小 32 = 约 0.85 倍时间,批次大小 8 = 约 1.2 倍时间,对比批次大小 16 基准)
GPU 速度更快的GPU可缩短训练时间(例如,H100 SXM 比 RTX 4090 快约 3.4 倍)
启动开销实例初始化、数据下载和预热最多需要 5 分钟(随数据集大小而变化)

成本示例

预估

成本估算为近似值,并取决于多种因素。训练对话框会在您开始训练之前显示实时估算。

场景GPU预估成本
500 图像, YOLO26n, 50 轮次RTX 4090约$0.50
1000 张图像,YOLO26n,100 个 epochRTX PRO 6000约$5
5000 图像, YOLO26s, 100 轮次H100 SXM约$23

计费流程

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

云端训练计费流程:

  1. 预估:在训练开始前计算的费用
  2. 余额检查:在启动前检查可用积分
  3. 训练:任务在所选计算资源上运行
  4. 费用:最终费用基于实际运行时长

消费者保护

计费跟踪实际计算使用量,包括已取消的部分运行。失败的训练运行绝不收费。

按作业状态计费

状态是否收费?
已完成是的 — 实际使用的 GPU 时间
已取消是的 — 从开始到取消的 GPU 时间
失败否 — 失败的运行不收费
卡住部分 — 仅收取实际训练时间费用

错误不收费

如果训练运行因配置错误、内存不足问题或任何其他故障而失败,您将不被收费。仅对成功的计算时间计费。卡住的作业(4 小时以上无活动)会自动终止,并且仅对 GPU 实际训练的时间收费,而不是空闲时间。

支付方式

方法描述
账户余额预加载积分
按任务付费任务完成后收费

最低余额

开始训练需要有正数的可用余额以及足够的积分来支付预估任务成本。

查看训练成本

训练完成后,在账单选项卡中查看详细费用:

  • 每周期费用明细
  • 总计 GPU 时间
  • 下载费用报告

Ultralytics 平台训练计费详情

训练技巧

选择合适的模型大小

模型参数最适合
YOLO26n2.4M实时、边缘设备
YOLO26s9.5M平衡的速度/精度
YOLO26m20.4M更高精度
YOLO26l24.8M生产级精度
YOLO26x55.7M最大精度

优化训练时间

成本节约策略

  1. 小规模开始:在预算型 GPU 上使用 10-20 个 epoch 进行测试,以验证您的数据集和配置是否正常工作。
  2. 使用合适的GPU:RTX PRO 6000能很好地处理大多数工作负载
  3. 验证数据集:在投入训练之前修复标注问题
  4. 早期监控:如果损失趋于平稳,则取消训练 — 您只需支付所使用的计算时间

故障排除

问题解决方案
训练停滞在0%检查数据集格式,重试
内存不足减小批次大小或使用更大的 GPU
精度不佳增加周期数,检查数据质量
训练缓慢考虑更快的 GPU
任务不匹配错误确保模型和数据集任务匹配

常见问题

训练需要多长时间?

训练时间取决于:

  • 数据集大小
  • 模型大小
  • 训练轮次
  • 所选 GPU

典型时间(1000张图像,100个epoch):

模型RTX PRO 6000A100
YOLO26n20分钟20分钟
YOLO26m40分钟40分钟
YOLO26x80分钟80分钟

我可以通宵训练吗?

是的,训练将持续到完成。训练完成后您将收到通知。请确保您的账户有足够的余额进行基于 epoch 的训练。

如果我的积分用完了怎么办?

如果您的信用余额在训练运行期间达到零,训练将继续完成,您的余额将变为负值。这确保您的训练作业在运行中途不会中断。

训练完成后,您需要添加积分以使您的余额恢复正值,然后才能开始新的训练作业。无论余额如何,您已完成的模型、检查点和所有训练工件都将完全保留。

负余额

负余额仅会阻止启动训练作业。现有部署和其他平台功能将继续正常工作。通过设置 > 计费添加积分或启用自动充值以避免中断。

如果我的训练成本超出估算怎么办?

成本估算为近似值——实际训练时间可能因数据加载速度、GPU 预热和模型收敛行为等因素而异。如果实际成本超出估算,您的余额可能会变为负值(参见上文)。平台不会根据估算停止训练

为了管理成本:

  • 实时监控训练进度,并在需要时提前取消
  • 启用自动充值以自动补充积分
  • 从较短的运行(更少的 epoch)开始,以校准预期

我可以使用自定义训练参数吗?

是的,展开训练对话框中的高级设置部分,即可访问一个包含40多个可配置参数的YAML编辑器。非默认值将包含在云端和本地训练命令中。

yaml 编辑器还支持从之前的训练运行中导入配置

  • 从现有模型复制:在任何已完成模型的页面上,“训练配置”卡片都有一个复制为 JSON 按钮。复制 JSON 并直接粘贴到 yaml 编辑器中——它会自动 detect JSON 格式并导入所有参数。
  • 粘贴 yaml 或 JSON:将任何有效的 yaml 或 JSON 训练配置粘贴到编辑器中。参数会自动验证,超出范围的值会被钳制并显示警告。
  • 拖放文件:拖动一个 .yaml.json 文件直接拖入编辑器以导入其参数。

Ultralytics 平台训练对话框复制训练配置 JSON

这使得无需手动重新输入每个参数即可轻松复现或迭代先前的训练配置。

我能否从数据集页面进行训练?

是的,数据集页面上的训练按钮会打开训练对话框,其中数据集已预选并锁定。然后,您可以选择一个项目和模型来开始训练。

训练参数参考

参数类型默认值范围描述
epochs整型1001-10000训练轮次(epoch)数量
batch整型161-512批次大小
imgsz整型64032-4096输入图像尺寸
patience整型1001-1000提前停止耐心值
seed整型00-2147483647用于可复现性的随机种子
deterministic布尔值-确定性训练模式
amp布尔值-自动混合精度
close_mosaic整型100-50在最后N个epoch禁用mosaic
save_period整型-1-1-100每 N 个周期保存检查点
workers整型80-64数据加载器工作进程数
cache选择内存/磁盘/否缓存图像
参数类型默认值范围描述
lr0浮点数0.010.0001-0.1初始学习率
lrf浮点数0.010.01-1.0最终学习率因子
momentum浮点数0.9370.6-0.98SGD 动量
weight_decay浮点数0.00050.0-0.001L2 正则化
warmup_epochs浮点数3.00-5预热 epochs
warmup_momentum浮点数0.80.5-0.95预热动量
warmup_bias_lr浮点数0.10.0-0.2预热偏置学习率
cos_lr布尔值-余弦学习率调度器
参数类型默认值范围描述
hsv_h浮点数0.0150.0-0.1HSV 色相增强
hsv_s浮点数0.70.0-1.0HSV 饱和度
hsv_v浮点数0.40.0-1.0HSV 明度
degrees浮点数0.0-45-45旋转角度
translate浮点数0.10.0-1.0平移分数
scale浮点数0.50.0-1.0缩放因子
shear浮点数0.0-10-10剪切度数
perspective浮点数0.00.0-0.001透视变换
fliplr浮点数0.50.0-1.0水平翻转概率
flipud浮点数0.00.0-1.0垂直翻转概率
mosaic浮点数1.00.0-1.0Mosaic 数据增强
mixup浮点数0.00.0-1.0MixUp 数据增强
copy_paste浮点数0.00.0-1.0复制粘贴 (segment)
参数类型默认值范围描述
fraction浮点数1.00.1-1.0要使用的数据集比例
freeze整型null0-100要冻结的层数
single_cls布尔值-将所有类别视为一个类别
rect布尔值-矩形训练
multi_scale浮点数0.00.0-1.0多尺度训练范围
val布尔值-在训练期间运行验证
resume布尔值-从检查点恢复训练
描述
auto自动选择 (默认)
SGD随机梯度下降
MuSGDMuon SGD优化器
AdamAdam 优化器
AdamW带权重衰减的 Adam
NAdamNAdam优化器
RAdamRAdam 优化器
RMSPropRMSProp 优化器
AdamaxAdamax 优化器
参数类型默认值范围描述
box浮点数7.51-50框损失权重
cls浮点数0.50.2-4分类损失权重
dfl浮点数1.50.4-6分布焦点损失
pose浮点数12.01-50姿势估计损失权重(仅限姿势估计)
kobj浮点数1.00.5-10关键点目标性 (姿势估计)
label_smoothing浮点数0.00.0-0.1标签平滑因子

任务特定参数

某些参数仅适用于特定任务:

  • 仅限检测任务 (detect、segment、姿势估计、旋转框检测 — 不包括 classify): box, dfl, degrees, translate, shear, perspective, mosaic, mixup, close_mosaic
  • 仅 segment: copy_paste
  • 仅限姿势估计: pose (损失权重), kobj (关键点目标性)


📅 2个月前创建 ✏️ 1天前更新
glenn-jochermykolaxboikosergiuwaxmannLaughing-q

评论