云端训练
Ultralytics Platform 云训练提供云端GPU上的一键式训练,使模型训练无需复杂设置即可进行。训练YOLO模型时,可享受实时指标流和自动检查点保存功能。
graph LR
A[Configure] --> B[Start Training]
B --> C[Provision GPU]
C --> D[Download Dataset]
D --> E[Train]
E --> F[Stream Metrics]
F --> G[Save Checkpoints]
G --> H[Complete]
style A fill:#2196F3,color:#fff
style B fill:#FF9800,color:#fff
style E fill:#9C27B0,color:#fff
style H fill:#4CAF50,color:#fff
训练对话
通过在任意项目页面上点击新建模型(或在数据集页面上点击训练)从平台UI启动训练。训练对话框有两个选项卡:云训练和本地训练。

步骤 1:选择基础模型
从官方 YOLO26 模型或您自己训练的模型中选择:
| 类别 | 描述 |
|---|---|
| 官方 | 所有25个YOLO26模型(5种尺寸 x 5种任务) |
| 您的模型 | 您已完成的用于微调的模型 |
官方模型按任务类型(Detect、Segment、姿势估计、旋转框检测、Classify)组织,尺寸从nano到xlarge。
步骤 2:选择数据集
选择要用于训练的数据集(参见 数据集):
| 选项 | 描述 |
|---|---|
| 官方 | 来自 Ultralytics 的精选数据集 |
| 您的数据集 | 您已上传的数据集 |
数据集要求
数据集必须采用 ready 状态,其中训练集至少包含1张图像,验证集或测试集至少包含1张图像,并且至少有1张已标注图像。
任务不匹配
如果模型任务(例如,detect)与数据集任务(例如,segment)不匹配,将出现任务不匹配警告。如果您继续使用不匹配的任务,训练将失败。请确保模型和数据集都使用相同的任务类型,如任务指南中所述。
步骤 3:配置参数
设置核心训练参数:
| 参数 | 描述 | 默认值 |
|---|---|---|
| 训练轮次 | 训练迭代次数 | 100 |
| 批量大小 | 每次迭代的样本数 | 16 |
| 图像大小 | 输入分辨率(320/416/512/640/1280 下拉菜单,或 YAML 编辑器中 32-4096) | 640 |
| 运行名称 | 训练运行的可选名称 | 自动 |
步骤 4:高级设置(可选)
展开高级设置以访问完整的基于yaml的参数编辑器,其中包含按组组织的40多个训练参数(参见配置参考):
| 组 | 参数 |
|---|---|
| 学习率 | lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr |
| 优化器 | SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax |
| 损失权重 | 框、类别、DFL、姿势估计、kobj、标签平滑 |
| 颜色增强 | hsv_h, hsv_s, hsv_v |
| 几何增强 | 度、平移、缩放、剪切、透视 |
| 翻转与混合增强 | 上下翻转、左右翻转、马赛克、MixUp、复制粘贴 |
| 训练控制 | 容忍度, 种子, 确定性, amp, cos_lr, close_mosaic, 保存周期 |
| 数据集 | 比例, 冻结, 单类别, 矩形, 多尺度, 恢复 |
参数是任务感知的(例如, copy_paste 仅显示 segment 任务, pose/kobj 仅适用于姿势估计任务)。A 已修改 当值与默认值不同时,会出现徽章,您可以使用重置按钮将所有设置重置为默认值。
示例:为小型数据集调整数据增强
For small datasets (<1000 images), increase augmentation to reduce overfitting:
mosaic: 1.0 # Keep mosaic on
mixup: 0.3 # Add mixup blending
copy_paste: 0.3 # Add copy-paste (segment only)
fliplr: 0.5 # Horizontal flip
degrees: 10.0 # Slight rotation
scale: 0.9 # Aggressive scaling
步骤 5:选择 GPU(云选项卡)
从 Ultralytics Cloud 中选择您的 GPU:

| GPU | 显存 | 每小时费用 |
|---|---|---|
| RTX 2000 Ada | 16 GB | $0.24 |
| RTX A4500 | 20 GB | $0.24 |
| RTX A5000 | 24 GB | $0.26 |
| RTX 4000 Ada | 20 GB | $0.38 |
| L4 | 24 GB | $0.39 |
| A40 | 48 GB | $0.40 |
| RTX 3090 | 24 GB | $0.46 |
| RTX A6000 | 48 GB | $0.49 |
| RTX 4090 | 24 GB | $0.59 |
| RTX 6000 Ada | 48 GB | $0.77 |
| L40S | 48 GB | $0.86 |
| RTX 5090 | 32 GB | $0.89 |
| L40 | 48 GB | $0.99 |
| A100 PCIe | 80 GB | $1.39 |
| A100 SXM | 80 GB | $1.49 |
| RTX PRO 6000 | 96 GB | $1.89 |
| H100 PCIe | 80 GB | $2.39 |
| H100 SXM | 80 GB | $2.69 |
| H100 NVL | 94 GB | $3.07 |
| H200 NVL | 143 GB | $3.39 |
| H200 SXM | 141 GB | $3.59 |
| B200 | 180 GB | $4.99 |
GPU 选择
- RTX PRO 6000: 96 GB Blackwell 代,大多数任务的推荐默认 GPU
- A100 SXM: 大型批处理或大型模型所需
- H100/H200:为对时间敏感的训练提供最佳性能(H200 需Pro 或 Enterprise 版本)
- B200:适用于尖端工作负载的NVIDIA 架构(需Pro 或 Enterprise 版本)
对话框显示您当前的余额和一个充值按钮。估算成本和持续时间会根据您的配置(模型大小、数据集图像、训练轮次、GPU 速度)进行计算。
步骤 6:开始训练
点击 开始训练 以启动您的任务。平台将:
- 调配一个 GPU 实例
- 下载您的数据集
- 开始训练
- 实时传输指标
训练作业生命周期
训练任务会经历以下状态:
| 状态 | 描述 |
|---|---|
| 待处理 | 任务已提交,等待 GPU 分配 |
| 正在启动 | GPU 已配置,正在下载数据集和模型 |
| 正在运行 | 训练进行中,指标实时流式传输 |
| 已完成 | 训练成功完成 |
| 失败 | 训练失败(详情请参阅控制台日志) |
| 已取消 | 训练已由用户取消 |
免费积分
新账户可获得注册积分——个人邮箱 5 美元,公司邮箱 25 美元。查看您的余额在“设置”>“账单”中。

监控训练
在模型页面的训练选项卡上查看实时训练进度:
图表子选项卡

| 指标 | 描述 |
|---|---|
| 损失 | 训练和验证损失 |
| mAP | 平均精度均值 |
| 精确度 | 正确正向预测 |
| 召回率 | 检测到的真实值 |
控制台子选项卡
支持ANSI颜色、进度条和错误检测的实时控制台输出。
系统子选项卡
实时GPU利用率、内存、温度、CPU和磁盘使用情况。
检查点
检查点自动保存:
- 每个 epoch:保存最新权重
- 最佳模型:保留 mAP 最高的检查点
- 最终模型:训练完成时的权重
取消训练
在模型页面上点击 取消训练 以停止正在运行的任务:
- 计算实例已终止
- 积分停止计费
- 在此之前保存的检查点都将得到保留
远程训练
graph LR
A[Local GPU] --> B[Train]
B --> C[ultralytics Package]
C --> D[Stream Metrics]
D --> E[Platform Dashboard]
style A fill:#FF9800,color:#fff
style C fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fff
在您自己的硬件上训练,同时将指标流式传输到平台。
软件包版本要求
平台集成需要ultralytics>=8.4.14。更低版本将无法与平台配合使用。
pip install -U ultralytics
设置API密钥
- 前往
Settings > Profile(API密钥部分) - 创建新密钥(或者当您打开“本地训练”选项卡时,平台会自动创建一个)
- 设置环境变量:
export ULTRALYTICS_API_KEY="your_api_key"
使用流式传输进行训练
使用 project 和 name 用于流式传输指标的参数:
yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
project=username/my-project name=experiment-1
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(
data="coco.yaml",
epochs=100,
project="username/my-project",
name="experiment-1",
)
训练对话框中的“本地训练”选项卡显示了一个预配置命令,其中包含您的 API 密钥、选定参数和高级参数。
使用平台数据集
使用存储在平台上的数据集进行训练,通过 ul:// URI格式:
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
project=username/my-project name=exp1
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(
data="ul://username/datasets/my-dataset",
epochs=100,
project="username/my-project",
name="exp1",
)
字段 ul:// URI格式会自动下载并配置您的数据集。模型会自动链接到平台上的数据集(参见 使用平台数据集)。
账单
训练成本基于 GPU 使用情况:
成本估算
在训练开始之前,平台会通过以下方式估算总成本:
- 估算每个epoch的秒数根据数据集大小、模型复杂度、图像尺寸、批处理大小和GPU速度
- 计算总训练时间:将每轮秒数乘以轮数,然后加上启动开销
- 计算估算成本:总训练小时数乘以GPU的每小时费率。
影响成本的因素:
| 因素 | 影响 |
|---|---|
| 数据集大小 | 更多图像 = 更长的训练时间(基准:在RTX 4090上每1000张图像计算约2.8秒) |
| 模型大小 | 大型模型(m、l、x)训练速度比(n、s)慢 |
| Epochs 数量 | 直接影响训练时间 |
| 图像大小 | 更大的 imgsz 会增加计算量:320px=0.25倍,640px=1.0倍(基准),1280px=4.0倍 |
| 批量大小 | 更大的批次更高效(批次大小 32 = 约 0.85 倍时间,批次大小 8 = 约 1.2 倍时间,对比批次大小 16 基准) |
| GPU 速度 | 更快的GPU可缩短训练时间(例如,H100 SXM 比 RTX 4090 快约 3.4 倍) |
| 启动开销 | 实例初始化、数据下载和预热最多需要 5 分钟(随数据集大小而变化) |
成本示例
预估
成本估算为近似值,并取决于多种因素。训练对话框会在您开始训练之前显示实时估算。
| 场景 | GPU | 预估成本 |
|---|---|---|
| 500 图像, YOLO26n, 50 轮次 | RTX 4090 | 约$0.50 |
| 1000 张图像,YOLO26n,100 个 epoch | RTX PRO 6000 | 约$5 |
| 5000 图像, YOLO26s, 100 轮次 | H100 SXM | 约$23 |
计费流程
graph LR
A[Estimate Cost] --> B[Balance Check]
B --> C[Train]
C --> D[Charge Actual Runtime]
style A fill:#2196F3,color:#fff
style B fill:#FF9800,color:#fff
style C fill:#9C27B0,color:#fff
style D fill:#4CAF50,color:#fff
云端训练计费流程:
- 预估:在训练开始前计算的费用
- 余额检查:在启动前检查可用积分
- 训练:任务在所选计算资源上运行
- 费用:最终费用基于实际运行时长
消费者保护
计费跟踪实际计算使用量,包括已取消的部分运行。失败的训练运行绝不收费。
按作业状态计费
| 状态 | 是否收费? |
|---|---|
| 已完成 | 是的 — 实际使用的 GPU 时间 |
| 已取消 | 是的 — 从开始到取消的 GPU 时间 |
| 失败 | 否 — 失败的运行不收费 |
| 卡住 | 部分 — 仅收取实际训练时间费用 |
错误不收费
如果训练运行因配置错误、内存不足问题或任何其他故障而失败,您将不被收费。仅对成功的计算时间计费。卡住的作业(4 小时以上无活动)会自动终止,并且仅对 GPU 实际训练的时间收费,而不是空闲时间。
支付方式
| 方法 | 描述 |
|---|---|
| 账户余额 | 预加载积分 |
| 按任务付费 | 任务完成后收费 |
最低余额
开始训练需要有正数的可用余额以及足够的积分来支付预估任务成本。
查看训练成本
训练完成后,在账单选项卡中查看详细费用:
- 每周期费用明细
- 总计 GPU 时间
- 下载费用报告

训练技巧
选择合适的模型大小
| 模型 | 参数 | 最适合 |
|---|---|---|
| YOLO26n | 2.4M | 实时、边缘设备 |
| YOLO26s | 9.5M | 平衡的速度/精度 |
| YOLO26m | 20.4M | 更高精度 |
| YOLO26l | 24.8M | 生产级精度 |
| YOLO26x | 55.7M | 最大精度 |
优化训练时间
成本节约策略
- 小规模开始:在预算型 GPU 上使用 10-20 个 epoch 进行测试,以验证您的数据集和配置是否正常工作。
- 使用合适的GPU:RTX PRO 6000能很好地处理大多数工作负载
- 验证数据集:在投入训练之前修复标注问题
- 早期监控:如果损失趋于平稳,则取消训练 — 您只需支付所使用的计算时间
故障排除
| 问题 | 解决方案 |
|---|---|
| 训练停滞在0% | 检查数据集格式,重试 |
| 内存不足 | 减小批次大小或使用更大的 GPU |
| 精度不佳 | 增加周期数,检查数据质量 |
| 训练缓慢 | 考虑更快的 GPU |
| 任务不匹配错误 | 确保模型和数据集任务匹配 |
常见问题
训练需要多长时间?
训练时间取决于:
- 数据集大小
- 模型大小
- 训练轮次
- 所选 GPU
典型时间(1000张图像,100个epoch):
| 模型 | RTX PRO 6000 | A100 |
|---|---|---|
| YOLO26n | 20分钟 | 20分钟 |
| YOLO26m | 40分钟 | 40分钟 |
| YOLO26x | 80分钟 | 80分钟 |
我可以通宵训练吗?
是的,训练将持续到完成。训练完成后您将收到通知。请确保您的账户有足够的余额进行基于 epoch 的训练。
如果我的积分用完了怎么办?
如果您的信用余额在训练运行期间达到零,训练将继续完成,您的余额将变为负值。这确保您的训练作业在运行中途不会中断。
训练完成后,您需要添加积分以使您的余额恢复正值,然后才能开始新的训练作业。无论余额如何,您已完成的模型、检查点和所有训练工件都将完全保留。
如果我的训练成本超出估算怎么办?
成本估算为近似值——实际训练时间可能因数据加载速度、GPU 预热和模型收敛行为等因素而异。如果实际成本超出估算,您的余额可能会变为负值(参见上文)。平台不会根据估算停止训练。
为了管理成本:
- 实时监控训练进度,并在需要时提前取消
- 启用自动充值以自动补充积分
- 从较短的运行(更少的 epoch)开始,以校准预期
我可以使用自定义训练参数吗?
是的,展开训练对话框中的高级设置部分,即可访问一个包含40多个可配置参数的YAML编辑器。非默认值将包含在云端和本地训练命令中。
yaml 编辑器还支持从之前的训练运行中导入配置:
- 从现有模型复制:在任何已完成模型的页面上,“训练配置”卡片都有一个复制为 JSON 按钮。复制 JSON 并直接粘贴到 yaml 编辑器中——它会自动 detect JSON 格式并导入所有参数。
- 粘贴 yaml 或 JSON:将任何有效的 yaml 或 JSON 训练配置粘贴到编辑器中。参数会自动验证,超出范围的值会被钳制并显示警告。
- 拖放文件:拖动一个
.yaml或.json文件直接拖入编辑器以导入其参数。

这使得无需手动重新输入每个参数即可轻松复现或迭代先前的训练配置。
我能否从数据集页面进行训练?
是的,数据集页面上的训练按钮会打开训练对话框,其中数据集已预选并锁定。然后,您可以选择一个项目和模型来开始训练。
训练参数参考
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
epochs | 整型 | 100 | 1-10000 | 训练轮次(epoch)数量 |
batch | 整型 | 16 | 1-512 | 批次大小 |
imgsz | 整型 | 640 | 32-4096 | 输入图像尺寸 |
patience | 整型 | 100 | 1-1000 | 提前停止耐心值 |
seed | 整型 | 0 | 0-2147483647 | 用于可复现性的随机种子 |
deterministic | 布尔值 | 真 | - | 确定性训练模式 |
amp | 布尔值 | 真 | - | 自动混合精度 |
close_mosaic | 整型 | 10 | 0-50 | 在最后N个epoch禁用mosaic |
save_period | 整型 | -1 | -1-100 | 每 N 个周期保存检查点 |
workers | 整型 | 8 | 0-64 | 数据加载器工作进程数 |
cache | 选择 | 否 | 内存/磁盘/否 | 缓存图像 |
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
lr0 | 浮点数 | 0.01 | 0.0001-0.1 | 初始学习率 |
lrf | 浮点数 | 0.01 | 0.01-1.0 | 最终学习率因子 |
momentum | 浮点数 | 0.937 | 0.6-0.98 | SGD 动量 |
weight_decay | 浮点数 | 0.0005 | 0.0-0.001 | L2 正则化 |
warmup_epochs | 浮点数 | 3.0 | 0-5 | 预热 epochs |
warmup_momentum | 浮点数 | 0.8 | 0.5-0.95 | 预热动量 |
warmup_bias_lr | 浮点数 | 0.1 | 0.0-0.2 | 预热偏置学习率 |
cos_lr | 布尔值 | 否 | - | 余弦学习率调度器 |
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
hsv_h | 浮点数 | 0.015 | 0.0-0.1 | HSV 色相增强 |
hsv_s | 浮点数 | 0.7 | 0.0-1.0 | HSV 饱和度 |
hsv_v | 浮点数 | 0.4 | 0.0-1.0 | HSV 明度 |
degrees | 浮点数 | 0.0 | -45-45 | 旋转角度 |
translate | 浮点数 | 0.1 | 0.0-1.0 | 平移分数 |
scale | 浮点数 | 0.5 | 0.0-1.0 | 缩放因子 |
shear | 浮点数 | 0.0 | -10-10 | 剪切度数 |
perspective | 浮点数 | 0.0 | 0.0-0.001 | 透视变换 |
fliplr | 浮点数 | 0.5 | 0.0-1.0 | 水平翻转概率 |
flipud | 浮点数 | 0.0 | 0.0-1.0 | 垂直翻转概率 |
mosaic | 浮点数 | 1.0 | 0.0-1.0 | Mosaic 数据增强 |
mixup | 浮点数 | 0.0 | 0.0-1.0 | MixUp 数据增强 |
copy_paste | 浮点数 | 0.0 | 0.0-1.0 | 复制粘贴 (segment) |
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
fraction | 浮点数 | 1.0 | 0.1-1.0 | 要使用的数据集比例 |
freeze | 整型 | null | 0-100 | 要冻结的层数 |
single_cls | 布尔值 | 否 | - | 将所有类别视为一个类别 |
rect | 布尔值 | 否 | - | 矩形训练 |
multi_scale | 浮点数 | 0.0 | 0.0-1.0 | 多尺度训练范围 |
val | 布尔值 | 真 | - | 在训练期间运行验证 |
resume | 布尔值 | 否 | - | 从检查点恢复训练 |
| 值 | 描述 |
|---|---|
auto | 自动选择 (默认) |
SGD | 随机梯度下降 |
MuSGD | Muon SGD优化器 |
Adam | Adam 优化器 |
AdamW | 带权重衰减的 Adam |
NAdam | NAdam优化器 |
RAdam | RAdam 优化器 |
RMSProp | RMSProp 优化器 |
Adamax | Adamax 优化器 |
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
box | 浮点数 | 7.5 | 1-50 | 框损失权重 |
cls | 浮点数 | 0.5 | 0.2-4 | 分类损失权重 |
dfl | 浮点数 | 1.5 | 0.4-6 | 分布焦点损失 |
pose | 浮点数 | 12.0 | 1-50 | 姿势估计损失权重(仅限姿势估计) |
kobj | 浮点数 | 1.0 | 0.5-10 | 关键点目标性 (姿势估计) |
label_smoothing | 浮点数 | 0.0 | 0.0-0.1 | 标签平滑因子 |
任务特定参数
某些参数仅适用于特定任务:
- 仅限检测任务 (detect、segment、姿势估计、旋转框检测 — 不包括 classify):
box,dfl,degrees,translate,shear,perspective,mosaic,mixup,close_mosaic - 仅 segment:
copy_paste - 仅限姿势估计:
pose(损失权重),kobj(关键点目标性)