云端训练
Ultralytics Platform 云端训练提供在云端 GPU 上的一键式训练,让你无需复杂的设置即可进行模型训练。在训练 YOLO 模型的同时,你还可以实时查看指标流并自动保存检查点。
graph LR
A[Configure] --> B[Start Training]
B --> C[Provision GPU]
C --> D[Download Dataset]
D --> E[Train]
E --> F[Stream Metrics]
F --> G[Save Checkpoints]
G --> H[Complete]
style A fill:#2196F3,color:#fff
style B fill:#FF9800,color:#fff
style E fill:#9C27B0,color:#fff
style H fill:#4CAF50,color:#fff训练对话框
通过点击任意项目页面上的 New Model(或者在数据集页面点击 Train),你可以从平台界面启动训练。训练对话框包含两个标签页:Cloud Training 和 Local Training。

第一步:选择基础模型
从官方 YOLO26 模型或你自己的已训练模型中进行选择:
| 类别 | 描述 |
|---|---|
| 官方 | 全部 25 款 YOLO26 模型(5 种尺寸 x 5 种任务) |
| 你的模型 | 你已完成的用于微调的模型 |
官方模型按任务类型进行分类(Detect、Segment、Pose、OBB、Classify),尺寸从 nano 到 xlarge 不等。
第二步:选择数据集
选择一个用于训练的数据集(参阅 Datasets):
| 选项 | 描述 |
|---|---|
| 官方 | 来自 Ultralytics 的精选数据集 |
| 你的数据集 | 你已上传的数据集 |
数据集必须处于 ready 状态,且在训练集(train split)中至少有 1 张图像,在验证集或测试集(validation or test split)中至少有 1 张图像,并且至少有 1 张已标注图像。
如果模型任务(例如 detect)与数据集任务(例如 segment)不匹配,将会出现任务不匹配警告。如果继续执行不匹配的任务,训练将会失败。请确保模型和数据集使用相同的任务类型,具体请参阅任务指南。
第三步:配置参数
设置核心训练参数:
| 参数 | 描述 | 默认值 |
|---|---|---|
| Epochs | 训练迭代次数 | 100 |
| Batch Size | 每次迭代的样本数 | -1 (自动) |
| 图像尺寸 (Image Size) | 输入分辨率(下拉菜单包含 320/416/512/640/1280,在 YAML 编辑器中支持 32-4096 之间任意 32 的倍数) | 640 |
| Run Name | 训练运行的可选名称 | 自动 |
第四步:高级设置(可选)
展开 Advanced Settings 以访问完整的基于 YAML 的参数编辑器,其中包含按组组织的 40 多项训练参数(参阅配置参考):
| 分组 | 参数 |
|---|---|
| 学习率 | lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr |
| Optimizer | auto (默认), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax |
| Loss Weights | box, cls, dfl, pose, kobj, label_smoothing |
| Color Augmentation | hsv_h, hsv_s, hsv_v |
| Geometric Augment. | degrees, translate, scale, shear, perspective |
| Flip & Mix Augment. | flipud, fliplr, mosaic, mixup, copy_paste |
| Training Control | patience, seed, deterministic, amp, cos_lr, close_mosaic, save_period |
| Dataset | fraction, freeze, single_cls, rect, multi_scale, resume |
参数具有任务感知能力(例如,copy_paste 仅在分割任务中显示,pose/kobj 仅在姿态任务中显示)。当数值与默认值不同时,会出现 Modified 徽章,你可以使用重置按钮将所有参数恢复为默认值。
示例:针对小型数据集调整增强
对于小型数据集(<1000 张图像),增加增强以减少过拟合:
mosaic: 1.0 # Keep mosaic on
mixup: 0.3 # Add mixup blending
copy_paste: 0.3 # Add copy-paste (segment only)
fliplr: 0.5 # Horizontal flip
degrees: 10.0 # Slight rotation
scale: 0.9 # Aggressive scaling第五步:选择 GPU(云端标签页)
从 Ultralytics Cloud 中选择你的 GPU:

| GPU | 代次 | 显存 | 成本/小时 | 适用人群 |
|---|---|---|---|---|
| RTX 2000 Ada | Ada | 16 GB | $0.24 | 小型数据集,测试 |
| RTX A4500 | Ampere | 20 GB | $0.25 | 中小型数据集 |
| RTX 4000 Ada | Ada | 20 GB | $0.26 | 中型数据集 |
| RTX A5000 | Ampere | 24 GB | $0.27 | 中型数据集 |
| L4 | Ada | 24 GB | $0.39 | 针对推理优化 |
| A40 | Ampere | 48 GB | $0.44 | 更大的批次大小 |
| RTX 3090 | Ampere | 24 GB | $0.46 | 常规训练 |
| RTX A6000 | Ampere | 48 GB | $0.49 | 大型模型 |
| RTX PRO 4500 | Blackwell | 32 GB | $0.64 | 极佳的性价比 |
| RTX 4090 | Ada | 24 GB | $0.69 | 最优性价比 |
| RTX 6000 Ada | Ada | 48 GB | $0.77 | 大批量训练 |
| L40S | Ada | 48 GB | $0.86 | 大批量训练 |
| RTX 5090 | Blackwell | 32 GB | $0.99 | 最新消费级架构 |
| L40 | Ada | 48 GB | $0.99 | 大型模型 |
| A100 PCIe | Ampere | 80 GB | $1.39 | 生产环境训练 |
| A100 SXM | Ampere | 80 GB | $1.49 | 生产环境训练 |
| RTX PRO 6000 | Blackwell | 96 GB | $1.89 | 默认推荐 |
| H100 PCIe | Hopper | 80 GB | $2.39 | 高性能训练 |
| H100 SXM | Hopper | 80 GB | $2.99 | 最快训练 |
| H100 NVL | Hopper | 94 GB | $3.07 | 极致性能 |
| H200 NVL | Hopper | 143 GB | $3.39 | 最大显存 |
| H200 SXM | Hopper | 141 GB | $3.99 | 极致性能 |
| B200 | Blackwell | 180 GB | $5.49 | 大型模型 (Pro+) |
| B300 | Blackwell | 288 GB | $7.39 | 超大型模型 (Pro+) |
- RTX PRO 6000: 96 GB Blackwell,大多数任务的推荐默认配置
- A100 SXM: 80 GB HBM2e — 适用于大批量或大型模型的强力选择
- H100 PCIe / H100 SXM / H100 NVL: 80–94 GB Hopper,适用于时间敏感型训练(所有方案均可用)
- H200 NVL / H200 SXM: 141–143 GB Hopper,适用于高内存工作负载(所有方案均可用)
- B200 / B300: 180–288 GB NVIDIA Blackwell,适用于前沿工作负载 — 需要 Pro 或 Enterprise
该对话框会显示你的当前 balance 和一个 Top Up 按钮。系统会根据你的配置(模型大小、数据集图像、轮数、GPU 速度)计算预计成本和时长。
第六步:开始训练
点击 Start Training 以启动你的任务。平台将会:
- 配置 GPU 实例
- 下载你的数据集
- 开始训练
- 实时流式传输指标
训练任务生命周期
训练任务会经历以下状态:
| 状态 | 描述 |
|---|---|
| Pending | 任务已提交,等待 GPU 分配 |
| Starting | GPU 已配置,正在下载数据集和模型 |
| Running | 训练进行中,指标实时流式传输 |
| Completed | 训练成功完成 |
| Failed | 训练失败(详情请参阅控制台日志) |
| Cancelled | 训练已被用户取消 |
新账户会获得注册积分——个人邮箱可获得 5 美元,公司邮箱可获得 25 美元。请在 Settings > Billing 中查看你的余额。

监控训练
在模型页面的 Train 标签页中查看实时训练进度:
图表子选项卡

| 指标 | 描述 |
|---|---|
| Loss | 训练和验证损失 |
| mAP | 平均精度均值 |
| Precision | 正确预测的正样本数 |
| Recall | 检测到的真实标签 |
控制台子选项卡
支持 ANSI 颜色、进度条和错误检测的实时控制台输出。
系统子选项卡
实时的 GPU 利用率、内存、温度、CPU 和磁盘占用情况。
检查点
训练完成后,最佳模型(best.pt,即 mAP 最高的检查点)会被上传到平台,供你下载、导出和部署。
取消训练
点击模型页面上的 取消训练 (Cancel Training) 以停止正在运行的任务:
- 计算实例被终止
- 停止扣除点数
- 如果在取消前已达到最佳检查点,该检查点仍然可用
远程训练
graph LR
A[Local GPU] --> B[Train]
B --> C[ultralytics Package]
C --> D[Stream Metrics]
D --> E[Platform Dashboard]
style A fill:#FF9800,color:#fff
style C fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fff在自己的硬件上进行训练,同时将指标流式传输到平台。
平台集成要求 ultralytics>=8.4.35。旧版本将无法与平台配合使用。
pip install -U ultralytics设置 API Key
- 前往
Settings > API Keys - 创建一个新密钥(或者当你打开“本地训练”选项卡时,平台会自动创建一个)
- 设置环境变量:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"使用流式传输进行训练
使用 project 和 name 参数来流式传输指标:
yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
project=username/my-project name=experiment-1训练对话框中的 本地训练 (Local Training) 选项卡会显示一条预配置好的命令,其中包含了你的 API Key、选定的参数以及高级参数。
使用平台数据集
使用 ul:// URI 格式 训练存储在平台上的数据集:
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
project=username/my-project name=exp1使用 ul:// URI 格式可以自动下载并配置你的数据集。该模型会自动关联到平台上的数据集(请参阅 使用平台数据集)。
计费
训练成本基于 GPU 的使用情况计算:
成本预估
在训练开始前,平台会通过以下方式估算总成本:
- 估算每个 epoch 所需秒数(基于数据集大小、模型复杂度、图像尺寸、批处理大小和 GPU 速度)
- 计算总训练时间(用每个 epoch 的秒数乘以 epoch 总数,再加上启动开销)
- 计算预估成本(总训练小时数乘以 GPU 每小时费率)
影响成本的因素:
| 因素 | 影响 |
|---|---|
| 数据集大小 | 更多图像 = 更长的训练时间(基准:RTX 4090 上每 1000 张图像约需 2.8 秒计算时间) |
| 模型大小 | 更大的模型 (m, l, x) 训练速度比 (n, s) 更慢 |
| Epoch 数量 | 直接倍增训练时间 |
| 图像尺寸 (Image Size) | 更大的 imgsz 会增加计算量:320px=0.25x,640px=1.0x(基准),1280px=4.0x |
| Batch Size | 更大的批次效率更高(batch 32 = 约 0.85x 时间,batch 8 = 约 1.2x 时间,相较于 batch 16 基准) |
| GPU 速度 | 更快的 GPU 可缩短训练时间(例如,H100 SXM = 比 RTX 4090 快约 3.4 倍) |
| 启动开销 | 实例初始化、数据下载和预热最多需要 5 分钟(随数据集大小扩展) |
成本示例
成本预估仅为近似值,取决于多种因素。训练对话框会在你开始训练前显示实时预估值。
| 场景 | GPU | 预估成本 |
|---|---|---|
| 500 张图像,YOLO26n,50 个 epoch | RTX 4090 | 约 $0.50 |
| 1000 张图像,YOLO26n,100 个 epoch | RTX PRO 6000 | 约 $5 |
| 5000 张图像,YOLO26s,100 个 epoch | H100 SXM | 约 $23 |
计费流程
graph LR
A[Estimate Cost] --> B[Balance Check]
B --> C[Train]
C --> D[Charge Actual Runtime]
style A fill:#2196F3,color:#fff
style B fill:#FF9800,color:#fff
style C fill:#9C27B0,color:#fff
style D fill:#4CAF50,color:#fff云训练计费流程:
- 预估:在训练开始前计算成本
- 余额检查:在启动前检查可用点数
- 训练:任务在选定的计算资源上运行
- 扣费:最终成本基于实际运行时间计算
计费系统跟踪实际计算使用量,包括中途取消的运行。失败的训练运行不会向你收费。
按任务状态计费
| 状态 | 是否计费? |
|---|---|
| Completed | 是 — 实际使用的 GPU 时间 |
| Cancelled | 是 — 从开始到取消的 GPU 时间 |
| Failed | 否 — 失败的运行不计费 |
| 卡住 (Stuck) | 部分 — 仅收取实际训练时间 |
如果训练任务因配置错误、内存不足或其他任何故障而失败,你无需支付费用。仅对成功的计算时间进行计费。卡住的任务(超过 4 小时没有活动)会自动终止,且仅按 GPU 处于活跃训练状态的时间计费,不收取空闲时间费用。
付款方式
| 方法 | 描述 |
|---|---|
| 账户余额 | 预充值点数 |
| 按任务付费 | 任务完成后扣费 |
开始训练需要有正的可用余额,且余额足以支付预估的任务成本。
查看训练成本
训练完成后,可以在 账单 (Billing) 选项卡中查看详细费用:
- 每个 epoch 的成本明细
- 总 GPU 时间
- 下载成本报告

训练技巧
选择合适的模型大小
| 模型 | 参数 | 适用人群 |
|---|---|---|
| YOLO26n | 2.4M | 实时,边缘设备 |
| YOLO26s | 9.5M | 速度与精度平衡 |
| YOLO26m | 20.4M | 更高的精度 |
| YOLO26l | 24.8M | 生产级精度 |
| YOLO26x | 55.7M | 最大精度 |
优化训练时间
- 从小规模开始:在预算内 GPU 上尝试 10-20 个 epoch,以验证你的数据集和配置是否正常工作
- 使用合适的 GPU:RTX PRO 6000 可以很好地处理大多数工作负载
- 验证数据集:在投入训练资金前修复标注问题
- 尽早监控:如果损失值趋于平稳,请取消训练——你只需为使用的计算时间付费
故障排除
| 问题 | 解决方案 |
|---|---|
| 训练卡在 0% | 检查数据集格式,重试 |
| 内存不足 | 减小批量大小 (batch size) 或使用更大的 GPU |
| 准确率较低 | 增加 epoch 次数,检查数据质量 |
| 训练缓慢 | 考虑使用速度更快的 GPU |
| 任务不匹配错误 | 确保模型和数据集任务相匹配 |
常见问题解答
训练需要多长时间?
训练时间取决于:
- 数据集大小
- 模型大小
- Epoch(轮次)数量
- 已选择的 GPU
典型用时(1000 张图像,100 个 epoch):
| 模型 | RTX PRO 6000 | A100 SXM |
|---|---|---|
| YOLO26n | ~20 分钟 | ~15 分钟 |
| YOLO26m | ~40 分钟 | ~30 分钟 |
| YOLO26x | ~80 分钟 | ~60 分钟 |
训练时间均为预估值,会随数据集复杂度、数据增强设置和批量大小而变化。请参考训练对话框中的费用预估以获得更准确的预测。
我可以过夜训练吗?
可以,训练会持续直到完成。训练结束后你会收到通知。请确保你的账户有足够的余额用于基于 epoch 的训练。
如果我的点数用完了会怎样?
如果在训练过程中你的点数余额归零,训练将持续进行直到完成,你的余额会变为负数。这确保了你的训练任务永远不会在运行中途被中断。
训练完成后,你需要增加点数使余额恢复为正数,然后才能开始新的训练任务。无论余额如何,你已完成的模型、检查点以及所有训练产物都会被完全保留。
负余额只会阻止开始新的训练任务。现有的部署和其他平台功能将继续正常工作。通过 Settings > Billing 增加点数,或开启 auto top-up 以避免中断。
如果我的训练成本超过了预估值会怎样?
成本预估均为近似值 —— 实际训练时间可能会因数据加载速度、GPU 预热和模型收敛行为等因素而有所不同。如果实际成本超过预估值,你的余额可能会变为负数(见上文)。平台不会根据预估值停止训练。
管理成本的方法:
- 实时监控训练进度,必要时提前取消
- 开启 auto top-up 以自动补充点数
- 从较短的运行(较少的 epoch)开始以校准预期
我可以使用自定义训练参数吗?
可以,展开训练对话框中的 Advanced Settings 部分,即可访问包含 40 多个可配置参数的 YAML 编辑器。非默认值会被包含在云端和本地训练命令中。
YAML 编辑器还支持从之前的训练运行导入配置:
- 从现有模型复制:在任何已完成模型的页面上,训练配置卡片都有一个 Copy as JSON 按钮。复制该 JSON 并将其直接粘贴到 YAML 编辑器中 —— 它会自动检测 JSON 格式并导入所有参数。
- 粘贴 YAML 或 JSON:将任何有效的 YAML 或 JSON 训练配置粘贴到编辑器中。参数会自动进行验证,超出范围的值会被钳制并显示警告。
- 拖放文件:将
.yaml或.json文件直接拖入编辑器即可导入其参数。

这使得无需手动重新输入每个参数即可轻松复现或迭代之前的训练配置。
我可以从数据集页面开始训练吗?
可以,数据集页面上的 Train 按钮会打开训练对话框,并预选并锁定该数据集。然后你可以选择项目和模型来开始训练。
训练参数参考
| 参数 | 类型 | 默认值 | 范围 | 描述 |
|---|---|---|---|---|
epochs | int | 100 | 1-10000 | 训练 epoch 数量 |
batch | int | -1 (自动) | -1 到 512 | 批量大小 (-1 = 自动适应可用 VRAM) |
imgsz | int | 640 | 32-4096 | 输入图像尺寸 |
patience | int | 100 | 1-1000 | 提前停止的耐心值 |
seed | int | 0 | 0-2147483647 | 用于可复现性的随机种子 |
deterministic | bool | True | - | 确定性训练模式 |
amp | bool | True | - | 自动混合精度 |
close_mosaic | int | 10 | 0-50 | 在最后 N 个 epoch 禁用 Mosaic 数据增强 |
save_period | int | -1 | -1-100 | 每 N 个 epoch 保存一次检查点 |
workers | int | 8 | 0-64 | 数据加载器工作进程数 |
cache | select | false | ram/disk/false | 缓存图像 |
部分参数仅适用于特定任务:
- 仅限检测任务(detect, segment, pose, OBB — 不包含 classify):
box,dfl,degrees,translate,shear,perspective,mosaic,mixup,close_mosaic - 仅限 segment 任务:
copy_paste - 仅限 pose 任务:
pose(损失权重),kobj(关键点目标性)