云端训练

Ultralytics Platform 云端训练提供在云端 GPU 上的一键式训练,让你无需复杂的设置即可进行模型训练。在训练 YOLO 模型的同时,你还可以实时查看指标流并自动保存检查点。

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

训练对话框

通过点击任意项目页面上的 New Model(或者在数据集页面点击 Train),你可以从平台界面启动训练。训练对话框包含两个标签页:Cloud TrainingLocal Training

Ultralytics Platform Training Dialog Cloud Tab

第一步:选择基础模型

从官方 YOLO26 模型或你自己的已训练模型中进行选择:

类别描述
官方全部 25 款 YOLO26 模型(5 种尺寸 x 5 种任务)
你的模型你已完成的用于微调的模型

官方模型按任务类型进行分类(DetectSegmentPoseOBBClassify),尺寸从 nano 到 xlarge 不等。

第二步:选择数据集

选择一个用于训练的数据集(参阅 Datasets):

选项描述
官方来自 Ultralytics 的精选数据集
你的数据集你已上传的数据集
数据集要求

数据集必须处于 ready 状态,且在训练集(train split)中至少有 1 张图像,在验证集或测试集(validation or test split)中至少有 1 张图像,并且至少有 1 张已标注图像。

任务不匹配

如果模型任务(例如 detect)与数据集任务(例如 segment)不匹配,将会出现任务不匹配警告。如果继续执行不匹配的任务,训练将会失败。请确保模型和数据集使用相同的任务类型,具体请参阅任务指南

第三步:配置参数

设置核心训练参数:

参数描述默认值
Epochs训练迭代次数100
Batch Size每次迭代的样本数-1 (自动)
图像尺寸 (Image Size)输入分辨率(下拉菜单包含 320/416/512/640/1280,在 YAML 编辑器中支持 32-4096 之间任意 32 的倍数)640
Run Name训练运行的可选名称自动

第四步:高级设置(可选)

展开 Advanced Settings 以访问完整的基于 YAML 的参数编辑器,其中包含按组组织的 40 多项训练参数(参阅配置参考):

分组参数
学习率lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
Optimizerauto (默认), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax
Loss Weightsbox, cls, dfl, pose, kobj, label_smoothing
Color Augmentationhsv_h, hsv_s, hsv_v
Geometric Augment.degrees, translate, scale, shear, perspective
Flip & Mix Augment.flipud, fliplr, mosaic, mixup, copy_paste
Training Controlpatience, seed, deterministic, amp, cos_lr, close_mosaic, save_period
Datasetfraction, freeze, single_cls, rect, multi_scale, resume

参数具有任务感知能力(例如,copy_paste 仅在分割任务中显示,pose/kobj 仅在姿态任务中显示)。当数值与默认值不同时,会出现 Modified 徽章,你可以使用重置按钮将所有参数恢复为默认值。

示例:针对小型数据集调整增强

对于小型数据集(<1000 张图像),增加增强以减少过拟合:

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

第五步:选择 GPU(云端标签页)

从 Ultralytics Cloud 中选择你的 GPU:

Ultralytics Platform Training Dialog Gpu Selector And Cost

GPU代次显存成本/小时适用人群
RTX 2000 AdaAda16 GB$0.24小型数据集,测试
RTX A4500Ampere20 GB$0.25中小型数据集
RTX 4000 AdaAda20 GB$0.26中型数据集
RTX A5000Ampere24 GB$0.27中型数据集
L4Ada24 GB$0.39针对推理优化
A40Ampere48 GB$0.44更大的批次大小
RTX 3090Ampere24 GB$0.46常规训练
RTX A6000Ampere48 GB$0.49大型模型
RTX PRO 4500Blackwell32 GB$0.64极佳的性价比
RTX 4090Ada24 GB$0.69最优性价比
RTX 6000 AdaAda48 GB$0.77大批量训练
L40SAda48 GB$0.86大批量训练
RTX 5090Blackwell32 GB$0.99最新消费级架构
L40Ada48 GB$0.99大型模型
A100 PCIeAmpere80 GB$1.39生产环境训练
A100 SXMAmpere80 GB$1.49生产环境训练
RTX PRO 6000Blackwell96 GB$1.89默认推荐
H100 PCIeHopper80 GB$2.39高性能训练
H100 SXMHopper80 GB$2.99最快训练
H100 NVLHopper94 GB$3.07极致性能
H200 NVLHopper143 GB$3.39最大显存
H200 SXMHopper141 GB$3.99极致性能
B200Blackwell180 GB$5.49大型模型 (Pro+)
B300Blackwell288 GB$7.39超大型模型 (Pro+)
GPU 选择
  • RTX PRO 6000: 96 GB Blackwell,大多数任务的推荐默认配置
  • A100 SXM: 80 GB HBM2e — 适用于大批量或大型模型的强力选择
  • H100 PCIe / H100 SXM / H100 NVL: 80–94 GB Hopper,适用于时间敏感型训练(所有方案均可用)
  • H200 NVL / H200 SXM: 141–143 GB Hopper,适用于高内存工作负载(所有方案均可用)
  • B200 / B300: 180–288 GB NVIDIA Blackwell,适用于前沿工作负载 — 需要 Pro 或 Enterprise

该对话框会显示你的当前 balance 和一个 Top Up 按钮。系统会根据你的配置(模型大小、数据集图像、轮数、GPU 速度)计算预计成本和时长。

第六步:开始训练

点击 Start Training 以启动你的任务。平台将会:

  1. 配置 GPU 实例
  2. 下载你的数据集
  3. 开始训练
  4. 实时流式传输指标

训练任务生命周期

训练任务会经历以下状态:

状态描述
Pending任务已提交,等待 GPU 分配
StartingGPU 已配置,正在下载数据集和模型
Running训练进行中,指标实时流式传输
Completed训练成功完成
Failed训练失败(详情请参阅控制台日志)
Cancelled训练已被用户取消
免费额度

新账户会获得注册积分——个人邮箱可获得 5 美元,公司邮箱可获得 25 美元。请在 Settings > Billing 中查看你的余额

Ultralytics Platform Training Progress With Charts

监控训练

在模型页面的 Train 标签页中查看实时训练进度:

图表子选项卡

Ultralytics Platform Model Training Live Charts

指标描述
Loss训练和验证损失
mAP平均精度均值
Precision正确预测的正样本数
Recall检测到的真实标签

控制台子选项卡

支持 ANSI 颜色、进度条和错误检测的实时控制台输出。

系统子选项卡

实时的 GPU 利用率、内存、温度、CPU 和磁盘占用情况。

检查点

训练完成后,最佳模型best.pt,即 mAP 最高的检查点)会被上传到平台,供你下载、导出和部署。

取消训练

点击模型页面上的 取消训练 (Cancel Training) 以停止正在运行的任务:

  • 计算实例被终止
  • 停止扣除点数
  • 如果在取消前已达到最佳检查点,该检查点仍然可用

远程训练

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

在自己的硬件上进行训练,同时将指标流式传输到平台。

软件包版本要求

平台集成要求 ultralytics>=8.4.35。旧版本将无法与平台配合使用。

pip install -U ultralytics

设置 API Key

  1. 前往 Settings > API Keys
  2. 创建一个新密钥(或者当你打开“本地训练”选项卡时,平台会自动创建一个)
  3. 设置环境变量:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"

使用流式传输进行训练

使用 projectname 参数来流式传输指标:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1

训练对话框中的 本地训练 (Local Training) 选项卡会显示一条预配置好的命令,其中包含了你的 API Key、选定的参数以及高级参数。

使用平台数据集

使用 ul:// URI 格式 训练存储在平台上的数据集:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1

使用 ul:// URI 格式可以自动下载并配置你的数据集。该模型会自动关联到平台上的数据集(请参阅 使用平台数据集)。

计费

训练成本基于 GPU 的使用情况计算:

成本预估

在训练开始前,平台会通过以下方式估算总成本:

  1. 估算每个 epoch 所需秒数(基于数据集大小、模型复杂度、图像尺寸、批处理大小和 GPU 速度)
  2. 计算总训练时间(用每个 epoch 的秒数乘以 epoch 总数,再加上启动开销)
  3. 计算预估成本(总训练小时数乘以 GPU 每小时费率)

影响成本的因素:

因素影响
数据集大小更多图像 = 更长的训练时间(基准:RTX 4090 上每 1000 张图像约需 2.8 秒计算时间)
模型大小更大的模型 (m, l, x) 训练速度比 (n, s) 更慢
Epoch 数量直接倍增训练时间
图像尺寸 (Image Size)更大的 imgsz 会增加计算量:320px=0.25x,640px=1.0x(基准),1280px=4.0x
Batch Size更大的批次效率更高(batch 32 = 约 0.85x 时间,batch 8 = 约 1.2x 时间,相较于 batch 16 基准)
GPU 速度更快的 GPU 可缩短训练时间(例如,H100 SXM = 比 RTX 4090 快约 3.4 倍)
启动开销实例初始化、数据下载和预热最多需要 5 分钟(随数据集大小扩展)

成本示例

预估值

成本预估仅为近似值,取决于多种因素。训练对话框会在你开始训练前显示实时预估值。

场景GPU预估成本
500 张图像,YOLO26n,50 个 epochRTX 4090约 $0.50
1000 张图像,YOLO26n,100 个 epochRTX PRO 6000约 $5
5000 张图像,YOLO26s,100 个 epochH100 SXM约 $23

计费流程

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

云训练计费流程:

  1. 预估:在训练开始前计算成本
  2. 余额检查:在启动前检查可用点数
  3. 训练:任务在选定的计算资源上运行
  4. 扣费:最终成本基于实际运行时间计算
消费者保护

计费系统跟踪实际计算使用量,包括中途取消的运行。失败的训练运行不会向你收费。

按任务状态计费

状态是否计费?
Completed是 — 实际使用的 GPU 时间
Cancelled是 — 从开始到取消的 GPU 时间
Failed否 — 失败的运行不计费
卡住 (Stuck)部分 — 仅收取实际训练时间
错误不计费

如果训练任务因配置错误、内存不足或其他任何故障而失败,你无需支付费用。仅对成功的计算时间进行计费。卡住的任务(超过 4 小时没有活动)会自动终止,且仅按 GPU 处于活跃训练状态的时间计费,不收取空闲时间费用。

付款方式

方法描述
账户余额预充值点数
按任务付费任务完成后扣费
最低余额

开始训练需要有正的可用余额,且余额足以支付预估的任务成本。

查看训练成本

训练完成后,可以在 账单 (Billing) 选项卡中查看详细费用:

  • 每个 epoch 的成本明细
  • 总 GPU 时间
  • 下载成本报告

Ultralytics 平台训练账单明细

训练技巧

选择合适的模型大小

模型参数适用人群
YOLO26n2.4M实时,边缘设备
YOLO26s9.5M速度与精度平衡
YOLO26m20.4M更高的精度
YOLO26l24.8M生产级精度
YOLO26x55.7M最大精度

优化训练时间

节省成本的策略
  1. 从小规模开始:在预算内 GPU 上尝试 10-20 个 epoch,以验证你的数据集和配置是否正常工作
  2. 使用合适的 GPU:RTX PRO 6000 可以很好地处理大多数工作负载
  3. 验证数据集:在投入训练资金前修复标注问题
  4. 尽早监控:如果损失值趋于平稳,请取消训练——你只需为使用的计算时间付费

故障排除

问题解决方案
训练卡在 0%检查数据集格式,重试
内存不足减小批量大小 (batch size) 或使用更大的 GPU
准确率较低增加 epoch 次数,检查数据质量
训练缓慢考虑使用速度更快的 GPU
任务不匹配错误确保模型和数据集任务相匹配

常见问题解答

训练需要多长时间?

训练时间取决于:

  • 数据集大小
  • 模型大小
  • Epoch(轮次)数量
  • 已选择的 GPU

典型用时(1000 张图像,100 个 epoch):

模型RTX PRO 6000A100 SXM
YOLO26n~20 分钟~15 分钟
YOLO26m~40 分钟~30 分钟
YOLO26x~80 分钟~60 分钟
预估时间

训练时间均为预估值,会随数据集复杂度、数据增强设置和批量大小而变化。请参考训练对话框中的费用预估以获得更准确的预测。

我可以过夜训练吗?

可以,训练会持续直到完成。训练结束后你会收到通知。请确保你的账户有足够的余额用于基于 epoch 的训练。

如果我的点数用完了会怎样?

如果在训练过程中你的点数余额归零,训练将持续进行直到完成,你的余额会变为负数。这确保了你的训练任务永远不会在运行中途被中断。

训练完成后,你需要增加点数使余额恢复为正数,然后才能开始新的训练任务。无论余额如何,你已完成的模型、检查点以及所有训练产物都会被完全保留。

负余额

负余额只会阻止开始新的训练任务。现有的部署和其他平台功能将继续正常工作。通过 Settings > Billing 增加点数,或开启 auto top-up 以避免中断。

如果我的训练成本超过了预估值会怎样?

成本预估均为近似值 —— 实际训练时间可能会因数据加载速度、GPU 预热和模型收敛行为等因素而有所不同。如果实际成本超过预估值,你的余额可能会变为负数(见上文)。平台不会根据预估值停止训练。

管理成本的方法:

  • 实时监控训练进度,必要时提前取消
  • 开启 auto top-up 以自动补充点数
  • 从较短的运行(较少的 epoch)开始以校准预期

我可以使用自定义训练参数吗?

可以,展开训练对话框中的 Advanced Settings 部分,即可访问包含 40 多个可配置参数的 YAML 编辑器。非默认值会被包含在云端和本地训练命令中。

YAML 编辑器还支持从之前的训练运行导入配置

  • 从现有模型复制:在任何已完成模型的页面上,训练配置卡片都有一个 Copy as JSON 按钮。复制该 JSON 并将其直接粘贴到 YAML 编辑器中 —— 它会自动检测 JSON 格式并导入所有参数。
  • 粘贴 YAML 或 JSON:将任何有效的 YAML 或 JSON 训练配置粘贴到编辑器中。参数会自动进行验证,超出范围的值会被钳制并显示警告。
  • 拖放文件:将 .yaml.json 文件直接拖入编辑器即可导入其参数。

Ultralytics Platform Training Dialog Copy Training Config JSON

这使得无需手动重新输入每个参数即可轻松复现或迭代之前的训练配置。

我可以从数据集页面开始训练吗?

可以,数据集页面上的 Train 按钮会打开训练对话框,并预选并锁定该数据集。然后你可以选择项目和模型来开始训练。

训练参数参考

参数类型默认值范围描述
epochsint1001-10000训练 epoch 数量
batchint-1 (自动)-1 到 512批量大小 (-1 = 自动适应可用 VRAM)
imgszint64032-4096输入图像尺寸
patienceint1001-1000提前停止的耐心值
seedint00-2147483647用于可复现性的随机种子
deterministicboolTrue-确定性训练模式
ampboolTrue-自动混合精度
close_mosaicint100-50在最后 N 个 epoch 禁用 Mosaic 数据增强
save_periodint-1-1-100每 N 个 epoch 保存一次检查点
workersint80-64数据加载器工作进程数
cacheselectfalseram/disk/false缓存图像
任务特定参数

部分参数仅适用于特定任务:

  • 仅限检测任务(detect, segment, pose, OBB — 不包含 classify):box, dfl, degrees, translate, shear, perspective, mosaic, mixup, close_mosaic
  • 仅限 segment 任务copy_paste
  • 仅限 pose 任务pose(损失权重),kobj(关键点目标性)

评论