跳转至内容

模型训练

Ultralytics Platform 提供了全面的 YOLO 模型训练工具,从组织实验到运行云端训练作业,并支持实时指标流传输。

概述

训练部分可帮助您:

  • 模型组织到项目中以便于管理
  • 一键在云端 GPU 上训练
  • 监控训练期间的实时指标
  • 比较不同实验中的模型性能
  • 导出到17+种部署格式(参见支持的格式

Ultralytics 平台训练概览

工作流程

graph LR
    A[📁 Project] --> B[⚙️ Configure]
    B --> C[🚀 Train]
    C --> D[📈 Monitor]
    D --> E[📦 Export]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
    style E fill:#00BCD4,color:#fff
阶段描述
项目创建工作区以组织相关模型
配置选择 数据集、基础模型和训练参数
训练在云端 GPU 或本地硬件上运行
监控查看实时损失曲线和指标
导出转换为 17+ 种部署格式 (详情)

训练选项

Ultralytics平台支持多种训练方法:

方法描述最适合
云端训练在 Ultralytics 云 GPU 上训练无需本地GPU,具备可扩展性
本地训练本地训练,并将指标流式传输到平台利用现有硬件,保障隐私性
Colab训练将Google Colab与平台集成结合使用免费GPU访问

GPU 选项

Ultralytics Cloud 上可用于云训练的 GPU:

GPU显存每小时费用最适合
RTX 2000 Ada16 GB$0.24小型数据集,测试
RTX A450020 GB$0.24中小型数据集
RTX A500024 GB$0.26中型数据集
RTX 4000 Ada20 GB$0.38中型数据集
L424 GB$0.39推理优化
A4048 GB$0.40更大的批次大小
RTX 309024 GB$0.46卓越的性价比
RTX A600048 GB$0.49大型模型
RTX 409024 GB$0.59最佳性价比
RTX 6000 Ada48 GB$0.77大批次训练
L40S48 GB$0.86大批次训练
RTX 509032 GB$0.89最新一代
L4048 GB$0.99大型模型
A100 PCIe80 GB$1.39生产训练
A100 SXM80 GB$1.49生产训练
RTX PRO 600096 GB$1.89推荐默认值
H100 PCIe80 GB$2.39高性能训练
H100 SXM80 GB$2.69最快训练
H100 NVL94 GB$3.07最高性能
H200 NVL143 GB$3.39最大内存(Pro+)
H200 SXM141 GB$3.59极致性能(Pro+)
B200180 GB$4.99最大型号(Pro+)

GPU 访问

H200 和 B200 GPU 需订阅Pro 或 Enterprise 套餐。其他所有 GPU 均可在所有套餐(包括免费套餐)中使用。

注册积分

新账户可获得用于训练的注册积分。请查看账单了解详情。

实时指标

在训练期间,通过三个子选项卡查看实时指标:

graph LR
    A[Charts] --> B[Loss Curves]
    A --> C[Performance Metrics]
    D[Console] --> E[Live Logs]
    D --> F[Error Detection]
    G[System] --> H[GPU Utilization]
    G --> I[Memory & Temp]

    style A fill:#2196F3,color:#fff
    style D fill:#FF9800,color:#fff
    style G fill:#9C27B0,color:#fff
子选项卡指标
图表框/类别/DFL损失、mAP50、mAP50-95、精确率、召回率
控制台带ANSI颜色和错误检测的实时训练日志
系统GPU 利用率、内存、温度、CPU、磁盘

自动检查点

平台在每个 epoch 都会自动保存检查点。最佳模型(mAP 最高)和 最终模型始终保留。

快速入门

一分钟内开始云训练:

  1. 在侧边栏中创建项目
  2. 点击 新建模型
  3. 选择模型、数据集和GPU
  4. 点击开始训练
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset \
  epochs=100 project=username/my-project name=exp1
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(
    data="ul://username/datasets/my-dataset",
    epochs=100,
    project="username/my-project",
    name="exp1",
)

常见问题

训练需要多长时间?

训练时间取决于:

  • 数据集大小(图像数量)
  • 模型大小 (n, s, m, l, x)
  • 训练轮次
  • 所选GPU类型

在RTX PRO 6000上,使用1000张图像、YOLO26n、100个epoch的典型训练运行大约需要2-3小时。较小的运行(在RTX 4090上使用500张图像、50个epoch)可在不到一小时内完成。有关详细估算,请参阅成本示例

我可以同时训练多个模型吗?

是的。并发云训练限制取决于您的套餐:免费套餐允许3个,专业套餐允许10个,企业套餐无限制。如需额外的并行训练,请使用多台机器进行远程训练。

如果训练失败怎么办?

如果训练失败:

  1. 检查点在每个训练轮次保存
  2. 您可以从上一个检查点恢复
  3. 仅对已完成的计算时间收取费用

如何选择合适的 GPU?

场景推荐GPU
大多数训练任务RTX PRO 6000
大型数据集或大批量大小H100 SXM 或 H200 (Pro+)
预算有限RTX 4090


📅 2个月前创建 ✏️ 1天前更新
glenn-jochersergiuwaxmann

评论