跳转至内容

模型训练

Ultralytics Platform 提供了全面的 YOLO 模型训练工具,从组织实验到运行云端训练作业,并支持实时指标流传输。

概述

训练部分可帮助您:

  • 模型组织项目中以便于管理
  • 一键在云端 GPU 上训练
  • 监控训练期间的实时指标
  • 比较不同实验中的模型性能
  • 导出至17种以上部署格式(参见支持的格式

Ultralytics 训练概述

工作流程

graph LR
    A[📁 Project] --> B[⚙️ Configure]
    B --> C[🚀 Train]
    C --> D[📈 Monitor]
    D --> E[📦 Export]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
    style E fill:#00BCD4,color:#fff
阶段描述
项目创建工作区以组织相关模型
配置选择数据集、基础模型和训练参数
训练在云端 GPU 或本地硬件上运行
监控查看实时损失曲线和指标
导出转换为17种以上部署格式(详情

训练选项

Ultralytics平台支持多种训练方法:

方法描述最适合
云端训练在Ultralytics 进行训练无需本地GPU,具备可扩展性
本地培训本地训练,将指标流式传输至平台利用现有硬件,保障隐私性
Colab训练使用Google免费GPU访问

GPU 选项

Ultralytics 上可用于云端训练的可用 GPU:

GPU显存每小时费用最适合
RTX 2000 Ada16 GB$0.24小数据集,测试
RTX A450020 GB$0.24中小型数据集
RTX A500024 GB$0.26中等规模的数据集
RTX 4000 Ada20 GB$0.38中等规模的数据集
L424 GB$0.39推理优化
A4048 GB$0.40更大的批量
RTX 309024 GB$0.46极佳性价比
RTX A600048 GB$0.49大型模型
RTX 409024 GB$0.59最佳性价比
RTX 6000 Ada48 GB$0.77大规模批量训练
L40S48 GB$0.86大规模批量训练
RTX 509032 GB$0.89最新一代
L4048 GB$0.99大型模型
A100 PCIe80 GB$1.39生产培训
A100 SXM80 GB$1.49生产培训
RTX PRO 600096 GB$1.89推荐默认值
H100 PCIe80 GB$2.39高效能训练
H100 SXM80 GB$2.69最快的训练
H100 NVL94 GB$3.07最高性能
H200 NVL143 GB$3.39最大内存
H200 SXM141 GB$3.59最高性能
B200180 GB$4.99最大模型

注册积分

新账户注册后可获得培训积分。详情请查看账单

实时指标

在训练过程中,可通过三个子标签页查看实时指标:

graph LR
    A[Charts] --> B[Loss Curves]
    A --> C[Performance Metrics]
    D[Console] --> E[Live Logs]
    D --> F[Error Detection]
    G[System] --> H[GPU Utilization]
    G --> I[Memory & Temp]

    style A fill:#2196F3,color:#fff
    style D fill:#FF9800,color:#fff
    style G fill:#9C27B0,color:#fff
子标签页指标
图表盒/类别/DFL损失mAP50,mAP50,精度,召回率
控制台实时训练日志,支持ANSI颜色和错误检测
系统GPU 、内存、温度、CPU、磁盘

自动检查点

平台会在每个 epoch 自动保存检查点。最佳模型(最高mAP)和最终模型始终会被保留。

快速入门

一分钟内开启云端培训之旅:

  1. 在侧边栏创建项目
  2. 点击新建模型
  3. 选择模型、数据集和GPU
  4. 点击开始训练
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset \
  epochs=100 project=username/my-project name=exp1
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(
    data="ul://username/datasets/my-dataset",
    epochs=100,
    project="username/my-project",
    name="exp1",
)

常见问题

训练需要多长时间?

训练时间取决于:

  • 数据集大小(图像数量)
  • 模型大小 (n, s, m, l, x)
  • 训练轮次
  • 所选GPU类型

在RTX PRO 6000上进行一次典型训练(1000张图像,YOLO26n模型,100个 epoch)约需2-3小时。较小规模训练(500张图像,RTX 4090上运行50个 epoch)可在一小时内完成。具体成本估算请参阅费用示例

我可以同时训练多个模型吗?

是的。并行云训练的限制取决于您的套餐:免费版支持3个,专业版支持10个,企业版则无限制。若需更多并行训练,请使用多台机器进行远程训练。

如果训练失败怎么办?

如果训练失败:

  1. 检查点在每个训练轮次保存
  2. 您可以从上一个检查点恢复
  3. 仅对已完成的计算时间收取费用

如何选择合适的 GPU?

场景推荐GPU
大多数培训工作RTX PRO 6000
大型数据集或大批量大小H100 SXM 或 H200
预算有限RTX 4090


📅 创建于 1 个月前 ✏️ 更新于 4 天前
glenn-jochersergiuwaxmann

评论