跳转至内容

模型训练

Ultralytics Platform 提供了全面的 YOLO 模型训练工具,从组织实验到运行云端训练作业,并支持实时指标流传输。

概述

训练部分可帮助您:

  • 组织模型到项目中,以便于管理
  • 一键在云端 GPU 上训练
  • 监控训练期间的实时指标
  • 比较不同实验中的模型性能

工作流程

graph LR
    A[📁 Project] --> B[⚙️ Configure]
    B --> C[🚀 Train]
    C --> D[📈 Monitor]
    D --> E[📦 Export]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
    style E fill:#00BCD4,color:#fff
阶段描述
项目创建工作区以组织相关模型
配置选择数据集、基础模型和训练参数
训练在云端 GPU 或本地硬件上运行
监控查看实时损失曲线和指标
导出转换为17种部署格式

训练选项

Ultralytics平台支持多种训练方法:

方法描述最适合
云端训练在平台云GPU上训练无需本地GPU,具备可扩展性
远程训练本地训练,将指标流式传输到平台利用现有硬件,保障隐私性
Colab训练使用Google Colab并与平台集成免费GPU访问

GPU 选项

可用于云训练的GPU:

层级GPU显存每小时费用最适合
预算RTX A20006 GB$0.12小数据集,测试
预算RTX 308010 GB$0.25中等规模的数据集
预算RTX 3080 Ti12 GB$0.30中等规模的数据集
预算A3024 GB$0.44更大的批量
L424 GB$0.54推理优化
RTX 409024 GB$0.60极佳性价比
A600048 GB$0.90大型模型
L40S48 GB$1.72大规模批量训练
ProA100 40GB40 GB$2.78生产培训
ProA100 80GB80 GB$3.44超大型模型
ProRTX PRO 600048 GB$3.68Ultralytics
ProH10080 GB$5.38最快的训练
企业版H200141 GB$5.38最高性能
企业版B200192 GB$10.38最大模型

注册积分

新账户注册后可获得培训积分。详情请查看账单

实时指标

训练期间,查看实时指标:

  • 损失曲线:边界框、类别和DFL损失
  • 性能:mAP50、mAP50-95、精确率、召回率
  • 系统统计: GPU利用率,内存使用
  • 检查点: 自动保存最佳权重

常见问题

训练需要多长时间?

训练时间取决于:

  • 数据集大小(图像数量)
  • 模型大小 (n, s, m, l, x)
  • 训练轮次
  • 所选GPU类型

在RTX 4090显卡上,使用YOLO26n模型对1000张图像进行100个 epoch的典型训练运行,耗时约30-60分钟。

我可以同时训练多个模型吗?

云端训练目前每个账户支持一个并发训练作业。如需并行训练,请使用多台机器进行远程训练。

如果训练失败怎么办?

如果训练失败:

  1. 检查点在每个训练轮次保存
  2. 您可以从上一个检查点恢复
  3. 仅对已完成的计算时间收取费用

如何选择合适的 GPU?

场景推荐GPU
Small datasets (<5000 images)RTX 4090
中等数据集(5000-50000张图像)A100 40GB
大型数据集或大批量大小A100 80GB 或 H100
预算有限RTX 3090


📅 创建于 20 天前 ✏️ 更新于 14 天前
glenn-jocher

评论