跳转至内容

模型训练

Ultralytics 全面的YOLO 训练工具,涵盖从实验管理到云端训练任务的执行,并支持实时指标流传输。

概述

培训部分可帮助您:

  • 模型组织到项目中以便于管理
  • 一键在云端GPU上训练
  • 在训练过程中监控实时指标
  • 比较不同实验中的模型性能

工作流

graph LR
    A[📁 Project] --> B[⚙️ Configure]
    B --> C[🚀 Train]
    C --> D[📈 Monitor]
    D --> E[📦 Export]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
    style E fill:#00BCD4,color:#fff
舞台描述
项目创建一个工作区来组织相关模型
配置选择数据集、基础模型和训练参数
训练在云端GPU或本地硬件上运行
监视器查看实时损失曲线和指标
导出转换为17种部署格式

培训选项

Ultralytics 多种训练方法:

方法描述最适合
云端训练在平台云GPU上进行训练无本地GPU,可扩展性
远程培训本地训练,将指标流式传输至平台现有硬件,隐私
Colab 培训使用集成Google免费GPU

GPU

可用于云端训练的可用GPU:

GPU视频内存性能成本
RTX 309024GB每小时0.44美元
RTX 409024GB优秀每小时0.74美元
L40S48GB非常好每小时1.14美元
A100 40GB40GB优秀每小时1.29美元
A100 80GB80GB优秀每小时1.99美元
H100 80GB80GB最佳每小时3.99美元

免费培训

新账户可获得培训积分。详情请查阅账单

实时指标

在训练过程中,查看实时指标:

  • 损失曲线:盒式、类和DFL损失
  • 性能指标:mAP50、mAP50、精确率、召回率
  • 系统统计:GPU ,内存使用情况
  • 检查点:自动保存最佳权重

常见问题

培训需要多长时间?

培训时间取决于:

  • 数据集规模(图像数量)
  • 模特尺寸(n, s, m, l, x)
  • epoch数
  • 所选GPU

在RTX 4090显卡上,使用YOLO11n模型对1000张图像进行100个 epoch的典型训练运行,耗时约30-60分钟。

我可以同时训练多个模型吗?

云端训练目前支持每个账户同时进行一个训练任务。若需并行训练,请使用多台机器进行远程训练。

如果培训失败会怎样?

如果训练失败:

  1. 检查点在每个 epoch 时保存
  2. 你可以从最后的检查点继续
  3. 仅对已完成的计算时间收取费用

如何选择GPU?

场景推荐GPU
Small datasets (<5000 images)RTX 4090
中等规模数据集(5000-50000张图像)A100 40GB
大型数据集或批处理规模A100 80GB 或 H100
注重预算的RTX 3090


📅 0 天前创建 ✏️ 0 天前更新
glenn-jocher

评论