模型训练
Ultralytics Platform 提供了全面的 YOLO 模型训练工具,从组织实验到运行云端训练作业,并支持实时指标流传输。
概述
训练部分可帮助您:
- 组织模型到项目中,以便于管理
- 一键在云端 GPU 上训练
- 监控训练期间的实时指标
- 比较不同实验中的模型性能
工作流程
graph LR
A[📁 Project] --> B[⚙️ Configure]
B --> C[🚀 Train]
C --> D[📈 Monitor]
D --> E[📦 Export]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
style E fill:#00BCD4,color:#fff
| 阶段 | 描述 |
|---|---|
| 项目 | 创建工作区以组织相关模型 |
| 配置 | 选择数据集、基础模型和训练参数 |
| 训练 | 在云端 GPU 或本地硬件上运行 |
| 监控 | 查看实时损失曲线和指标 |
| 导出 | 转换为17种部署格式 |
训练选项
Ultralytics平台支持多种训练方法:
| 方法 | 描述 | 最适合 |
|---|---|---|
| 云端训练 | 在平台云GPU上训练 | 无需本地GPU,具备可扩展性 |
| 远程训练 | 本地训练,将指标流式传输到平台 | 利用现有硬件,保障隐私性 |
| Colab训练 | 使用Google Colab并与平台集成 | 免费GPU访问 |
GPU 选项
可用于云训练的GPU:
| 层级 | GPU | 显存 | 每小时费用 | 最适合 |
|---|---|---|---|---|
| 预算 | RTX A2000 | 6 GB | $0.12 | 小数据集,测试 |
| 预算 | RTX 3080 | 10 GB | $0.25 | 中等规模的数据集 |
| 预算 | RTX 3080 Ti | 12 GB | $0.30 | 中等规模的数据集 |
| 预算 | A30 | 24 GB | $0.44 | 更大的批量 |
| 中 | L4 | 24 GB | $0.54 | 推理优化 |
| 中 | RTX 4090 | 24 GB | $0.60 | 极佳性价比 |
| 中 | A6000 | 48 GB | $0.90 | 大型模型 |
| 中 | L40S | 48 GB | $1.72 | 大规模批量训练 |
| Pro | A100 40GB | 40 GB | $2.78 | 生产培训 |
| Pro | A100 80GB | 80 GB | $3.44 | 超大型模型 |
| Pro | RTX PRO 6000 | 48 GB | $3.68 | Ultralytics |
| Pro | H100 | 80 GB | $5.38 | 最快的训练 |
| 企业版 | H200 | 141 GB | $5.38 | 最高性能 |
| 企业版 | B200 | 192 GB | $10.38 | 最大模型 |
注册积分
新账户注册后可获得培训积分。详情请查看账单。
实时指标
训练期间,查看实时指标:
- 损失曲线:边界框、类别和DFL损失
- 性能:mAP50、mAP50-95、精确率、召回率
- 系统统计: GPU利用率,内存使用
- 检查点: 自动保存最佳权重
快速链接
常见问题
训练需要多长时间?
训练时间取决于:
- 数据集大小(图像数量)
- 模型大小 (n, s, m, l, x)
- 训练轮次
- 所选GPU类型
在RTX 4090显卡上,使用YOLO26n模型对1000张图像进行100个 epoch的典型训练运行,耗时约30-60分钟。
我可以同时训练多个模型吗?
云端训练目前每个账户支持一个并发训练作业。如需并行训练,请使用多台机器进行远程训练。
如果训练失败怎么办?
如果训练失败:
- 检查点在每个训练轮次保存
- 您可以从上一个检查点恢复
- 仅对已完成的计算时间收取费用
如何选择合适的 GPU?
| 场景 | 推荐GPU |
|---|---|
| Small datasets (<5000 images) | RTX 4090 |
| 中等数据集(5000-50000张图像) | A100 40GB |
| 大型数据集或大批量大小 | A100 80GB 或 H100 |
| 预算有限 | RTX 3090 |
📅 创建于 20 天前 ✏️ 更新于 14 天前