模型训练
Ultralytics Platform 提供了全面的 YOLO 模型训练工具,从组织实验到运行云端训练作业,并支持实时指标流传输。
概述
训练部分可帮助您:

工作流程
graph LR
A[📁 Project] --> B[⚙️ Configure]
B --> C[🚀 Train]
C --> D[📈 Monitor]
D --> E[📦 Export]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
style E fill:#00BCD4,color:#fff
| 阶段 | 描述 |
|---|---|
| 项目 | 创建工作区以组织相关模型 |
| 配置 | 选择 数据集、基础模型和训练参数 |
| 训练 | 在云端 GPU 或本地硬件上运行 |
| 监控 | 查看实时损失曲线和指标 |
| 导出 | 转换为 17+ 种部署格式 (详情) |
训练选项
Ultralytics平台支持多种训练方法:
| 方法 | 描述 | 最适合 |
|---|---|---|
| 云端训练 | 在 Ultralytics 云 GPU 上训练 | 无需本地GPU,具备可扩展性 |
| 本地训练 | 本地训练,并将指标流式传输到平台 | 利用现有硬件,保障隐私性 |
| Colab训练 | 将Google Colab与平台集成结合使用 | 免费GPU访问 |
GPU 选项
Ultralytics Cloud 上可用于云训练的 GPU:
| GPU | 显存 | 每小时费用 | 最适合 |
|---|---|---|---|
| RTX 2000 Ada | 16 GB | $0.24 | 小型数据集,测试 |
| RTX A4500 | 20 GB | $0.24 | 中小型数据集 |
| RTX A5000 | 24 GB | $0.26 | 中型数据集 |
| RTX 4000 Ada | 20 GB | $0.38 | 中型数据集 |
| L4 | 24 GB | $0.39 | 推理优化 |
| A40 | 48 GB | $0.40 | 更大的批次大小 |
| RTX 3090 | 24 GB | $0.46 | 卓越的性价比 |
| RTX A6000 | 48 GB | $0.49 | 大型模型 |
| RTX 4090 | 24 GB | $0.59 | 最佳性价比 |
| RTX 6000 Ada | 48 GB | $0.77 | 大批次训练 |
| L40S | 48 GB | $0.86 | 大批次训练 |
| RTX 5090 | 32 GB | $0.89 | 最新一代 |
| L40 | 48 GB | $0.99 | 大型模型 |
| A100 PCIe | 80 GB | $1.39 | 生产训练 |
| A100 SXM | 80 GB | $1.49 | 生产训练 |
| RTX PRO 6000 | 96 GB | $1.89 | 推荐默认值 |
| H100 PCIe | 80 GB | $2.39 | 高性能训练 |
| H100 SXM | 80 GB | $2.69 | 最快训练 |
| H100 NVL | 94 GB | $3.07 | 最高性能 |
| H200 NVL | 143 GB | $3.39 | 最大内存(Pro+) |
| H200 SXM | 141 GB | $3.59 | 极致性能(Pro+) |
| B200 | 180 GB | $4.99 | 最大型号(Pro+) |
GPU 访问
H200 和 B200 GPU 需订阅Pro 或 Enterprise 套餐。其他所有 GPU 均可在所有套餐(包括免费套餐)中使用。
注册积分
新账户可获得用于训练的注册积分。请查看账单了解详情。
实时指标
在训练期间,通过三个子选项卡查看实时指标:
graph LR
A[Charts] --> B[Loss Curves]
A --> C[Performance Metrics]
D[Console] --> E[Live Logs]
D --> F[Error Detection]
G[System] --> H[GPU Utilization]
G --> I[Memory & Temp]
style A fill:#2196F3,color:#fff
style D fill:#FF9800,color:#fff
style G fill:#9C27B0,color:#fff
| 子选项卡 | 指标 |
|---|---|
| 图表 | 框/类别/DFL损失、mAP50、mAP50-95、精确率、召回率 |
| 控制台 | 带ANSI颜色和错误检测的实时训练日志 |
| 系统 | GPU 利用率、内存、温度、CPU、磁盘 |
自动检查点
平台在每个 epoch 都会自动保存检查点。最佳模型(mAP 最高)和 最终模型始终保留。
快速入门
一分钟内开始云训练:
- 在侧边栏中创建项目
- 点击 新建模型
- 选择模型、数据集和GPU
- 点击开始训练
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset \
epochs=100 project=username/my-project name=exp1
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(
data="ul://username/datasets/my-dataset",
epochs=100,
project="username/my-project",
name="exp1",
)
快速链接
常见问题
训练需要多长时间?
训练时间取决于:
- 数据集大小(图像数量)
- 模型大小 (n, s, m, l, x)
- 训练轮次
- 所选GPU类型
在RTX PRO 6000上,使用1000张图像、YOLO26n、100个epoch的典型训练运行大约需要2-3小时。较小的运行(在RTX 4090上使用500张图像、50个epoch)可在不到一小时内完成。有关详细估算,请参阅成本示例。
我可以同时训练多个模型吗?
是的。并发云训练限制取决于您的套餐:免费套餐允许3个,专业套餐允许10个,企业套餐无限制。如需额外的并行训练,请使用多台机器进行远程训练。
如果训练失败怎么办?
如果训练失败:
- 检查点在每个训练轮次保存
- 您可以从上一个检查点恢复
- 仅对已完成的计算时间收取费用
如何选择合适的 GPU?
| 场景 | 推荐GPU |
|---|---|
| 大多数训练任务 | RTX PRO 6000 |
| 大型数据集或大批量大小 | H100 SXM 或 H200 (Pro+) |
| 预算有限 | RTX 4090 |
📅 2个月前创建 ✏️ 1天前更新