模型训练
Ultralytics Platform 提供了全面的工具来训练 YOLO 模型,从组织实验到通过实时指标流运行云训练作业,应有尽有。
Watch: Get Started with Ultralytics Platform - Train
概览
训练部分可以帮助你:
- 组织模型到 projects 中以便于管理
- 训练:通过单击即可在云端 GPU 上进行训练
- 监控:训练期间实时监控各项指标
- 对比:跨实验对比模型性能
- 导出:导出至 17 种以上的部署格式(请参阅 supported formats)

工作流程
graph LR
A[📁 Project] --> B[⚙️ Configure]
B --> C[🚀 Train]
C --> D[📈 Monitor]
D --> E[📦 Export]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
style E fill:#00BCD4,color:#fff| 阶段 | 描述 |
|---|---|
| 项目 | 创建一个工作空间以组织相关模型 |
| 配置 | 选择 dataset、基础模型和训练参数 |
| 训练 | 在云端 GPU 或你的本地硬件上运行 |
| 监控 | 查看实时损失曲线和指标 |
| 导出 | 转换为 17 种以上的部署格式(details) |
训练选项
Ultralytics Platform 支持多种训练方法:
| 方法 | 描述 | 适用人群 |
|---|---|---|
| Cloud Training | 在 Ultralytics 云端 GPU 上训练 | 无需本地 GPU,可扩展性强 |
| Local Training | 本地训练,将指标流式传输至平台 | 现有硬件,注重隐私 |
| Colab Training | 将 Google Colab 与平台集成使用 | 免费 GPU 访问 |
GPU 选项
Ultralytics Cloud 上可用于云训练的 GPU:
| GPU | 代次 | 显存 | 成本/小时 | 适用人群 |
|---|---|---|---|---|
| RTX 2000 Ada | Ada | 16 GB | $0.24 | 小型数据集,测试 |
| RTX A4500 | Ampere | 20 GB | $0.25 | 中小型数据集 |
| RTX 4000 Ada | Ada | 20 GB | $0.26 | 中型数据集 |
| RTX A5000 | Ampere | 24 GB | $0.27 | 中型数据集 |
| L4 | Ada | 24 GB | $0.39 | 针对推理优化 |
| A40 | Ampere | 48 GB | $0.44 | 更大的批次大小 |
| RTX 3090 | Ampere | 24 GB | $0.46 | 常规训练 |
| RTX A6000 | Ampere | 48 GB | $0.49 | 大型模型 |
| RTX PRO 4500 | Blackwell | 32 GB | $0.64 | 极佳的性价比 |
| RTX 4090 | Ada | 24 GB | $0.69 | 最优性价比 |
| RTX 6000 Ada | Ada | 48 GB | $0.77 | 大批量训练 |
| L40S | Ada | 48 GB | $0.86 | 大批量训练 |
| RTX 5090 | Blackwell | 32 GB | $0.99 | 最新消费级架构 |
| L40 | Ada | 48 GB | $0.99 | 大型模型 |
| A100 PCIe | Ampere | 80 GB | $1.39 | 生产环境训练 |
| A100 SXM | Ampere | 80 GB | $1.49 | 生产环境训练 |
| RTX PRO 6000 | Blackwell | 96 GB | $1.89 | 默认推荐 |
| H100 PCIe | Hopper | 80 GB | $2.39 | 高性能训练 |
| H100 SXM | Hopper | 80 GB | $2.99 | 最快训练 |
| H100 NVL | Hopper | 94 GB | $3.07 | 极致性能 |
| H200 NVL | Hopper | 143 GB | $3.39 | 最大显存 |
| H200 SXM | Hopper | 141 GB | $3.99 | 极致性能 |
| B200 | Blackwell | 180 GB | $5.49 | 大型模型 (Pro+) |
| B300 | Blackwell | 288 GB | $7.39 | 超大型模型 (Pro+) |
GPU 层级访问权限
B200 和 B300 GPU 需要 Pro 或 Enterprise 计划。所有其他 GPU 均适用于包括 Free 在内的所有计划。
注册积分
新账户会收到用于训练的注册积分。详情请查看 Billing。
实时指标
训练期间,可在三个子选项卡中查看实时指标:
graph LR
A[Charts] --> B[Loss Curves]
A --> C[Performance Metrics]
D[Console] --> E[Live Logs]
D --> F[Error Detection]
G[System] --> H[GPU Utilization]
G --> I[Memory & Temp]
style A fill:#2196F3,color:#fff
style D fill:#FF9800,color:#fff
style G fill:#9C27B0,color:#fff| 子标签 | 指标 |
|---|---|
| 图表 | Box/class/DFL 损失,mAP50,mAP50-95,精度,召回率 |
| 控制台 | 带有 ANSI 颜色和错误检测功能的实时训练日志 |
| 系统 | GPU 利用率、内存、温度、CPU、磁盘 |
自动检查点
对于云训练,最佳模型(best.pt,即 mAP 最高的检查点)会自动保存,并在训练完成后提供下载、导出和部署。
快速入门
在一分钟内开始云训练:
- 在侧边栏创建一个项目
- 点击 New Model
- 选择模型、数据集和 GPU
- 点击 Start Training
快速链接
- Projects:组织你的模型和实验
- Models:管理训练好的检查点
- Cloud Training:在云端 GPU 上训练
常见问题解答
训练需要多长时间?
训练时间取决于:
- 数据集大小(图像数量)
- 模型大小(n, s, m, l, x)
- Epoch(轮次)数量
- 所选的 GPU 类型
在 RTX PRO 6000 上使用 YOLO26n 训练 1000 张图像、100 个 Epoch 的典型运行时间约为 2-3 小时。较小的任务(在 RTX 4090 上训练 500 张图像、50 个 Epoch)在一小时内即可完成。请查看 cost examples 以获取详细估算。
我可以同时训练多个模型吗?
可以。并发云训练限制取决于你的计划:Free 允许 3 个,Pro 允许 10 个,Enterprise 则无限制。若需进行更多并行训练,请使用多台机器进行远程训练。
如果训练失败会发生什么?
如果训练失败:
- 每个 Epoch 都会保存检查点
- 你可以从上一个检查点恢复训练
- 积分仅按已完成的计算时间计费
如何选择合适的 GPU?
| 场景 | 推荐 GPU |
|---|---|
| 大多数训练任务 | RTX PRO 6000 |
| 大型数据集或大批量 | H100 SXM 或 H200 |
| 预算有限 | RTX 4090 |