Link to this section模型训练#
Ultralytics Platform 提供了全方位的 YOLO 模型训练工具,涵盖了从组织实验到运行云端训练任务并实时流式传输指标的完整流程。
Watch: Get Started with Ultralytics Platform - Train
Link to this section概述#
训练部分可以帮助你:

Link to this section工作流#
graph LR
A[📁 Project] --> B[⚙️ Configure]
B --> C[🚀 Train]
C --> D[📈 Monitor]
D --> E[📦 Export]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
style E fill:#00BCD4,color:#fffLink to this section训练选项#
Ultralytics Platform 支持多种训练方式:
| 方法 | 描述 | 最适用场景 |
|---|---|---|
| 云端训练 | 在 Ultralytics 云端 GPU 上进行训练 | 无需本地 GPU,具备可扩展性 |
| 本地训练 | 在本地进行训练,将指标流式传输到平台 | 利用现有硬件,保护隐私 |
| Colab 训练 | 使用集成平台的 Google Colab | 免费的 GPU 访问权限 |
Link to this sectionGPU 选项#
Ultralytics Cloud 上可用于云端训练的 GPU:
| GPU | 架构 | 显存 (VRAM) | 每小时费用 | 最适用场景 |
|---|---|---|---|---|
| RTX 2000 Ada | Ada | 16 GB | $0.24 | 小规模数据集、测试 |
| RTX A4500 | Ampere | 20 GB | $0.25 | 中小型数据集 |
| RTX 4000 Ada | Ada | 20 GB | $0.26 | 中等规模数据集 |
| RTX A5000 | Ampere | 24 GB | $0.27 | 中等规模数据集 |
| L4 | Ada | 24 GB | $0.39 | 推理优化 |
| A40 | Ampere | 48 GB | $0.44 | 较大的批次大小 |
| RTX 3090 | Ampere | 24 GB | $0.46 | 通用训练 |
| RTX A6000 | Ampere | 48 GB | $0.49 | 大型模型 |
| RTX PRO 4500 | Blackwell | 32 GB | $0.64 | 出色的性价比 |
| RTX 4090 | Ada | 24 GB | $0.69 | 最佳性价比 |
| RTX 6000 Ada | Ada | 48 GB | $0.77 | 大批量训练 |
| L40S | Ada | 48 GB | $0.86 | 大批量训练 |
| RTX 5090 | Blackwell | 32 GB | $0.99 | 最新一代消费级显卡 |
| L40 | Ada | 48 GB | $0.99 | 大型模型 |
| A100 PCIe | Ampere | 80 GB | $1.39 | 生产环境训练 |
| A100 SXM | Ampere | 80 GB | $1.49 | 生产环境训练 |
| RTX PRO 6000 | Blackwell | 96 GB | $1.89 | 推荐默认配置 |
| H100 PCIe | Hopper | 80 GB | $2.39 | 高性能训练 |
| H100 SXM | Hopper | 80 GB | $2.99 | 最快训练 |
| H100 NVL | Hopper | 94 GB | $3.07 | 极致性能 |
| H200 NVL | Hopper | 143 GB | $3.39 | 最大内存 |
| H200 SXM | Hopper | 141 GB | $3.99 | 极致性能 |
| B200 | Blackwell | 180 GB | $5.49 | 大型模型 (Pro+) |
| B300 | Blackwell | 288 GB | $7.39 | 超大型模型 (Pro+) |
GPU 层级访问权限
B200 和 B300 GPU 需要 Pro 或 Enterprise 计划。所有其他 GPU 在所有计划(包括 Free)中均可用。
注册积分
新账户可获得用于训练的注册积分。详情请查看 计费。
Link to this section实时指标#
训练期间,可在三个子标签页中查看实时指标:
graph LR
A[Charts] --> B[Loss Curves]
A --> C[Performance Metrics]
D[Console] --> E[Live Logs]
D --> F[Error Detection]
G[System] --> H[GPU Utilization]
G --> I[Memory & Temp]
style A fill:#2196F3,color:#fff
style D fill:#FF9800,color:#fff
style G fill:#9C27B0,color:#fff| 子标签页 | 指标 |
|---|---|
| 图表 | Box/class/DFL 损失, mAP50, mAP50-95, 准确率, 召回率 |
| 控制台 | 带有 ANSI 颜色和错误检测的实时训练日志 |
| 系统 | GPU 利用率、内存、温度、CPU、磁盘 |
自动检查点
对于云训练,最佳模型 (best.pt,即 mAP 最高时的检查点) 会自动保存,并在训练完成后可供下载、导出和部署。
Link to this section快速入门#
不到一分钟即可开启云训练:
- 在侧边栏中创建一个项目
- 点击 新建模型
- 选择模型、数据集和 GPU
- 点击 开始训练
Link to this section快捷链接#
Link to this section常见问题解答#
Link to this section训练需要多长时间?#
训练时间取决于:
- 数据集大小(图片数量)
- 模型大小 (n, s, m, l, x)
- Epoch(轮次)数量
- 所选 GPU 类型
一次典型的训练(1000 张图片,YOLO26n,在 RTX PRO 6000 上运行 100 个 epoch)大约需要 5-10 分钟。较小的训练(500 张图片,在 RTX 4090 上运行 50 个 epoch)可在不到一小时内完成。详细估算请参考 成本示例。
Link to this section我可以同时训练多个模型吗?#
可以。并发云训练限制取决于你的计划:Free 允许 3 个,Pro 允许 10 个,Enterprise 无限制。如需进行更多的并行训练,请从多台机器使用远程训练。
Link to this section如果训练失败了怎么办?#
如果训练失败:
- 该模型被标记为失败,计算实例已终止
- 你可以从基础模型开始新的训练任务
- 仅对已完成的计算时间扣除积分
Link to this section如何选择合适的 GPU?#
| 场景 | 推荐 GPU |
|---|---|
| 大多数训练任务 | RTX PRO 6000 |
| 大型数据集或大批量 (batch sizes) | H100 SXM 或 H200 |
| 注重预算 | RTX 4090 |