部署
Ultralytics 全面的部署选项,助您YOLO 投入生产环境。通过推理API测试模型,部署至专用端点,并实时监控性能表现。
概述
部署部分可帮助您:
- 直接在浏览器中测试模型
- 部署至全球43个区域的专用端点
- 监控请求指标和日志
- 根据流量自动扩展
部署选项
Ultralytics 多种部署路径:
| 选项 | 描述 | 最适合 |
|---|---|---|
| 测试选项卡 | 基于浏览器的推理测试 | 开发、验证 |
| 共享API | 多租户推理服务 | 轻度使用,测试 |
| 专用端点 | 单租户生产服务 | 生产,低延迟 |
工作流
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| 舞台 | 描述 |
|---|---|
| 测试 | 使用样本图像验证模型 |
| 配置 | 选择区域和缩放选项 |
| 部署 | 创建专用端点 |
| 监视器 | 跟踪请求、延迟和错误 |
架构
共享推理
共享推理服务在3个关键区域运行:
| 区域 | 位置 |
|---|---|
| 美国 | 美国中部(爱荷华州) |
| 欧盟 | 欧盟西部(比利时) |
| AP | 亚太地区(香港) |
请求将自动路由至您的数据区域。
专用端点
部署至全球43个区域:
- 美洲:15个地区
- 欧洲:12个地区
- 亚太地区:16个区域
每个端点都是单租户服务,具有:
- 专用计算资源
- 自动扩展(0-N个实例)
- 自定义网址
- 独立监督
主要功能
全球覆盖
部署位置靠近您的用户,覆盖43个区域:
- 北美洲,南美洲
- 欧洲、中东、非洲
- 亚太地区,大洋洲
自动缩放
端点自动扩展:
- 缩放至零:空闲时零成本
- 扩展规模:应对流量高峰
- 可配置限制:设置最小/最大实例数
低延迟
专用端点提供:
- 冷启动:约2-5秒
- 温和推断:50-200毫秒(取决于模型)
- 区域路由以实现最佳性能
快速链接
常见问题
共享推理和专用推理有什么区别?
| 特性 | 共享 | 专属 |
|---|---|---|
| 延迟 | 变量 | 一致的 |
| 成本 | 按请求付费 | 为正常运行时间付费 |
| 规模 | 有限 | 可配置 |
| 地区 | 3 | 43 |
| URL | 通用 | 自定义 |
部署需要多长时间?
专用端点的部署通常需要1-2分钟:
- 图像拉取(约30秒)
- 容器启动(约30秒)
- 健康检查(约30秒)
我可以部署多个模型吗?
是的,每个模型可以在不同区域拥有多个端点。总端点数量没有限制(具体取决于您的套餐)。
当端点处于空闲状态时会发生什么?
启用归零功能时:
- 端点在闲置后缩减规模
- 首次请求触发冷启动
- 后续请求速度快
为避免冷启动,请将最小实例数设置为大于0。
📅 0 天前创建 ✏️ 0 天前更新