跳转至内容

部署

Ultralytics 全面的部署选项,助您YOLO 投入生产环境。通过推理API测试模型,部署至专用端点,并实时监控性能表现。

概述

部署部分可帮助您:

  • 直接在浏览器中测试模型
  • 部署至全球43个区域的专用端点
  • 监控请求指标和日志
  • 根据流量自动扩展

部署选项

Ultralytics 多种部署路径:

选项描述最适合
测试选项卡基于浏览器的推理测试开发、验证
共享API多租户推理服务轻度使用,测试
专用端点单租户生产服务生产,低延迟

工作流

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
舞台描述
测试使用样本图像验证模型
配置选择区域和缩放选项
部署创建专用端点
监视器跟踪请求、延迟和错误

架构

共享推理

共享推理服务在3个关键区域运行:

区域位置
美国美国中部(爱荷华州)
欧盟欧盟西部(比利时)
AP亚太地区(香港)

请求将自动路由至您的数据区域。

专用端点

部署至全球43个区域:

  • 美洲:15个地区
  • 欧洲:12个地区
  • 亚太地区:16个区域

每个端点都是单租户服务,具有:

  • 专用计算资源
  • 自动扩展(0-N个实例)
  • 自定义网址
  • 独立监督

主要功能

全球覆盖

部署位置靠近您的用户,覆盖43个区域:

  • 北美洲,南美洲
  • 欧洲、中东、非洲
  • 亚太地区,大洋洲

自动缩放

端点自动扩展:

  • 缩放至零:空闲时零成本
  • 扩展规模:应对流量高峰
  • 可配置限制:设置最小/最大实例数

低延迟

专用端点提供:

  • 冷启动:约2-5秒
  • 温和推断:50-200毫秒(取决于模型)
  • 区域路由以实现最佳性能

常见问题

共享推理和专用推理有什么区别?

特性共享专属
延迟变量一致的
成本按请求付费为正常运行时间付费
规模有限可配置
地区343
URL通用自定义

部署需要多长时间?

专用端点的部署通常需要1-2分钟:

  1. 图像拉取(约30秒)
  2. 容器启动(约30秒)
  3. 健康检查(约30秒)

我可以部署多个模型吗?

是的,每个模型可以在不同区域拥有多个端点。总端点数量没有限制(具体取决于您的套餐)。

当端点处于空闲状态时会发生什么?

启用归零功能时:

  • 端点在闲置后缩减规模
  • 首次请求触发冷启动
  • 后续请求速度快

为避免冷启动,请将最小实例数设置为大于0。



📅 0 天前创建 ✏️ 0 天前更新
glenn-jocher

评论