跳转至内容

部署

Ultralytics 全面的部署选项,助您YOLO 投入生产环境。通过基于浏览器的推理测试模型,部署至覆盖全球43个区域的专用端点,并实时监控性能表现。

概述

部署部分可帮助您:

  • 测试 在浏览器中直接使用模型 Predict 标签
  • 将模型部署到全球 43 个区域的专用端点
  • 监控请求指标、日志和健康检查
  • 根据流量自动扩展(包括缩放至零)

Ultralytics 部署页面世界地图与概览卡片

部署选项

Ultralytics Platform 提供多种部署途径:

选项描述最适合
预测标签基于浏览器的推理,支持图像、网络摄像头和示例开发、验证
共享推理跨3个区域的多租户服务轻量级使用、测试
专用端点覆盖43个区域的单租户服务生产、低延迟

工作流程

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
阶段描述
测试使用以下内容验证模型: Predict 标签
配置选择区域、资源和部署名称
部署从以下内容创建专用端点: Deploy 标签
监控在监控中追踪请求、延迟、错误和日志

架构

共享推理

共享推理服务运行于3个关键区域,并根据您的数据区域自动路由请求:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
区域位置
美国爱荷华州,美国
欧盟比利时,欧洲
AP香港,亚太地区

专用端点

Ultralytics Cloud部署至全球43个区域:

  • 美洲:14个地区
  • 欧洲:13个地区
  • 亚太地区:12个区域
  • 中东与非洲:4个地区

每个端点都是一个单租户服务,具有:

  • 专用计算资源(可配置CPU和CPU )
  • 自动缩放(空闲时缩放至零)
  • 唯一端点URL
  • 独立监控、日志记录与健康检查

部署页面

从侧边栏进入全局部署页面 Deploy本页面显示:

  • 世界地图(带部署区域标记的交互式地图)
  • 概览卡片:总请求数(24小时),活跃部署数,错误率(24小时),P95延迟(24小时)
  • 部署列表提供三种查看模式:卡片式、紧凑式和表格式
  • 新增部署按钮,可从任何已完成的模型创建端点

Ultralytics 概览卡片与部署列表

自动轮询

该页面每30秒轮询一次指标更新。当部署处于过渡状态(创建、部署、停止)时,轮询频率将提升至每2-3秒一次,以实现近乎即时的反馈。

主要功能

全球覆盖

通过覆盖以下区域的43个区域,将服务部署到离用户更近的地方:

  • 北美、南美
  • 欧洲、中东、非洲
  • 亚太、大洋洲

自动扩缩

端点自动扩缩容:

  • 缩放至零:空闲时无成本(默认)
  • 扩展规模:自动处理流量高峰

成本节约

默认启用缩放至零功能(最小实例数 = 0)。您只需为活跃推理时间付费。

低延迟

专用端点提供:

  • 冷启动:约5-15秒(缓存容器),最长约45秒(首次部署)
  • 热推理:50-200毫秒(取决于模型)
  • 区域路由以实现最佳性能

健康检查

每次运行部署都包含自动健康检查,内容包括:

  • 实时状态指示器(正常/异常)
  • 响应延迟显示
  • 状态异常时自动重试(每20秒轮询一次)
  • 手动刷新按钮

快速入门

在2分钟内部署模型:

  1. 将模型训练或上传至项目
  2. 转到模型的部署选项卡
  3. 从延迟表中选择一个区域
  4. 点击部署——您的端点已上线

快速部署

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

部署完成后,请使用包含您的 API 密钥的端点 URL,从任何应用程序发送推理请求。

  • 推理:在浏览器中测试模型
  • 端点:部署专用端点
  • 监控:跟踪部署性能

常见问题

共享推理和专用推理有什么区别?

特性共享专用
延迟可变一致
成本按请求付费按运行时间付费
规模有限可配置
区域343
URL通用自定义

部署需要多长时间?

专用端点部署通常需要 1-2 分钟:

  1. 镜像拉取(约30秒)
  2. 容器启动(约30秒)
  3. 健康检查(约30秒)

我可以部署多个模型吗?

是的,每个模型可以在不同区域拥有多个端点。端点总数没有限制(取决于您的套餐)。

当端点处于空闲状态时会发生什么?

启用零扩容时:

  • 端点在不活动后缩容
  • 首次请求触发冷启动
  • 后续请求速度快

空闲期后的首次请求将触发冷启动。



📅 创建于 1 个月前 ✏️ 更新于 5 天前
glenn-jochersergiuwaxmann

评论