跳转至内容

专用端点

Ultralytics YOLO 部署至全球43个区域的专用端点。每个端点均为单租户服务,具备自动扩展、自定义URL及独立监控功能。

创建端点

将模型部署到专用端点:

  1. 导航至您的模型
  2. 点击部署选项卡
  3. 从地图中选择一个区域
  4. 点击部署

区域选择

从全球43个地区中选择:

交互式地图显示:

  • 区域图钉:点击选择
  • 延迟指标: 按距离进行颜色编码
    • Green: <100ms
    • 黄色:100-200毫秒
    • 红色:>200毫秒

区域表

查看所有地区详情:

专栏描述
区域区域标识符
位置城市/国家
延迟测得的ping时间
状态可用/已部署

明智选择

选择距离用户最近的区域以获得最低延迟。考虑部署到多个区域以实现全球覆盖。

可用区域

美洲(15个地区)

区域位置
美国中部1区美国爱荷华州
美国东部1区美国南卡罗来纳州
美国东部4号数据中心弗吉尼亚州,美国
美国东部5区美国哥伦布市
美国南部1区美国达拉斯
美国西部1区美国俄勒冈州
美国西部2区美国洛杉矶
美国西部3区美国盐湖城
美国西部4区拉斯维加斯,美国
北美-东北部1加拿大蒙特利尔
北美-东北部2加拿大多伦多
南美洲-东1巴西圣保罗
南美洲-西1智利圣地亚哥

欧洲(12个地区)

区域位置
欧洲-中部2华沙,波兰
欧洲-北1芬兰
欧洲-西南部1西班牙马德里
欧洲-西1比利时
欧洲-西2英国伦敦
欧洲-西3德国法兰克福
欧洲-西4荷兰
欧洲-西6瑞士苏黎世
欧洲-西8米兰,意大利
欧洲-西9法国巴黎
欧洲-西10德国柏林
欧洲-西12都灵,意大利

亚太地区(16个区域)

区域位置
亚洲-东1台湾
亚洲-东2香港
亚洲-东北1日本东京
亚洲-东北亚2日本大阪
亚洲-东北亚3首尔,韩国
亚洲-南1印度孟买
亚洲-南2印度德里
亚洲-东南亚1新加坡
亚洲-东南亚2印度尼西亚雅加达
澳大利亚-东南1悉尼,澳大利亚
澳大利亚-东南2澳大利亚墨尔本
我-中心1卡塔尔,多哈
我-中心2达曼,沙特阿拉伯
我-西1特拉维夫,以色列

终端配置

创建端点时:

设置描述默认值
区域部署区域-
最小实例数最小运行实例数0
最大实例数最大缩放限制10

缩放选项

设置行为
最小值 = 0空闲时缩放至零(成本效益高)
最小值大于0始终在线,无需冷启动
马克斯流量峰值上限

冷启动

当最小实例数 = 0 时,空闲后的首次请求将触发冷启动(耗时 2-5 秒)。对于对延迟敏感的应用程序,请设置最小值 > 0。

管理端点

查看和管理您的端点:

终端详情

领域描述
URL用于请求的HTTPS端点
区域部署区域
状态运行中,已停止,正在部署
实例当前/最大实例数量

终端URL

每个端点都有一个唯一的URL:

https://model-abc123-us-central1.a.run.app

点击复制按钮复制网址。

生命周期管理

控制您的终端状态:

行动描述
开始恢复已停止的端点
停止暂停该端点(不计费)
删除永久删除端点

终止端点

停止某个端点以暂停计费:

  1. 打开端点操作菜单
  2. 点击停止
  3. 确认操作

已停止的端点:

  • 请勿接受请求
  • 不要产生费用
  • 可随时重启

删除端点

永久删除一个端点:

  1. 打开端点操作菜单
  2. 点击删除
  3. 确认删除

永久性行动

删除操作将立即生效且不可撤销。您随时可以创建新的端点。

使用端点

身份验证

在请求中包含您的 API 密钥:

Authorization: Bearer YOUR_API_KEY

请求示例

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

响应格式

共享推理相同,但包含任务特定字段。

定价

专用端点计费基于:

组件费率
CPU每vCPU秒
内存每千兆字节每秒
请求每百万次请求

成本优化

  • 在开发端点中使用scale-to-zero
  • 设置适当的最大实例数
  • 监控仪表板中监控使用情况

常见问题

我可以创建多少个端点?

没有硬性限制。每个模型可以在多个区域拥有端点。总端点数取决于您的套餐。

部署后可以更改区域吗?

不,区域是固定的。要更改区域:

  1. 删除现有端点
  2. 在目标区域创建一个新的端点

如何处理多区域部署?

全球覆盖:

  1. 部署到多个区域
  2. 使用负载均衡器或DNS路由
  3. 将用户引导至最近的终点站

冷启动时间是多少?

冷启动时间因机型尺寸而异:

模型冷启动
YOLO11n约2秒
YOLO11m约3秒
YOLO11x约5秒

将最小实例数设置为大于0以消除冷启动。

我可以使用自定义域名吗?

自定义域名功能即将推出。目前,端点使用平台生成的URL。



📅 0 天前创建 ✏️ 0 天前更新
glenn-jocher

评论