跳转至内容

专用端点

Ultralytics 平台支持将 YOLO 模型部署到全球 43 个区域的专用端点。每个端点都是一个单租户服务,具有自动扩缩容、自定义 URL 和独立监控功能。

创建端点

将模型部署到专用端点:

  1. 导航到您的模型
  2. 点击部署选项卡
  3. 从地图中选择一个区域
  4. 点击 部署

区域选择

从全球43个区域中选择:

交互式地图显示:

  • 区域标记:点击选择
  • 延迟指示器:按距离颜色编码
    • Green: <100ms
    • 黄色:100-200毫秒
    • 红色:>200毫秒

区域表

查看所有区域及详细信息:

描述
区域区域标识符
位置城市/国家
延迟测量的Ping时间
状态可用/已部署

明智选择

选择离用户最近的区域以获得最低延迟。考虑部署到多个区域以实现全球覆盖。

可用区域

美洲(14个地区)

区域位置
us-central1爱荷华州,美国
us-east1南卡罗来纳州,美国
us-east4弗吉尼亚州,美国
us-east5俄亥俄州,美国
us-west1俄勒冈州,美国
us-west2洛杉矶,美国
us-west3盐湖城,美国
us-west4拉斯维加斯,美国
us-south1达拉斯,美国
northamerica-northeast1蒙特利尔,加拿大
northamerica-northeast2多伦多,加拿大
southamerica-east1圣保罗,巴西
southamerica-west1圣地亚哥,智利

欧洲(12个区域)

区域位置
europe-west1比利时
europe-west2伦敦,英国
europe-west3法兰克福,德国
europe-west4荷兰
europe-west6苏黎世,瑞士
europe-west8米兰,意大利
europe-west9巴黎,法国
europe-west10柏林,德国
europe-west12都灵,意大利
europe-north1芬兰
europe-central2华沙,波兰
europe-southwest1马德里,西班牙

亚太地区(14个区域)

区域位置
asia-east1台湾
asia-east2香港
asia-northeast1东京,日本
asia-northeast2大阪,日本
asia-northeast3韩国首尔
asia-south1孟买,印度
asia-south2德里,印度
asia-southeast1新加坡
asia-southeast2雅加达,印度尼西亚
australia-southeast1悉尼,澳大利亚
australia-southeast2墨尔本,澳大利亚

中东与非洲(3个地区)

区域位置
me-central1多哈,卡塔尔
me-central2达曼,沙特阿拉伯
me-west1特拉维夫,以色列

端点配置

创建端点时:

设置描述默认值
区域部署区域-
最小实例数最小运行实例数0
最大实例数最大扩缩限制10

扩展选项

设置行为
最小 = 0闲置时缩容到零(经济高效)
最小 > 0始终运行,无冷启动
最大流量高峰上限

冷启动

当最小实例数 = 0 时,闲置后的第一个请求会触发冷启动(2-5秒)。对于延迟敏感型应用,请将最小实例数设置为 > 0。

管理端点

查看和管理您的端点:

端点详情

字段描述
URL用于请求的 HTTPS 端点
区域部署区域
状态运行中、已停止、部署中
实例当前/最大实例数

端点 URL

每个端点都有一个唯一的 URL:

https://model-abc123-us-central1.a.run.app

点击复制按钮以复制 URL。

生命周期管理

控制您的端点状态:

操作描述
启动恢复已停止的端点
停止暂停端点(停止计费)
删除永久移除端点

停止端点

停止端点以暂停计费:

  1. 打开端点操作菜单
  2. 点击 停止
  3. 确认操作

已停止的端点:

  • 不接受请求
  • 不产生费用
  • 可随时重启

删除端点

永久删除端点:

  1. 打开端点操作菜单
  2. 点击删除
  3. 确认删除

永久操作

删除是即时且永久的。您随时可以创建新的端点。

使用端点

身份验证

在请求中包含您的 API 密钥:

Authorization: Bearer YOUR_API_KEY

请求示例

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

响应格式

共享推理 相同,但包含任务特定字段。

定价

专用端点计费依据:

组件费率
CPU按 vCPU 秒计费
内存按 GB 秒计费
请求按百万请求计费

成本优化

  • 开发端点使用按需扩缩容(scale-to-zero)
  • 设置适当的最大实例数
  • 监控 面板中监控使用情况

常见问题

我可以创建多少个端点?

没有硬性限制。每个模型可以在多个区域拥有端点。端点总数取决于您的套餐。

部署后可以更改区域吗?

不,区域是固定的。要更改区域:

  1. 删除现有端点
  2. 在所需区域创建新端点

如何处理多区域部署?

如需全球覆盖:

  1. 部署到多个区域
  2. 使用负载均衡器或 DNS 路由
  3. 将用户路由到最近的端点

冷启动时间是多少?

冷启动时间因模型大小而异:

模型冷启动
YOLO26n~2 秒
YOLO26m~3 秒
YOLO26x~5 秒

将最小实例数设置为 > 0 以消除冷启动。

我可以使用自定义域名吗?

自定义域名即将推出。目前,端点使用平台生成的 URL。



📅 创建于 20 天前 ✏️ 更新于 14 天前
glenn-jocher

评论