专用端点
Ultralytics 平台支持将 YOLO 模型部署到全球 43 个区域的专用端点。每个端点都是一个单租户服务,具有自动扩缩容、自定义 URL 和独立监控功能。
创建端点
将模型部署到专用端点:
- 导航到您的模型
- 点击部署选项卡
- 从地图中选择一个区域
- 点击 部署
区域选择
从全球43个区域中选择:
交互式地图显示:
- 区域标记:点击选择
- 延迟指示器:按距离颜色编码
- Green: <100ms
- 黄色:100-200毫秒
- 红色:>200毫秒
区域表
查看所有区域及详细信息:
| 列 | 描述 |
|---|---|
| 区域 | 区域标识符 |
| 位置 | 城市/国家 |
| 延迟 | 测量的Ping时间 |
| 状态 | 可用/已部署 |
明智选择
选择离用户最近的区域以获得最低延迟。考虑部署到多个区域以实现全球覆盖。
可用区域
美洲(14个地区)
| 区域 | 位置 |
|---|---|
| us-central1 | 爱荷华州,美国 |
| us-east1 | 南卡罗来纳州,美国 |
| us-east4 | 弗吉尼亚州,美国 |
| us-east5 | 俄亥俄州,美国 |
| us-west1 | 俄勒冈州,美国 |
| us-west2 | 洛杉矶,美国 |
| us-west3 | 盐湖城,美国 |
| us-west4 | 拉斯维加斯,美国 |
| us-south1 | 达拉斯,美国 |
| northamerica-northeast1 | 蒙特利尔,加拿大 |
| northamerica-northeast2 | 多伦多,加拿大 |
| southamerica-east1 | 圣保罗,巴西 |
| southamerica-west1 | 圣地亚哥,智利 |
欧洲(12个区域)
| 区域 | 位置 |
|---|---|
| europe-west1 | 比利时 |
| europe-west2 | 伦敦,英国 |
| europe-west3 | 法兰克福,德国 |
| europe-west4 | 荷兰 |
| europe-west6 | 苏黎世,瑞士 |
| europe-west8 | 米兰,意大利 |
| europe-west9 | 巴黎,法国 |
| europe-west10 | 柏林,德国 |
| europe-west12 | 都灵,意大利 |
| europe-north1 | 芬兰 |
| europe-central2 | 华沙,波兰 |
| europe-southwest1 | 马德里,西班牙 |
亚太地区(14个区域)
| 区域 | 位置 |
|---|---|
| asia-east1 | 台湾 |
| asia-east2 | 香港 |
| asia-northeast1 | 东京,日本 |
| asia-northeast2 | 大阪,日本 |
| asia-northeast3 | 韩国首尔 |
| asia-south1 | 孟买,印度 |
| asia-south2 | 德里,印度 |
| asia-southeast1 | 新加坡 |
| asia-southeast2 | 雅加达,印度尼西亚 |
| australia-southeast1 | 悉尼,澳大利亚 |
| australia-southeast2 | 墨尔本,澳大利亚 |
中东与非洲(3个地区)
| 区域 | 位置 |
|---|---|
| me-central1 | 多哈,卡塔尔 |
| me-central2 | 达曼,沙特阿拉伯 |
| me-west1 | 特拉维夫,以色列 |
端点配置
创建端点时:
| 设置 | 描述 | 默认值 |
|---|---|---|
| 区域 | 部署区域 | - |
| 最小实例数 | 最小运行实例数 | 0 |
| 最大实例数 | 最大扩缩限制 | 10 |
扩展选项
| 设置 | 行为 |
|---|---|
| 最小 = 0 | 闲置时缩容到零(经济高效) |
| 最小 > 0 | 始终运行,无冷启动 |
| 最大 | 流量高峰上限 |
冷启动
当最小实例数 = 0 时,闲置后的第一个请求会触发冷启动(2-5秒)。对于延迟敏感型应用,请将最小实例数设置为 > 0。
管理端点
查看和管理您的端点:
端点详情
| 字段 | 描述 |
|---|---|
| URL | 用于请求的 HTTPS 端点 |
| 区域 | 部署区域 |
| 状态 | 运行中、已停止、部署中 |
| 实例 | 当前/最大实例数 |
端点 URL
每个端点都有一个唯一的 URL:
https://model-abc123-us-central1.a.run.app
点击复制按钮以复制 URL。
生命周期管理
控制您的端点状态:
| 操作 | 描述 |
|---|---|
| 启动 | 恢复已停止的端点 |
| 停止 | 暂停端点(停止计费) |
| 删除 | 永久移除端点 |
停止端点
停止端点以暂停计费:
- 打开端点操作菜单
- 点击 停止
- 确认操作
已停止的端点:
- 不接受请求
- 不产生费用
- 可随时重启
删除端点
永久删除端点:
- 打开端点操作菜单
- 点击删除
- 确认删除
永久操作
删除是即时且永久的。您随时可以创建新的端点。
使用端点
身份验证
在请求中包含您的 API 密钥:
Authorization: Bearer YOUR_API_KEY
请求示例
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
响应格式
与 共享推理 相同,但包含任务特定字段。
定价
专用端点计费依据:
| 组件 | 费率 |
|---|---|
| CPU | 按 vCPU 秒计费 |
| 内存 | 按 GB 秒计费 |
| 请求 | 按百万请求计费 |
成本优化
- 开发端点使用按需扩缩容(scale-to-zero)
- 设置适当的最大实例数
- 在 监控 面板中监控使用情况
常见问题
我可以创建多少个端点?
没有硬性限制。每个模型可以在多个区域拥有端点。端点总数取决于您的套餐。
部署后可以更改区域吗?
不,区域是固定的。要更改区域:
- 删除现有端点
- 在所需区域创建新端点
如何处理多区域部署?
如需全球覆盖:
- 部署到多个区域
- 使用负载均衡器或 DNS 路由
- 将用户路由到最近的端点
冷启动时间是多少?
冷启动时间因模型大小而异:
| 模型 | 冷启动 |
|---|---|
| YOLO26n | ~2 秒 |
| YOLO26m | ~3 秒 |
| YOLO26x | ~5 秒 |
将最小实例数设置为 > 0 以消除冷启动。
我可以使用自定义域名吗?
自定义域名即将推出。目前,端点使用平台生成的 URL。
📅 创建于 20 天前 ✏️ 更新于 14 天前