专用端点
Ultralytics YOLO 部署至全球43个区域的专用端点。每个端点均为单租户服务,具备自动扩展、自定义URL及独立监控功能。
创建端点
将模型部署到专用端点:
- 导航至您的模型
- 点击部署选项卡
- 从地图中选择一个区域
- 点击部署
区域选择
从全球43个地区中选择:
交互式地图显示:
- 区域图钉:点击选择
- 延迟指标: 按距离进行颜色编码
- Green: <100ms
- 黄色:100-200毫秒
- 红色:>200毫秒
区域表
查看所有地区详情:
| 专栏 | 描述 |
|---|---|
| 区域 | 区域标识符 |
| 位置 | 城市/国家 |
| 延迟 | 测得的ping时间 |
| 状态 | 可用/已部署 |
明智选择
选择距离用户最近的区域以获得最低延迟。考虑部署到多个区域以实现全球覆盖。
可用区域
美洲(15个地区)
| 区域 | 位置 |
|---|---|
| 美国中部1区 | 美国爱荷华州 |
| 美国东部1区 | 美国南卡罗来纳州 |
| 美国东部4号数据中心 | 弗吉尼亚州,美国 |
| 美国东部5区 | 美国哥伦布市 |
| 美国南部1区 | 美国达拉斯 |
| 美国西部1区 | 美国俄勒冈州 |
| 美国西部2区 | 美国洛杉矶 |
| 美国西部3区 | 美国盐湖城 |
| 美国西部4区 | 拉斯维加斯,美国 |
| 北美-东北部1 | 加拿大蒙特利尔 |
| 北美-东北部2 | 加拿大多伦多 |
| 南美洲-东1 | 巴西圣保罗 |
| 南美洲-西1 | 智利圣地亚哥 |
欧洲(12个地区)
| 区域 | 位置 |
|---|---|
| 欧洲-中部2 | 华沙,波兰 |
| 欧洲-北1 | 芬兰 |
| 欧洲-西南部1 | 西班牙马德里 |
| 欧洲-西1 | 比利时 |
| 欧洲-西2 | 英国伦敦 |
| 欧洲-西3 | 德国法兰克福 |
| 欧洲-西4 | 荷兰 |
| 欧洲-西6 | 瑞士苏黎世 |
| 欧洲-西8 | 米兰,意大利 |
| 欧洲-西9 | 法国巴黎 |
| 欧洲-西10 | 德国柏林 |
| 欧洲-西12 | 都灵,意大利 |
亚太地区(16个区域)
| 区域 | 位置 |
|---|---|
| 亚洲-东1 | 台湾 |
| 亚洲-东2 | 香港 |
| 亚洲-东北1 | 日本东京 |
| 亚洲-东北亚2 | 日本大阪 |
| 亚洲-东北亚3 | 首尔,韩国 |
| 亚洲-南1 | 印度孟买 |
| 亚洲-南2 | 印度德里 |
| 亚洲-东南亚1 | 新加坡 |
| 亚洲-东南亚2 | 印度尼西亚雅加达 |
| 澳大利亚-东南1 | 悉尼,澳大利亚 |
| 澳大利亚-东南2 | 澳大利亚墨尔本 |
| 我-中心1 | 卡塔尔,多哈 |
| 我-中心2 | 达曼,沙特阿拉伯 |
| 我-西1 | 特拉维夫,以色列 |
终端配置
创建端点时:
| 设置 | 描述 | 默认值 |
|---|---|---|
| 区域 | 部署区域 | - |
| 最小实例数 | 最小运行实例数 | 0 |
| 最大实例数 | 最大缩放限制 | 10 |
缩放选项
| 设置 | 行为 |
|---|---|
| 最小值 = 0 | 空闲时缩放至零(成本效益高) |
| 最小值大于0 | 始终在线,无需冷启动 |
| 马克斯 | 流量峰值上限 |
冷启动
当最小实例数 = 0 时,空闲后的首次请求将触发冷启动(耗时 2-5 秒)。对于对延迟敏感的应用程序,请设置最小值 > 0。
管理端点
查看和管理您的端点:
终端详情
| 领域 | 描述 |
|---|---|
| URL | 用于请求的HTTPS端点 |
| 区域 | 部署区域 |
| 状态 | 运行中,已停止,正在部署 |
| 实例 | 当前/最大实例数量 |
终端URL
每个端点都有一个唯一的URL:
https://model-abc123-us-central1.a.run.app
点击复制按钮复制网址。
生命周期管理
控制您的终端状态:
| 行动 | 描述 |
|---|---|
| 开始 | 恢复已停止的端点 |
| 停止 | 暂停该端点(不计费) |
| 删除 | 永久删除端点 |
终止端点
停止某个端点以暂停计费:
- 打开端点操作菜单
- 点击停止
- 确认操作
已停止的端点:
- 请勿接受请求
- 不要产生费用
- 可随时重启
删除端点
永久删除一个端点:
- 打开端点操作菜单
- 点击删除
- 确认删除
永久性行动
删除操作将立即生效且不可撤销。您随时可以创建新的端点。
使用端点
身份验证
在请求中包含您的 API 密钥:
Authorization: Bearer YOUR_API_KEY
请求示例
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
响应格式
与共享推理相同,但包含任务特定字段。
定价
专用端点计费基于:
| 组件 | 费率 |
|---|---|
| CPU | 每vCPU秒 |
| 内存 | 每千兆字节每秒 |
| 请求 | 每百万次请求 |
成本优化
- 在开发端点中使用scale-to-zero
- 设置适当的最大实例数
- 在监控仪表板中监控使用情况
常见问题
我可以创建多少个端点?
没有硬性限制。每个模型可以在多个区域拥有端点。总端点数取决于您的套餐。
部署后可以更改区域吗?
不,区域是固定的。要更改区域:
- 删除现有端点
- 在目标区域创建一个新的端点
如何处理多区域部署?
全球覆盖:
- 部署到多个区域
- 使用负载均衡器或DNS路由
- 将用户引导至最近的终点站
冷启动时间是多少?
冷启动时间因机型尺寸而异:
| 模型 | 冷启动 |
|---|---|
| YOLO11n | 约2秒 |
| YOLO11m | 约3秒 |
| YOLO11x | 约5秒 |
将最小实例数设置为大于0以消除冷启动。
我可以使用自定义域名吗?
自定义域名功能即将推出。目前,端点使用平台生成的URL。
📅 0 天前创建 ✏️ 0 天前更新