专用端点
Ultralytics YOLO 部署至全球43个区域的专用端点。每个端点均为单租户服务,具备自动扩展功能、独立端点URL及独立监控系统。

创建端点
从部署选项卡
从其部署模型 Deploy tab:
- 导航到您的模型
- 点击部署选项卡
- 从区域表中选择一个区域(按您所在位置的延迟排序)
- 在区域行上点击部署
部署名称由模型名称和区域城市自动生成(例如: yolo11n-iowa)。
从部署页面
从全局创建部署 Deploy 侧边栏中的页面:
- 点击新建部署
- 从模型选择器中选择一个模型
- 从地图或表格中选择一个区域
- 可选自定义部署名称和资源
- 点击部署模型

部署生命周期
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
区域选择
从全球43个地区中选择。交互式地区地图和表格显示:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- 已部署区域:标有“已部署”徽章
- 部署区域:动态脉冲指示器
- 双向高亮:将鼠标悬停在地图上会高亮显示表格行,反之亦然。

模型上的区域表 Deploy 标签包含:
| 列 | 描述 |
|---|---|
| 位置 | 城市与国家(带国旗图标) |
| 区域 | 区域标识符 |
| 延迟 | 测量到的ping时间(3次ping的中位数) |
| 距离 | 距离您当前位置的公里数 |
| 行动 | 部署按钮或“已部署”状态徽章 |
新部署对话框
字段 New Deployment 对话框(来自全局) Deploy 页面)显示了一个更简洁的区域表,仅包含位置、延迟和选择三列。
明智选择
选择距离用户最近的区域以获得最低延迟。使用重新扫描按钮可从当前位置重新测量延迟。
可用区域
| 区域 | 位置 |
|---|---|
| us-central1 | 爱荷华州,美国 |
| us-east1 | 南卡罗来纳州,美国 |
| us-east4 | 美国弗吉尼亚州北部 |
| us-east5 | 哥伦布,美国 |
| us-south1 | 达拉斯,美国 |
| us-west1 | 俄勒冈州,美国 |
| us-west2 | 洛杉矶,美国 |
| us-west3 | 盐湖城,美国 |
| us-west4 | 拉斯维加斯,美国 |
| northamerica-northeast1 | 蒙特利尔,加拿大 |
| northamerica-northeast2 | 多伦多,加拿大 |
| 北美洲-南1 | 墨西哥克雷塔罗 |
| southamerica-east1 | 巴西圣保罗 |
| southamerica-west1 | 圣地亚哥,智利 |
| 区域 | 位置 |
|---|---|
| europe-west1 | 比利时圣吉斯兰 |
| europe-west2 | 伦敦,英国 |
| europe-west3 | 法兰克福,德国 |
| europe-west4 | 荷兰埃姆斯哈芬 |
| europe-west6 | 苏黎世,瑞士 |
| europe-west8 | 米兰,意大利 |
| europe-west9 | 巴黎,法国 |
| europe-west10 | 柏林,德国 |
| europe-west12 | 都灵,意大利 |
| europe-north1 | 芬兰哈米纳 |
| 欧洲-北2 | 斯德哥尔摩,瑞典 |
| europe-central2 | 华沙,波兰 |
| europe-southwest1 | 马德里,西班牙 |
| 区域 | 位置 |
|---|---|
| asia-east1 | 彰化,台湾 |
| asia-east2 | 香港九龙 |
| asia-northeast1 | 东京,日本 |
| asia-northeast2 | 大阪,日本 |
| asia-northeast3 | 韩国首尔 |
| asia-south1 | 孟买,印度 |
| asia-south2 | 德里,印度 |
| asia-southeast1 | 裕廊西,新加坡 |
| asia-southeast2 | 雅加达,印度尼西亚 |
| 亚洲-东南亚3 | 曼谷,泰国 |
| australia-southeast1 | 悉尼,澳大利亚 |
| australia-southeast2 | 墨尔本,澳大利亚 |
| 区域 | 位置 |
|---|---|
| 非洲-南1 | 南非约翰内斯堡 |
| me-central1 | 多哈,卡塔尔 |
| me-central2 | 达曼,沙特阿拉伯 |
| me-west1 | 特拉维夫,以色列 |
端点配置
新部署对话框
字段 New Deployment 对话框提供:
| 设置 | 描述 | 默认值 |
|---|---|---|
| 模型 | 从已完成的模型中选择 | - |
| 区域 | 部署区域 | - |
| 部署名称 | 自动生成,可编辑 | - |
| CPU | CPU (1-8) | 1 |
| 内存(GB) | 内存分配(1-32 GB) | 2 |

资源设置位于可折叠的"资源"部分下。部署默认采用零缩放策略(最小实例数=0,最大实例数=1)——您只需为实际推理时间付费。
自动生成的名称
部署名称由模型名称和区域城市自动生成(例如: yolo11n-iowa). 若将同一模型再次部署至同一区域,则会添加数字后缀(例如: yolo11n-iowa-2)。
部署选项卡(快速部署)
当从模型的 Deploy 选项卡中,端点使用默认资源(CPU,2 GB内存)创建,并启用了缩放至零功能。部署名称由系统自动生成。
管理端点
查看模式
部署列表支持三种查看模式:
| 模式 | 描述 |
|---|---|
| 卡片 | 完整详情卡,包含日志、代码示例和预测面板 |
| 紧凑 | 包含关键指标的小卡片网格 |
| 表格 | 带可排序列和搜索功能的数据表 |

部署卡(卡片视图)
卡片视图中的每张部署卡显示:
- 标题栏:姓名、地区标识、状态徽章、开始/停止/删除按钮
- 终端URL:可复制的URL,附带API文档链接
- 指标:请求计数(24小时),P95延迟,错误率
- 健康检查:实时健康指标,含延迟数据与手动刷新功能
- 标签页:
Logs,Code和Predict
字段 Logs 标签页显示最近的日志条目,并支持严重性过滤(全部/错误)。 Code 标签页展示了包含您实际端点URL和API密钥Python、JavaScript和cURL代码示例,可直接使用。 Predict tab 提供了一个内联预测面板,用于在部署环境中直接进行测试。
部署状态
| 状态 | 描述 |
|---|---|
| 创建 | 部署正在设置中 |
| 部署 | 容器正在启动 |
| 准备就绪 | 终端已上线并接受请求 |
| 停止 | 终端正在关闭 |
| 停止 | 终端已暂停(不计费) |
| 失败 | 部署失败(请参阅错误信息) |
端点 URL
每个端点都有一个唯一的URL,例如:
https://predict-abc123.run.app

点击复制按钮复制网址。点击文档图标查看该端点的自动生成的API文档。
生命周期管理
控制您的端点状态:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| 操作 | 描述 |
|---|---|
| 启动 | 恢复已停止的端点 |
| 停止 | 暂停端点(停止计费) |
| 删除 | 永久移除端点 |
停止端点
停止端点以暂停计费:
- 点击部署卡上的暂停图标
- 端点状态变更为"停止中",随后变更为"已停止"
已停止的端点:
- 不接受请求
- 不产生费用
- 可随时重启
删除端点
永久删除端点:
- 点击部署卡上的删除(垃圾桶)图标
- 在对话框中确认删除
永久操作
删除是即时且永久的。您随时可以创建新的端点。
使用端点
身份验证
每次部署都需使用您账户中的API密钥创建。请在请求中包含该密钥:
Authorization: Bearer YOUR_API_KEY
API密钥前缀显示在部署卡页脚用于标识。请通过API密钥页面生成密钥。
无速率限制
专用端点不受平台API速率限制的约束。请求将直接发送至您的专用服务,因此吞吐量仅受CPU、内存及扩展配置的限制。相较于共享推理服务(每个API密钥每分钟限20次请求),这是其关键优势所在。
请求示例
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
请求参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
file | 文件 | - | 图像文件(必填) |
conf | 浮点数 | 0.25 | 最小置信度阈值 |
iou | 浮点数 | 0.7 | NMS IoU 阈值 |
imgsz | 整型 | 640 | 输入图像尺寸 |
normalize | 字符串 | - | 返回归一化坐标 |
响应格式
与 共享推理 相同,但包含任务特定字段。
定价
专用端点计费依据:
| 组件 | 费率 |
|---|---|
| CPU | 按 vCPU 秒计费 |
| 内存 | 按 GB 秒计费 |
| 请求 | 按百万请求计费 |
常见问题
我可以创建多少个端点?
端点限制取决于计划:
- 免费:最多 3 次部署
- 专业版:最多支持10次部署
- 企业版:无限部署
每个模型仍可在您的计划配额范围内部署到多个区域。
部署后可以更改区域吗?
不,区域是固定的。要更改区域:
- 删除现有端点
- 在所需区域创建新端点
如何处理多区域部署?
如需全球覆盖:
- 部署到多个区域
- 使用负载均衡器或 DNS 路由
- 将用户路由到最近的端点
冷启动时间是多少?
冷启动时间取决于模型大小以及容器是否已在区域中缓存。典型范围:
| 场景 | 冷启动 |
|---|---|
| 缓存容器 | 约5-15秒 |
| 首次部署/区域 | 约15-45秒 |
健康检查采用55秒超时设置,以应对最坏情况下的冷启动场景。
我可以使用自定义域名吗?
自定义域名即将推出。目前,端点使用平台生成的 URL。