专用端点
Ultralytics Platform 支持将YOLO模型部署到全球43个区域的专用端点。每个端点都是一个单租户服务,具有自动扩缩、唯一端点URL和独立监控功能。

创建端点
从部署选项卡
从其部署模型 Deploy 选项卡:
- 导航到您的模型
- 点击部署选项卡
- 从区域表中选择区域(按您所在位置的延迟排序)
- 点击区域行上的 部署
部署名称是根据模型名称和区域城市自动生成的(例如, yolo11n-iowa)。
从部署页面
从全局创建部署 Deploy 侧边栏中的页面:
- 点击 新建部署
- 从模型选择器中选择一个模型
- 从地图或表格中选择区域
- 可选地自定义部署名称和资源
- 点击 部署模型

部署生命周期
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
区域选择
从全球 43 个区域中选择。交互式区域地图和表格显示:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- 已部署区域:以“已部署”徽章突出显示
- 正在部署区域:动画脉冲指示器
- 双向高亮:鼠标悬停在地图上会高亮表格行,反之亦然。

模型上的区域表 Deploy 选项卡包括:
| 列 | 描述 |
|---|---|
| 位置 | 带有旗帜图标的城市和国家 |
| 区域 | 区域标识符 |
| 延迟 | 测量的ping时间 (3次ping的中间值) |
| 距离 | 距您位置的距离(公里) |
| 操作 | 部署按钮或“已部署”状态徽章 |
新部署对话框
字段 New Deployment 对话框(来自全局 Deploy 页面)显示了一个更简单的区域表,仅包含“位置”、“延迟”和“选择”列。
明智选择
选择离您的用户最近的区域以获得最低延迟。使用重新扫描按钮重新测量您当前位置的延迟。
可用区域
| 区域 | 位置 |
|---|---|
| us-central1 | 爱荷华州,美国 |
| us-east1 | 南卡罗来纳州,美国 |
| us-east4 | 美国北弗吉尼亚 |
| us-east5 | 哥伦布,美国 |
| us-south1 | 达拉斯,美国 |
| us-west1 | 俄勒冈州,美国 |
| us-west2 | 洛杉矶,美国 |
| us-west3 | 盐湖城,美国 |
| us-west4 | 拉斯维加斯,美国 |
| northamerica-northeast1 | 蒙特利尔,加拿大 |
| northamerica-northeast2 | 多伦多,加拿大 |
| northamerica-south1 | 克雷塔罗,墨西哥 |
| southamerica-east1 | 巴西圣保罗 |
| southamerica-west1 | 圣地亚哥,智利 |
| 区域 | 位置 |
|---|---|
| europe-west1 | 比利时圣吉斯兰 |
| europe-west2 | 伦敦,英国 |
| europe-west3 | 法兰克福,德国 |
| europe-west4 | 埃姆斯哈文,荷兰 |
| europe-west6 | 苏黎世,瑞士 |
| europe-west8 | 米兰,意大利 |
| europe-west9 | 巴黎,法国 |
| europe-west10 | 柏林,德国 |
| europe-west12 | 都灵,意大利 |
| europe-north1 | 哈米纳,芬兰 |
| 欧洲北部2 | 瑞典斯德哥尔摩 |
| europe-central2 | 华沙,波兰 |
| europe-southwest1 | 马德里,西班牙 |
| 区域 | 位置 |
|---|---|
| asia-east1 | 彰化,台湾 |
| asia-east2 | 香港九龙 |
| asia-northeast1 | 东京,日本 |
| asia-northeast2 | 大阪,日本 |
| asia-northeast3 | 韩国首尔 |
| asia-south1 | 孟买,印度 |
| asia-south2 | 德里,印度 |
| asia-southeast1 | 裕廊西,新加坡 |
| asia-southeast2 | 雅加达,印度尼西亚 |
| asia-southeast3 | 泰国曼谷 |
| australia-southeast1 | 悉尼,澳大利亚 |
| australia-southeast2 | 墨尔本,澳大利亚 |
| 区域 | 位置 |
|---|---|
| africa-south1 | 约翰内斯堡,南非 |
| me-central1 | 多哈,卡塔尔 |
| me-central2 | 达曼,沙特阿拉伯 |
| me-west1 | 特拉维夫,以色列 |
端点配置
新部署对话框
字段 New Deployment 对话框提供:
| 设置 | 描述 | 默认值 |
|---|---|---|
| 模型 | 从已完成的模型中选择 | - |
| 区域 | 部署区域 | - |
| 部署名称 | 自动生成,可编辑 | - |
| CPU 核心 | CPU 分配 (1-8) | 1 |
| 内存 (GB) | 内存分配 (1-32 GB) | 2 |

资源设置可在可折叠的资源部分下获取。部署默认使用缩放到零(最小实例数 = 0,最大实例数 = 1)— 您只需为实际推理时间付费。
自动生成名称
部署名称是根据模型名称和区域城市自动生成的(例如, yolo11n-iowa)。如果您再次将同一模型部署到同一区域,则会添加一个数字后缀(例如, yolo11n-iowa-2)。
部署选项卡(快速部署)
从模型部署时 Deploy 选项卡中,端点使用默认资源(1 CPU,2 GB 内存)创建,并启用零扩容。部署名称是自动生成的。
管理端点
视图模式
部署列表支持三种视图模式:
| 模式 | 描述 |
|---|---|
| 卡片 | 包含日志、代码示例、预测面板的完整详细信息卡 |
| 紧凑 | 带关键指标的小型卡片网格 |
| 表格 | 带可排序列和搜索功能的DataTable |

部署卡片(卡片视图)
卡片视图中的每个部署卡片显示:
- 标题:名称、区域标志、状态徽章、启动/停止/删除按钮
- 端点URL:可复制的URL,附带API文档链接
- 指标:请求计数(24小时)、P95延迟、错误率
- 健康检查:实时健康指示器,包含延迟和手动刷新功能
- 选项卡:
Logs,Code和Predict
字段 Logs 选项卡显示最近的日志条目,并支持按严重性过滤(所有 / 错误)。该 Code 选项卡显示 Python、JavaScript 和 cURL 的即用型代码示例,其中包含您的实际端点 URL 和 API 密钥。该 Predict 选项卡提供一个内联预测面板,用于直接在部署上进行测试。
部署状态
| 状态 | 描述 |
|---|---|
| 创建中 | 正在设置部署 |
| 正在部署 | 容器正在启动 |
| 准备就绪 | 端点已上线并接受请求 |
| 正在停止 | 端点正在关闭 |
| 已停止 | 端点已暂停(不计费) |
| 失败 | 部署失败(查看错误消息) |
端点 URL
每个端点都有一个唯一的 URL,例如:
https://predict-abc123.run.app

点击复制按钮以复制URL。点击文档图标以查看该端点的自动生成API文档。
生命周期管理
控制您的端点状态:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| 操作 | 描述 |
|---|---|
| 启动 | 恢复已停止的端点 |
| 停止 | 暂停端点(停止计费) |
| 删除 | 永久移除端点 |
停止端点
停止端点以暂停计费:
- 点击部署卡片上的暂停图标。
- 端点状态变为“正在停止”然后“已停止”
已停止的端点:
- 不接受请求
- 不产生费用
- 可随时重启
删除端点
永久删除端点:
- 点击部署卡片上的删除(垃圾桶)图标
- 在对话框中确认删除
永久操作
删除是即时且永久的。您随时可以创建新的端点。
使用端点
身份验证
每个部署都使用您账户中的 API 密钥创建。请在请求中包含它:
Authorization: Bearer YOUR_API_KEY
API 密钥前缀显示在部署卡片底部,用于识别。从 API 密钥 生成密钥。
无速率限制
专用端点不受平台API速率限制。请求直接发送到您的专用服务,因此吞吐量仅受限于端点的CPU、内存和扩展配置。这是相对于共享推理的一个关键优势,共享推理每个API密钥的速率限制为每分钟20个请求。
请求示例
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
请求参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
file | 文件 | - | 图像文件 (必需) |
conf | 浮点数 | 0.25 | 最小置信度阈值 |
iou | 浮点数 | 0.7 | NMS IoU 阈值 |
imgsz | 整型 | 640 | 输入图像尺寸 |
normalize | 字符串 | - | 返回归一化坐标 |
响应格式
与 共享推理 相同,但包含任务特定字段。
定价
专用端点计费依据:
| 组件 | 费率 |
|---|---|
| CPU | 按 vCPU 秒计费 |
| 内存 | 按 GB 秒计费 |
| 请求 | 按百万请求计费 |
常见问题
我可以创建多少个端点?
端点限制取决于套餐:
- 免费:最多 3 次部署
- 专业版:最多 10 次部署
- 企业版:无限部署
每个模型仍然可以在您的计划配额内部署到多个区域。
部署后可以更改区域吗?
不,区域是固定的。要更改区域:
- 删除现有端点
- 在所需区域创建新端点
如何处理多区域部署?
如需全球覆盖:
- 部署到多个区域
- 使用负载均衡器或 DNS 路由
- 将用户路由到最近的端点
冷启动时间是多少?
冷启动时间取决于模型大小以及容器是否已在该区域缓存。典型范围:
| 场景 | 冷启动 |
|---|---|
| 缓存容器 | 约5-15秒 |
| 首次部署/区域 | 约15-45秒 |
健康检查使用 55 秒超时,以适应最坏情况下的冷启动。
我可以使用自定义域名吗?
自定义域名即将推出。目前,端点使用平台生成的 URL。