跳转至内容

专用端点

Ultralytics YOLO 部署至全球43个区域的专用端点。每个端点均为单租户服务,具备自动扩展功能、独立端点URL及独立监控系统。

Ultralytics 模型部署选项卡(含区域地图与表格)

创建端点

从部署选项卡

从其部署模型 Deploy tab:

  1. 导航到您的模型
  2. 点击部署选项卡
  3. 从区域表中选择一个区域(按您所在位置的延迟排序)
  4. 在区域行上点击部署

部署名称由模型名称和区域城市自动生成(例如: yolo11n-iowa)。

从部署页面

从全局创建部署 Deploy 侧边栏中的页面:

  1. 点击新建部署
  2. 从模型选择器中选择一个模型
  3. 从地图或表格中选择一个区域
  4. 可选自定义部署名称和资源
  5. 点击部署模型

Ultralytics 全新部署对话框,配备模型选择器与区域地图

部署生命周期

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

区域选择

从全球43个地区中选择。交互式地区地图和表格显示:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • 已部署区域:标有“已部署”徽章
  • 部署区域:动态脉冲指示器
  • 双向高亮:将鼠标悬停在地图上会高亮显示表格行,反之亦然。

Ultralytics 选项卡区域延迟表(按延迟排序)

模型上的区域表 Deploy 标签包含:

描述
位置城市与国家(带国旗图标)
区域区域标识符
延迟测量到的ping时间(3次ping的中位数)
距离距离您当前位置的公里数
行动部署按钮或“已部署”状态徽章

新部署对话框

字段 New Deployment 对话框(来自全局) Deploy 页面)显示了一个更简洁的区域表,仅包含位置、延迟和选择三列。

明智选择

选择距离用户最近的区域以获得最低延迟。使用重新扫描按钮可从当前位置重新测量延迟。

可用区域

区域位置
us-central1爱荷华州,美国
us-east1南卡罗来纳州,美国
us-east4美国弗吉尼亚州北部
us-east5哥伦布,美国
us-south1达拉斯,美国
us-west1俄勒冈州,美国
us-west2洛杉矶,美国
us-west3盐湖城,美国
us-west4拉斯维加斯,美国
northamerica-northeast1蒙特利尔,加拿大
northamerica-northeast2多伦多,加拿大
北美洲-南1墨西哥克雷塔罗
southamerica-east1巴西圣保罗
southamerica-west1圣地亚哥,智利
区域位置
europe-west1比利时圣吉斯兰
europe-west2伦敦,英国
europe-west3法兰克福,德国
europe-west4荷兰埃姆斯哈芬
europe-west6苏黎世,瑞士
europe-west8米兰,意大利
europe-west9巴黎,法国
europe-west10柏林,德国
europe-west12都灵,意大利
europe-north1芬兰哈米纳
欧洲-北2斯德哥尔摩,瑞典
europe-central2华沙,波兰
europe-southwest1马德里,西班牙
区域位置
asia-east1彰化,台湾
asia-east2香港九龙
asia-northeast1东京,日本
asia-northeast2大阪,日本
asia-northeast3韩国首尔
asia-south1孟买,印度
asia-south2德里,印度
asia-southeast1裕廊西,新加坡
asia-southeast2雅加达,印度尼西亚
亚洲-东南亚3曼谷,泰国
australia-southeast1悉尼,澳大利亚
australia-southeast2墨尔本,澳大利亚
区域位置
非洲-南1南非约翰内斯堡
me-central1多哈,卡塔尔
me-central2达曼,沙特阿拉伯
me-west1特拉维夫,以色列

端点配置

新部署对话框

字段 New Deployment 对话框提供:

设置描述默认值
模型从已完成的模型中选择-
区域部署区域-
部署名称自动生成,可编辑-
CPUCPU (1-8)1
内存(GB)内存分配(1-32 GB)2

Ultralytics 对话框资源面板扩展

资源设置位于可折叠的"资源"部分下。部署默认采用零缩放策略(最小实例数=0,最大实例数=1)——您只需为实际推理时间付费。

自动生成的名称

部署名称由模型名称和区域城市自动生成(例如: yolo11n-iowa). 若将同一模型再次部署至同一区域,则会添加数字后缀(例如: yolo11n-iowa-2)。

部署选项卡(快速部署)

当从模型的 Deploy 选项卡中,端点使用默认资源(CPU,2 GB内存)创建,并启用了缩放至零功能。部署名称由系统自动生成。

管理端点

查看模式

部署列表支持三种查看模式:

模式描述
卡片完整详情卡,包含日志、代码示例和预测面板
紧凑包含关键指标的小卡片网格
表格带可排序列和搜索功能的数据表

Ultralytics 部署选项卡活动部署卡片视图

部署卡(卡片视图)

卡片视图中的每张部署卡显示:

  • 标题栏:姓名、地区标识、状态徽章、开始/停止/删除按钮
  • 终端URL:可复制的URL,附带API文档链接
  • 指标:请求计数(24小时),P95延迟,错误率
  • 健康检查:实时健康指标,含延迟数据与手动刷新功能
  • 标签页: Logs, CodePredict

字段 Logs 标签页显示最近的日志条目,并支持严重性过滤(全部/错误)。 Code 标签页展示了包含您实际端点URL和API密钥Python、JavaScript和cURL代码示例,可直接使用。 Predict tab 提供了一个内联预测面板,用于在部署环境中直接进行测试。

部署状态

状态描述
创建部署正在设置中
部署容器正在启动
准备就绪终端已上线并接受请求
停止终端正在关闭
停止终端已暂停(不计费)
失败部署失败(请参阅错误信息)

端点 URL

每个端点都有一个唯一的URL,例如:

https://predict-abc123.run.app

Ultralytics 卡端点URL(含复制按钮)

点击复制按钮复制网址。点击文档图标查看该端点的自动生成的API文档。

生命周期管理

控制您的端点状态:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
操作描述
启动恢复已停止的端点
停止暂停端点(停止计费)
删除永久移除端点

停止端点

停止端点以暂停计费:

  1. 点击部署卡上的暂停图标
  2. 端点状态变更为"停止中",随后变更为"已停止"

已停止的端点:

  • 不接受请求
  • 不产生费用
  • 可随时重启

删除端点

永久删除端点:

  1. 点击部署卡上的删除(垃圾桶)图标
  2. 在对话框中确认删除

永久操作

删除是即时且永久的。您随时可以创建新的端点。

使用端点

身份验证

每次部署都需使用您账户中的API密钥创建。请在请求中包含该密钥:

Authorization: Bearer YOUR_API_KEY

API密钥前缀显示在部署卡页脚用于标识。请通过API密钥页面生成密钥。

无速率限制

专用端点不受平台API速率限制的约束。请求将直接发送至您的专用服务,因此吞吐量仅受CPU、内存及扩展配置的限制。相较于共享推理服务(每个API密钥每分钟限20次请求),这是其关键优势所在。

请求示例

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

请求参数

参数类型默认值描述
file文件-图像文件(必填)
conf浮点数0.25最小置信度阈值
iou浮点数0.7NMS IoU 阈值
imgsz整型640输入图像尺寸
normalize字符串-返回归一化坐标

响应格式

共享推理 相同,但包含任务特定字段。

定价

专用端点计费依据:

组件费率
CPU按 vCPU 秒计费
内存按 GB 秒计费
请求按百万请求计费

成本优化

  • 开发端点使用按需扩缩容(scale-to-zero)
  • 设置适当的最大实例数
  • 监控 面板中监控使用情况
  • “设置”>“账单”中查看费用

常见问题

我可以创建多少个端点?

端点限制取决于计划:

  • 免费:最多 3 次部署
  • 专业版:最多支持10次部署
  • 企业版:无限部署

每个模型仍可在您的计划配额范围内部署到多个区域。

部署后可以更改区域吗?

不,区域是固定的。要更改区域:

  1. 删除现有端点
  2. 在所需区域创建新端点

如何处理多区域部署?

如需全球覆盖:

  1. 部署到多个区域
  2. 使用负载均衡器或 DNS 路由
  3. 将用户路由到最近的端点

冷启动时间是多少?

冷启动时间取决于模型大小以及容器是否已在区域中缓存。典型范围:

场景冷启动
缓存容器约5-15秒
首次部署/区域约15-45秒

健康检查采用55秒超时设置,以应对最坏情况下的冷启动场景。

我可以使用自定义域名吗?

自定义域名即将推出。目前,端点使用平台生成的 URL。



📅 创建于 1 个月前 ✏️ 更新于 5 天前
glenn-jochersergiuwaxmann

评论