跳转至内容

专用端点

Ultralytics Platform 支持将YOLO模型部署到全球43个区域的专用端点。每个端点都是一个单租户服务,具有自动扩缩、唯一端点URL和独立监控功能。

Ultralytics 平台模型部署选项卡(带区域地图和表格)

创建端点

从部署选项卡

从其部署模型 Deploy 选项卡:

  1. 导航到您的模型
  2. 点击部署选项卡
  3. 从区域表中选择区域(按您所在位置的延迟排序)
  4. 点击区域行上的 部署

部署名称是根据模型名称和区域城市自动生成的(例如, yolo11n-iowa)。

从部署页面

从全局创建部署 Deploy 侧边栏中的页面:

  1. 点击 新建部署
  2. 从模型选择器中选择一个模型
  3. 从地图或表格中选择区域
  4. 可选地自定义部署名称和资源
  5. 点击 部署模型

Ultralytics 平台新建部署对话框带模型选择器和区域地图

部署生命周期

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

区域选择

从全球 43 个区域中选择。交互式区域地图和表格显示:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • 已部署区域:以“已部署”徽章突出显示
  • 正在部署区域:动画脉冲指示器
  • 双向高亮:鼠标悬停在地图上会高亮表格行,反之亦然。

Ultralytics 平台部署选项卡区域延迟表(按延迟排序)

模型上的区域表 Deploy 选项卡包括:

描述
位置带有旗帜图标的城市和国家
区域区域标识符
延迟测量的ping时间 (3次ping的中间值)
距离距您位置的距离(公里)
操作部署按钮或“已部署”状态徽章

新部署对话框

字段 New Deployment 对话框(来自全局 Deploy 页面)显示了一个更简单的区域表,仅包含“位置”、“延迟”和“选择”列。

明智选择

选择离您的用户最近的区域以获得最低延迟。使用重新扫描按钮重新测量您当前位置的延迟。

可用区域

区域位置
us-central1爱荷华州,美国
us-east1南卡罗来纳州,美国
us-east4美国北弗吉尼亚
us-east5哥伦布,美国
us-south1达拉斯,美国
us-west1俄勒冈州,美国
us-west2洛杉矶,美国
us-west3盐湖城,美国
us-west4拉斯维加斯,美国
northamerica-northeast1蒙特利尔,加拿大
northamerica-northeast2多伦多,加拿大
northamerica-south1克雷塔罗,墨西哥
southamerica-east1巴西圣保罗
southamerica-west1圣地亚哥,智利
区域位置
europe-west1比利时圣吉斯兰
europe-west2伦敦,英国
europe-west3法兰克福,德国
europe-west4埃姆斯哈文,荷兰
europe-west6苏黎世,瑞士
europe-west8米兰,意大利
europe-west9巴黎,法国
europe-west10柏林,德国
europe-west12都灵,意大利
europe-north1哈米纳,芬兰
欧洲北部2瑞典斯德哥尔摩
europe-central2华沙,波兰
europe-southwest1马德里,西班牙
区域位置
asia-east1彰化,台湾
asia-east2香港九龙
asia-northeast1东京,日本
asia-northeast2大阪,日本
asia-northeast3韩国首尔
asia-south1孟买,印度
asia-south2德里,印度
asia-southeast1裕廊西,新加坡
asia-southeast2雅加达,印度尼西亚
asia-southeast3泰国曼谷
australia-southeast1悉尼,澳大利亚
australia-southeast2墨尔本,澳大利亚
区域位置
africa-south1约翰内斯堡,南非
me-central1多哈,卡塔尔
me-central2达曼,沙特阿拉伯
me-west1特拉维夫,以色列

端点配置

新部署对话框

字段 New Deployment 对话框提供:

设置描述默认值
模型从已完成的模型中选择-
区域部署区域-
部署名称自动生成,可编辑-
CPU 核心CPU 分配 (1-8)1
内存 (GB)内存分配 (1-32 GB)2

Ultralytics 平台新建部署对话框资源面板已展开

资源设置可在可折叠的资源部分下获取。部署默认使用缩放到零(最小实例数 = 0,最大实例数 = 1)— 您只需为实际推理时间付费。

自动生成名称

部署名称是根据模型名称和区域城市自动生成的(例如, yolo11n-iowa)。如果您再次将同一模型部署到同一区域,则会添加一个数字后缀(例如, yolo11n-iowa-2)。

部署选项卡(快速部署)

从模型部署时 Deploy 选项卡中,端点使用默认资源(1 CPU,2 GB 内存)创建,并启用零扩容。部署名称是自动生成的。

管理端点

视图模式

部署列表支持三种视图模式:

模式描述
卡片包含日志、代码示例、预测面板的完整详细信息卡
紧凑带关键指标的小型卡片网格
表格带可排序列和搜索功能的DataTable

Ultralytics 平台 部署标签页活动部署卡片视图

部署卡片(卡片视图)

卡片视图中的每个部署卡片显示:

  • 标题:名称、区域标志、状态徽章、启动/停止/删除按钮
  • 端点URL:可复制的URL,附带API文档链接
  • 指标:请求计数(24小时)、P95延迟、错误率
  • 健康检查:实时健康指示器,包含延迟和手动刷新功能
  • 选项卡: Logs, CodePredict

字段 Logs 选项卡显示最近的日志条目,并支持按严重性过滤(所有 / 错误)。该 Code 选项卡显示 Python、JavaScript 和 cURL 的即用型代码示例,其中包含您的实际端点 URL 和 API 密钥。该 Predict 选项卡提供一个内联预测面板,用于直接在部署上进行测试。

部署状态

状态描述
创建中正在设置部署
正在部署容器正在启动
准备就绪端点已上线并接受请求
正在停止端点正在关闭
已停止端点已暂停(不计费)
失败部署失败(查看错误消息)

端点 URL

每个端点都有一个唯一的 URL,例如:

https://predict-abc123.run.app

Ultralytics 平台部署卡片端点 URL(带复制按钮)

点击复制按钮以复制URL。点击文档图标以查看该端点的自动生成API文档。

生命周期管理

控制您的端点状态:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
操作描述
启动恢复已停止的端点
停止暂停端点(停止计费)
删除永久移除端点

停止端点

停止端点以暂停计费:

  1. 点击部署卡片上的暂停图标。
  2. 端点状态变为“正在停止”然后“已停止”

已停止的端点:

  • 不接受请求
  • 不产生费用
  • 可随时重启

删除端点

永久删除端点:

  1. 点击部署卡片上的删除(垃圾桶)图标
  2. 在对话框中确认删除

永久操作

删除是即时且永久的。您随时可以创建新的端点。

使用端点

身份验证

每个部署都使用您账户中的 API 密钥创建。请在请求中包含它:

Authorization: Bearer YOUR_API_KEY

API 密钥前缀显示在部署卡片底部,用于识别。从 API 密钥 生成密钥。

无速率限制

专用端点不受平台API速率限制。请求直接发送到您的专用服务,因此吞吐量仅受限于端点的CPU、内存和扩展配置。这是相对于共享推理的一个关键优势,共享推理每个API密钥的速率限制为每分钟20个请求。

请求示例

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

请求参数

参数类型默认值描述
file文件-图像文件 (必需)
conf浮点数0.25最小置信度阈值
iou浮点数0.7NMS IoU 阈值
imgsz整型640输入图像尺寸
normalize字符串-返回归一化坐标

响应格式

共享推理 相同,但包含任务特定字段。

定价

专用端点计费依据:

组件费率
CPU按 vCPU 秒计费
内存按 GB 秒计费
请求按百万请求计费

成本优化

  • 开发端点使用按需扩缩容(scale-to-zero)
  • 设置适当的最大实例数
  • 监控 面板中监控使用情况
  • 设置 > 账单中查看费用

常见问题

我可以创建多少个端点?

端点限制取决于套餐:

  • 免费:最多 3 次部署
  • 专业版:最多 10 次部署
  • 企业版:无限部署

每个模型仍然可以在您的计划配额内部署到多个区域。

部署后可以更改区域吗?

不,区域是固定的。要更改区域:

  1. 删除现有端点
  2. 在所需区域创建新端点

如何处理多区域部署?

如需全球覆盖:

  1. 部署到多个区域
  2. 使用负载均衡器或 DNS 路由
  3. 将用户路由到最近的端点

冷启动时间是多少?

冷启动时间取决于模型大小以及容器是否已在该区域缓存。典型范围:

场景冷启动
缓存容器约5-15秒
首次部署/区域约15-45秒

健康检查使用 55 秒超时,以适应最坏情况下的冷启动。

我可以使用自定义域名吗?

自定义域名即将推出。目前,端点使用平台生成的 URL。



📅 创建于 2 个月前 ✏️ 更新于 25 天前
glenn-jochersergiuwaxmann

评论