Link to this section监控#
Ultralytics Platform 为已部署的端点提供监控功能。通过自动轮询跟踪请求指标、查看日志并检查运行状况。

Link to this section部署仪表板#
侧边栏中的 Deploy 页面是所有部署的监控仪表板。它将世界地图、概览指标和部署管理整合在一个视图中。请参阅 专用端点 以了解如何创建和管理部署。
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this section概览卡片#
页面顶部的四个摘要卡片显示:

| 指标 | 描述 |
|---|---|
| 总请求数 (24小时) | 所有端点的总请求量 |
| 活跃部署 | 当前正在运行的端点 |
| 错误率 (24小时) | 失败请求的百分比 |
| P95 延迟 (24小时) | 第 95 百分位响应时间 |
当错误率超过 5% 时,错误率卡片会以红色高亮显示。请查看各个部署的 Logs 选项卡以诊断错误。
Link to this section世界地图#
交互式世界地图显示:
- 所有 43 个可用区域的区域图钉
- 已部署区域的绿色图钉
- 正在进行部署的区域的动画蓝色图钉
- 图钉大小根据部署状态和延迟而变化

Link to this section部署列表#
在概览卡片下方,部署列表显示了你所有项目中的端点。使用视图模式切换开关在以下模式间切换:
| 查看 | 描述 |
|---|---|
| 卡片 | 包含指标、日志、代码和预测选项卡的详细信息卡片 |
| 紧凑 | 包含关键指标的较小卡片网格(1-4 列) |
| 表格 | 带有可排序数据列的表格:名称、区域、状态、请求数、P95、错误数 |
仪表板每 15 秒轮询一次部署状态更新。当部署处于过渡状态(creating、deploying 或 stopping)时,轮询频率增加到每 3 秒一次。指标图表每 60 秒刷新一次。点击刷新按钮可立即更新。
Link to this section单次部署指标#
每个部署卡片(在卡片视图中)显示实时指标:
Link to this section指标行#
| 指标 | 描述 |
|---|---|
| 请求数 | 带图标的请求计数 (24小时) |
| P95 延迟 | 第 95 百分位响应时间 |
| 错误率 | 失败请求的百分比 |
指标从 sparkline API 端点获取,每 60 秒刷新一次。
Link to this section健康检查#
正在运行的部署显示运行状况检查指示器:
| 指示器 | 含义 |
|---|---|
| 绿色心形 | 健康 — 显示响应延迟 |
| 红色心形 | 不健康 — 显示错误消息 |
| 旋转图标 | 运行状况检查正在进行中 |
当运行状况不佳时,运行状况检查每 20 秒自动重试一次。点击刷新图标手动触发运行状况检查。运行状况检查使用 55 秒超时以适应缩减至零 (scale-to-zero) 端点的冷启动。

运行状况检查使用 55 秒超时以考虑到缩减至零 (scale-to-zero) 端点的冷启动(最坏情况下约为 45 秒)。一旦端点预热,运行状况检查可在几毫秒内完成。
Link to this section日志#
每个部署卡片都包含一个用于查看最新日志条目的 Logs 选项卡:

Link to this section日志条目#
每个日志条目显示:
| 字段 | 描述 |
|---|---|
| 严重性 | 颜色编码条(见下文) |
| 时间戳 | 请求时间(本地格式) |
| 消息 | 日志内容 |
| HTTP 信息 | 状态代码和延迟(如适用) |
使用过滤按钮按严重性过滤日志:
| 级别 | 颜色 | 描述 |
|---|---|---|
| DEBUG | 灰色 | 调试消息 |
| INFO | 蓝色 | 常规请求 |
| WARNING | 黄色 | 非关键问题 |
| ERROR | 红色 | 失败的请求 |
| CRITICAL | 深红色 | 严重故障 |
UI 显示最近的 20 条记录。API 默认每个请求返回 50 条记录(最多 200 条)。
调查错误时:首先点击 Errors 以过滤出 ERROR 和 WARNING 条目,然后检查时间戳和 HTTP 状态代码。将日志复制到剪贴板以便与你的团队共享。
Link to this section代码示例#
每个部署卡片都包含一个 Code 选项卡,显示即用型 API 代码,其中包含你实际的端点 URL 和 API 密钥:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())在平台中查看 Code 选项卡时,你实际的端点 URL 和 API 密钥会自动填充。复制该代码并直接运行。请参阅 API 密钥 以生成密钥。
Link to this section部署预测#
每个部署卡片上的 Predict 选项卡都提供了一个内嵌预测面板——其界面与模型的 Predict 选项卡相同,但它通过部署端点而非共享服务来运行推理。这对于直接从浏览器测试已部署的端点非常有用。有关参数详情和响应格式,请参阅 Inference。
Link to this sectionAPI 端点#
Link to this section监控概览#
GET /api/monitoring返回经过身份验证的用户所拥有的所有部署的汇总指标。可通过可选的 owner 查询参数实现工作区感知。
Link to this section部署指标#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h返回特定部署的迷你图数据和汇总指标。刷新间隔:60秒。
| 参数 | 类型 | 描述 |
|---|---|---|
sparkline | 布尔值 | 包含迷你图数据 |
range | string | 时间范围:1h、6h、24h、7d 或 30d |
Link to this section部署日志#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING返回带有可选严重性过滤器和分页功能的近期日志条目。
| 参数 | 类型 | 描述 |
|---|---|---|
limit | int | 返回的最大条目数(默认:50,最大:200) |
severity | string | 逗号分隔的严重性过滤器 |
pageToken | string | 来自前一个响应的分页令牌 |
Link to this section部署运行状况#
GET /api/deployments/{deploymentId}/health返回包含响应延迟的健康检查状态。
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this section性能优化#
使用监控数据来优化你的部署:
如果延迟过高:
- 检查实例数量(可能需要更多)
- 确认模型大小是否合适
- 考虑选择更近的区域
- 检查发送的图像尺寸
将 imgsz=1280 切换为 imgsz=640,对于大多数用例,可以在几乎不损失准确性的情况下获得约 4 倍的速度提升。部署到距离用户更近的区域以减少网络延迟。
Link to this section常见问题解答#
Link to this section数据保留多久?#
| 数据类型 | 保留期限 |
|---|---|
| Metrics(指标) | 30 天 |
| 日志 | 7 天 |
Link to this section我可以设置外部监控吗?#
可以,端点 URL 可与外部监控工具配合使用:
- 正常运行时间监控 (Pingdom, UptimeRobot)
- APM 工具 (Datadog, New Relic)
- 通过
/health端点进行的自定义健康检查
Link to this section延迟数字有多准确?#
延迟指标测量的是:
- P50:中位响应时间
- P95:第 95 百分位
- P99:第 99 百分位
这些代表服务器端的处理时间,不包括到用户的网络延迟。
Link to this section为什么我的指标有延迟?#
指标会有约 2 分钟的延迟,原因如下:
- 指标聚合流水线
- 聚合窗口
- 仪表板缓存
如需实时调试,请查看几乎即时更新的日志。
Link to this section我可以同时监控多个端点吗?#
可以,部署页面显示所有带有汇总概览卡片的端点。使用表格视图比较各部署之间的性能。