Meet YOLO26: next-gen vision AI.

Link to this section监控#

Ultralytics Platform 为已部署的端点提供监控功能。通过自动轮询跟踪请求指标、查看日志并检查运行状况。

Ultralytics Platform 部署页面概览卡片与世界地图

Link to this section部署仪表板#

侧边栏中的 Deploy 页面是所有部署的监控仪表板。它将世界地图、概览指标和部署管理整合在一个视图中。请参阅 专用端点 以了解如何创建和管理部署。

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this section概览卡片#

页面顶部的四个摘要卡片显示:

Ultralytics Platform 部署页面四个概览卡片

指标描述
总请求数 (24小时)所有端点的总请求量
活跃部署当前正在运行的端点
错误率 (24小时)失败请求的百分比
P95 延迟 (24小时)第 95 百分位响应时间
错误率警报

当错误率超过 5% 时,错误率卡片会以红色高亮显示。请查看各个部署的 Logs 选项卡以诊断错误。

Link to this section世界地图#

交互式世界地图显示:

  • 所有 43 个可用区域的区域图钉
  • 已部署区域的绿色图钉
  • 正在进行部署的区域的动画蓝色图钉
  • 图钉大小根据部署状态和延迟而变化

Ultralytics Platform 部署页面带有已部署区域的世界地图

Link to this section部署列表#

在概览卡片下方,部署列表显示了你所有项目中的端点。使用视图模式切换开关在以下模式间切换:

查看描述
卡片包含指标、日志、代码和预测选项卡的详细信息卡片
紧凑包含关键指标的较小卡片网格(1-4 列)
表格带有可排序数据列的表格:名称、区域、状态、请求数、P95、错误数
实时更新

仪表板每 15 秒轮询一次部署状态更新。当部署处于过渡状态(creatingdeployingstopping)时,轮询频率增加到每 3 秒一次。指标图表每 60 秒刷新一次。点击刷新按钮可立即更新。

Link to this section单次部署指标#

每个部署卡片(在卡片视图中)显示实时指标:

Link to this section指标行#

指标描述
请求数带图标的请求计数 (24小时)
P95 延迟第 95 百分位响应时间
错误率失败请求的百分比

指标从 sparkline API 端点获取,每 60 秒刷新一次。

Link to this section健康检查#

正在运行的部署显示运行状况检查指示器:

指示器含义
绿色心形健康 — 显示响应延迟
红色心形不健康 — 显示错误消息
旋转图标运行状况检查正在进行中

当运行状况不佳时,运行状况检查每 20 秒自动重试一次。点击刷新图标手动触发运行状况检查。运行状况检查使用 55 秒超时以适应缩减至零 (scale-to-zero) 端点的冷启动。

Ultralytics Platform 部署卡片运行状况检查健康且带有延迟

冷启动容忍度

运行状况检查使用 55 秒超时以考虑到缩减至零 (scale-to-zero) 端点的冷启动(最坏情况下约为 45 秒)。一旦端点预热,运行状况检查可在几毫秒内完成。

Link to this section日志#

每个部署卡片都包含一个用于查看最新日志条目的 Logs 选项卡:

Ultralytics Platform 部署卡片带严重性过滤器的日志选项卡

Link to this section日志条目#

每个日志条目显示:

字段描述
严重性颜色编码条(见下文)
时间戳请求时间(本地格式)
消息日志内容
HTTP 信息状态代码和延迟(如适用)

使用过滤按钮按严重性过滤日志:

级别颜色描述
DEBUG灰色调试消息
INFO蓝色常规请求
WARNING黄色非关键问题
ERROR红色失败的请求
CRITICAL深红色严重故障

UI 显示最近的 20 条记录。API 默认每个请求返回 50 条记录(最多 200 条)。

调试工作流

调查错误时:首先点击 Errors 以过滤出 ERROR 和 WARNING 条目,然后检查时间戳和 HTTP 状态代码。将日志复制到剪贴板以便与你的团队共享。

Link to this section代码示例#

每个部署卡片都包含一个 Code 选项卡,显示即用型 API 代码,其中包含你实际的端点 URL 和 API 密钥:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
自动填充凭据

在平台中查看 Code 选项卡时,你实际的端点 URL 和 API 密钥会自动填充。复制该代码并直接运行。请参阅 API 密钥 以生成密钥。

Link to this section部署预测#

每个部署卡片上的 Predict 选项卡都提供了一个内嵌预测面板——其界面与模型的 Predict 选项卡相同,但它通过部署端点而非共享服务来运行推理。这对于直接从浏览器测试已部署的端点非常有用。有关参数详情和响应格式,请参阅 Inference

Link to this sectionAPI 端点#

Link to this section监控概览#

GET /api/monitoring

返回经过身份验证的用户所拥有的所有部署的汇总指标。可通过可选的 owner 查询参数实现工作区感知。

Link to this section部署指标#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

返回特定部署的迷你图数据和汇总指标。刷新间隔:60秒。

参数类型描述
sparkline布尔值包含迷你图数据
rangestring时间范围:1h6h24h7d30d

Link to this section部署日志#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

返回带有可选严重性过滤器和分页功能的近期日志条目。

参数类型描述
limitint返回的最大条目数(默认:50,最大:200)
severitystring逗号分隔的严重性过滤器
pageTokenstring来自前一个响应的分页令牌

Link to this section部署运行状况#

GET /api/deployments/{deploymentId}/health

返回包含响应延迟的健康检查状态。

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this section性能优化#

使用监控数据来优化你的部署:

如果延迟过高:

  1. 检查实例数量(可能需要更多)
  2. 确认模型大小是否合适
  3. 考虑选择更近的区域
  4. 检查发送的图像尺寸
降低延迟

imgsz=1280 切换为 imgsz=640,对于大多数用例,可以在几乎不损失准确性的情况下获得约 4 倍的速度提升。部署到距离用户更近的区域以减少网络延迟。

Link to this section常见问题解答#

Link to this section数据保留多久?#

数据类型保留期限
Metrics(指标)30 天
日志7 天

Link to this section我可以设置外部监控吗?#

可以,端点 URL 可与外部监控工具配合使用:

  • 正常运行时间监控 (Pingdom, UptimeRobot)
  • APM 工具 (Datadog, New Relic)
  • 通过 /health 端点进行的自定义健康检查

Link to this section延迟数字有多准确?#

延迟指标测量的是:

  • P50:中位响应时间
  • P95:第 95 百分位
  • P99:第 99 百分位

这些代表服务器端的处理时间,不包括到用户的网络延迟。

Link to this section为什么我的指标有延迟?#

指标会有约 2 分钟的延迟,原因如下:

  • 指标聚合流水线
  • 聚合窗口
  • 仪表板缓存

如需实时调试,请查看几乎即时更新的日志。

Link to this section我可以同时监控多个端点吗?#

可以,部署页面显示所有带有汇总概览卡片的端点。使用表格视图比较各部署之间的性能。

评论