Monitorização

A Ultralytics Platform disponibiliza monitorização para endpoints implementados. Segue as métricas de pedidos, visualiza registos e verifica o estado de integridade com sondagem automática.

Cartões de visão geral e mapa mundial da página de implementação da Ultralytics Platform

Painel de Implementações

A página Deploy na barra lateral serve como painel de monitorização para todas as tuas implementações. Combina o mapa mundial, métricas de visão geral e gestão de implementações numa única vista. Consulta Dedicated Endpoints para criar e gerir implementações.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Cartões de Visão Geral

Quatro cartões de resumo na parte superior da página mostram:

Quatro cartões de visão geral da página de implementação da Ultralytics Platform

MétricaDescrição
Total de Pedidos (24h)Pedidos em todos os endpoints
Implementações AtivasEndpoints em execução atualmente
Taxa de Erro (24h)Percentagem de pedidos falhados
Latência P95 (24h)95º percentil do tempo de resposta
Alerta de Taxa de Erro

O cartão de taxa de erro destaca-se a vermelho quando a taxa excede 5%. Verifica o separador Logs em implementações individuais para diagnosticar erros.

Mapa Mundial

O mapa mundial interativo mostra:

  • Pin de região para todas as 43 regiões disponíveis
  • Pin verde para regiões implementadas
  • Pin azul animado para regiões com implementações ativas em curso
  • Tamanho do pin varia com base no estado da implementação e latência

Mapa mundial da página de implementação da Ultralytics Platform com regiões implementadas

Lista de Implementações

Abaixo dos cartões de visão geral, a lista de implementações mostra todos os endpoints nos teus projetos. Usa o seletor de modo de visualização para alternar entre:

VisualizarDescrição
CartõesCartões de detalhes completos com separadores de métricas, registos, código e previsão
CompactoGrelha de cartões mais pequenos (1-4 colunas) com métricas principais
TabelaTabela de dados com colunas ordenáveis: Nome, Região, Estado, Pedidos, P95, Erros
Atualizações em Tempo Real

O painel consulta a cada 15 segundos as atualizações de estado da implementação. Quando as implementações estão num estado de transição (creating, deploying ou stopping), a sondagem aumenta para cada 3 segundos. Os gráficos de métricas são atualizados a cada 60 segundos. Clica no botão de atualizar para obter atualizações imediatas.

Métricas por Implementação

Cada cartão de implementação (na vista de cartões) mostra métricas em tempo real:

Linha de Métricas

MétricaDescrição
PedidosContagem de pedidos (24h) com ícone
Latência P9595º percentil do tempo de resposta
Taxa de ErroPercentagem de pedidos falhados

As métricas são obtidas a partir do endpoint da API sparkline e atualizadas a cada 60 segundos.

Verificação de Saúde (Health Check)

As implementações em execução mostram um indicador de verificação de integridade:

IndicadorSignificado
Coração verdeSaudável — mostra a latência de resposta
Coração vermelhoNão saudável — mostra a mensagem de erro
Ícone giratórioVerificação de integridade em curso

As verificações de integridade tentam automaticamente novamente a cada 20 segundos quando não saudáveis. Clica no ícone de atualizar para acionar manualmente uma verificação de integridade. A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar arranques a frio em endpoints com escala para zero.

Cartão de implementação da Ultralytics Platform com verificação de integridade saudável e latência

Tolerância a Arranque a Frio

A verificação de integridade utiliza um tempo limite de 55 segundos para ter em conta os arranques a frio em endpoints com escala para zero (até ~45 segundos no pior caso). Assim que o endpoint aquece, as verificações de integridade concluem em milissegundos.

Registos

Cada cartão de implementação inclui um separador Logs para visualizar entradas de registo recentes:

Cartão de implementação da Ultralytics Platform com separador de registos e filtro de severidade

Entradas de Registo

Cada entrada de registo mostra:

CampoDescrição
SeveridadeBarra codificada por cores (ver abaixo)
TimestampHora do pedido (formato local)
MensagemConteúdo do registo
Informação HTTPCódigo de estado e latência (se aplicável)

Filtra os registos por severidade usando os botões de filtro:

NívelCorDescrição
DEBUGCinzentoMensagens de depuração
INFOAzulPedidos normais
WARNINGAmareloProblemas não críticos
ERRORVermelhoPedidos falhados
CRITICALVermelho EscuroFalhas críticas

A IU mostra as 20 entradas mais recentes. A API tem como predefinição 50 entradas por pedido (máximo 200).

Fluxo de Trabalho de Depuração

Ao investigar erros: primeiro clica em Errors para filtrar para entradas ERROR e WARNING, depois revê os timestamps e códigos de estado HTTP. Copia os registos para a área de transferência para partilhar com a tua equipa.

Exemplos de Código

Cada cartão de implementação inclui um separador Code que mostra código de API pronto a usar com o teu URL de endpoint real e chave de API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Credenciais Auto-Preenchidas

Ao visualizar a guia Code na plataforma, a URL do seu endpoint e a sua chave de API são preenchidas automaticamente. Copie o código e execute-o diretamente. Consulte API Keys para gerar uma chave.

Predict de Deployment

A guia Predict em cada cartão de implantação oferece um painel de predição integrado — a mesma interface que a guia Predict do modelo, mas executando a inferência através do endpoint de implantação em vez do serviço compartilhado. Isso é útil para testar um endpoint implantado diretamente do navegador. Consulte Inference para detalhes sobre parâmetros e formatos de resposta.

Endpoints de API

Visão geral do monitoramento

GET /api/monitoring

Retorna métricas agregadas para todas as implantações pertencentes ao usuário autenticado. Ciente do espaço de trabalho através do parâmetro de consulta opcional owner.

Métricas de implantação

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Retorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.

ParâmetroTipoDescrição
sparklineboolIncluir dados de sparkline
rangestringIntervalo de tempo: 1h, 6h, 24h, 7d ou 30d

Logs de implantação

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Retorna entradas de log recentes com filtro de severidade e paginação opcionais.

ParâmetroTipoDescrição
limitintNúmero máximo de entradas a retornar (padrão: 50, máximo: 200)
severitystringFiltro de severidade separado por vírgulas
pageTokenstringToken de paginação da resposta anterior

Status de integridade da implantação

GET /api/deployments/{deploymentId}/health

Retorna o status de verificação de integridade com latência de resposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Otimização de Desempenho

Use os dados de monitoramento para otimizar suas implantações:

Se a latência estiver muito alta:

  1. Verifique a contagem de instâncias (pode precisar de mais)
  2. Verifique se o tamanho do modelo é apropriado
  3. Considere uma região mais próxima
  4. Verifique os tamanhos das imagens que estão sendo enviadas
Reduzindo a latência

Mude de imgsz=1280 para imgsz=640 para um ganho de velocidade de ~4x com perda mínima de precisão na maioria dos casos de uso. Implante em uma região mais próxima de seus usuários para obter menor latência de rede.

FAQ

Por quanto tempo os dados são retidos?

Tipo de DadosRetenção
Métricas30 dias
Logs7 dias

Posso configurar um monitoramento externo?

Sim, as URLs dos endpoints funcionam com ferramentas de monitoramento externas:

  • Monitoramento de tempo de atividade (Pingdom, UptimeRobot)
  • Ferramentas de APM (Datadog, New Relic)
  • Verificações de integridade personalizadas através do endpoint /health

Quão precisos são os números de latência?

As métricas de latência medem:

  • P50: Tempo médio de resposta
  • P95: 95º percentil
  • P99: 99º percentil

Estes representam o tempo de processamento no lado do servidor, não incluindo a latência de rede para os seus usuários.

Por que minhas métricas estão atrasadas?

As métricas têm um atraso de ~2 minutos devido a:

  • Pipeline de agregação de métricas
  • Janelas de agregação
  • Cache do painel

Para depuração em tempo real, verifique os logs, que são quase instantâneos.

Posso monitorar múltiplos endpoints juntos?

Sim, a página de implantações mostra todos os endpoints com cartões de visão geral agregados. Use a visualização em tabela para comparar o desempenho entre as implantações.

Comentários