Ir para o conteúdo

Monitoramento

Ultralytics Platform fornece monitoramento para endpoints implantados. Acompanhe as métricas de solicitação, visualize logs e verifique o status de saúde com sondagem automática.

Plataforma Ultralytics Página de Implantação Cartões de Visão Geral e Mapa Mundial

Painel de Implantações

O Deploy página na barra lateral serve como painel de monitoramento para todas as suas implantações. Ela combina o mapa-múndi, métricas de visão geral e gerenciamento de implantações em uma única visualização. Veja Endpoints Dedicados para criar e gerenciar implementações.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Cartões de Visão Geral

Quatro cartões de resumo no topo da página mostram:

Plataforma Ultralytics Página de Implantação Quatro Cartões de Visão Geral

MétricaDescrição
Total de Requisições (24h)Requisições em todos os endpoints
Implantações AtivasEndpoints atualmente em execução
Taxa de Erro (24h)Porcentagem de requisições com falha
Latência P95 (24h)Tempo de resposta no percentil 95

Alerta de Taxa de Erro

O cartão de taxa de erro destaca em vermelho quando a taxa excede 5%. Verifique o Logs guia em implantações individuais para diagnosticar erros.

Mapa Mundi

O mapa-múndi interativo mostra:

  • Pinos de região para todas as 43 regiões disponíveis
  • Pinos verdes para regiões implantadas
  • Pinos azuis animados para regiões com implantações ativas em andamento
  • Tamanho do pino varia com base no status de implantação e latência

Plataforma Ultralytics Página de Implantação Mapa Mundial com Regiões Implantadas

Lista de Implantações

Abaixo dos cartões de visão geral, a lista de implantações mostra todos os endpoints em seus projetos. Use o alternador de modo de visualização para alternar entre:

VisualizarDescrição
CartõesCartões de detalhes completos com métricas, logs, código e abas de previsão
CompactoGrade de cartões menores (1-4 colunas) com métricas chave
TabelaTabela de Dados com colunas classificáveis: Nome, Região, Status, Requisições, P95, Erros

Atualizações em Tempo Real

O painel consulta a cada 30 segundos para atualizações de métricas. Quando as implantações estão em estado de transição (criando, implantando), a frequência de consulta aumenta para a cada 3 segundos. Clique no botão de atualização para obter atualizações imediatas.

Métricas por Implantação

Cada cartão de implantação (na visualização de cartões) exibe métricas em tempo real:

Linha de Métricas

MétricaDescrição
RequisiçõesContagem de requisições (24h) com ícone
Latência P95Tempo de resposta no percentil 95
Taxa de ErrosPorcentagem de requisições com falha

As métricas são obtidas do endpoint da API sparkline e atualizam a cada 60 segundos.

Verificação de Saúde

Implantações em execução mostram um indicador de verificação de integridade:

IndicadorSignificado
Coração verdeSaudável — mostra a latência de resposta
Coração vermelhoNão saudável — mostra mensagem de erro
Ícone giratórioVerificação de integridade em andamento

As verificações de integridade são automaticamente repetidas a cada 20 segundos quando o sistema está em estado não saudável. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio em endpoints com escala para zero.

Ultralytics Platform: Cartão de Implantação - Verificação de Saúde Saudável com Latência

Tolerância à Inicialização a Frio

A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio em endpoints de escala para zero (até ~45 segundos no pior cenário). Uma vez que o endpoint é inicializado, as verificações de integridade são concluídas em milissegundos.

Logs

Cada cartão de implantação inclui um Logs guia para visualização de entradas de log recentes:

Ultralytics Platform: Cartão de Implantação - Aba de Logs com Filtro de Severidade

Entradas de Log

Cada entrada de log exibe:

CampoDescrição
SeveridadeBarra codificada por cores (ver abaixo)
TimestampTempo da requisição (formato local)
MensagemConteúdo do log
Informações HTTPCódigo de status e latência (se aplicável)

Filtrar logs por severidade usando os botões de filtro:

NívelCorDescrição
DEBUGCinzaMensagens de depuração
INFOAzulRequisições normais
WARNINGAmareloProblemas não críticos
ERRORVermelhoRequisições falhas
CRÍTICOVermelho EscuroFalhas críticas
ControleDescrição
ErrosFiltrar para entradas de ERRO e AVISO
Todos osMostrar todas as entradas de registo
CopiarCopiar todos os logs visíveis para a área de transferência
AtualizarRecarregar entradas de log

A UI mostra as 20 entradas mais recentes. A API assume 50 entradas por pedido (máximo 200).

Fluxo de Trabalho de Depuração

Ao investigar erros: primeiro clique em Errors para filtrar as entradas de ERRO e AVISO, depois revise os carimbos de data/hora e os códigos de status HTTP. Copie os logs para a área de transferência para compartilhar com sua equipe.

Exemplos de Código

Cada cartão de implantação inclui um Code o separador que mostra código de API pronto a usar com o seu URL de endpoint real e chave de API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Credenciais Preenchidas Automaticamente

Ao visualizar o Code guia na plataforma, sua URL de endpoint e chave de API reais são preenchidas automaticamente. Copie o código e execute-o diretamente. Veja Chaves de API para gerar uma chave.

Previsão de Implantação

O Predict guia em cada cartão de implantação fornece um painel de previsão embutido — a mesma interface do modelo Predict separador, mas a executar inferência através do endpoint de implementação em vez do serviço partilhado. Isto é útil para testar um endpoint implementado diretamente a partir do navegador. Ver Inferência para detalhes de parâmetros e formatos de resposta.

Endpoints da API

Visão Geral do Monitoramento

GET /api/monitoring

Retorna métricas agregadas para todas as implantações de propriedade do usuário autenticado. Compatível com workspace via opcional owner parâmetro de consulta.

Métricas de Implantação

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Retorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.

ParâmetroTipoDescrição
sparklinebooleanoIncluir dados de sparkline
rangestringIntervalo de tempo: 1h, 6h, 24h, 7d, ou 30d

Registros de Implantação

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Retorna entradas de log recentes com filtro de severidade opcional e paginação.

ParâmetroTipoDescrição
limitintMáximo de entradas a retornar (padrão: 50, máximo: 200)
severitystringFiltro de severidade separado por vírgulas
pageTokenstringToken de paginação da resposta anterior

Saúde da Implantação

GET /api/deployments/{deploymentId}/health

Retorna o status da verificação de saúde com a latência de resposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Otimização de Desempenho

Utilize dados de monitoramento para otimizar suas implantações:

Se a latência estiver muito alta:

  1. Verifique a contagem de instâncias (pode ser necessário mais)
  2. Verifique se o tamanho do modelo é apropriado
  3. Considere uma região mais próxima
  4. Verifique os tamanhos das imagens sendo enviadas

Redução da Latência

Mudar de imgsz=1280 para imgsz=640 para um aumento de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implante em uma região mais próxima dos seus usuários para menor latência de rede.

Se estiverem ocorrendo erros:

  1. Revise os logs de erro em Logs guia
  2. Verifique o formato da requisição (formulário multipart é necessário)
  3. Verifique se a chave da API é válida
  4. Verifique os limites de taxa

Se estiver atingindo a capacidade:

  1. Considere múltiplas regiões
  2. Otimize o agrupamento de requisições
  3. Aumentar os recursos de CPU e memória

FAQ

Por quanto tempo os dados são retidos?

Tipo de DadoRetenção
Métricas30 dias
Logs7 dias

Posso configurar monitoramento externo?

Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:

  • Monitoramento de disponibilidade (Pingdom, UptimeRobot)
  • Ferramentas APM (Datadog, New Relic)
  • Verificações de integridade personalizadas via o /health endpoint

Qual a precisão dos números de latência?

As métricas de latência medem:

  • P50: Tempo médio de resposta
  • P95: Percentil 95
  • P99: Percentil 99

Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.

Por que minhas métricas estão atrasadas?

As métricas têm um atraso de aproximadamente 2 minutos devido a:

  • Pipeline de agregação de métricas
  • Janelas de agregação
  • Cache do dashboard

Para depuração em tempo real, verifique os logs, que são quase instantâneos.

Posso monitorar múltiplos endpoints simultaneamente?

Sim, a página de implementações mostra todos os endpoints com cartões de visão geral agregados. Utilize a vista de tabela para comparar o desempenho entre as implementações.



📅 Criado há 2 meses ✏️ Atualizado há 24 dias
glenn-jochersergiuwaxmann

Comentários