Monitoramento

Q: How accurate are the latency numbers?

Métricas de latência medem: Estas representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para seus usuários.

Q: Why are my metrics delayed?

As métricas apresentam um atraso de aproximadamente 2 minutos devido a: Para depuração em tempo real, consulte os logs, que são quase instantâneos.

Ultralytics Platform fornece monitoramento para endpoints implantados. Acompanhe as métricas de solicitação, visualize logs e verifique o status de saúde com sondagem automática.

Plataforma Ultralytics Página de Implantação Cartões de Visão Geral e Mapa Mundial

Painel de Implantações

O Deploy página na barra lateral serve como painel de monitoramento para todas as suas implantações. Ela combina o mapa-múndi, métricas de visão geral e gerenciamento de implantações em uma única visualização. Veja Endpoints Dedicados para criar e gerenciar implementações.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Cartões de Visão Geral

Quatro cartões de resumo no topo da página mostram:

Plataforma Ultralytics Página de Implantação Quatro Cartões de Visão Geral

Métrica	Descrição
Total de Requisições (24h)	Requisições em todos os endpoints
Implantações Ativas	Endpoints atualmente em execução
Taxa de Erro (24h)	Porcentagem de requisições com falha
Latência P95 (24h)	Tempo de resposta no percentil 95

Alerta de Taxa de Erro

O cartão de taxa de erro destaca em vermelho quando a taxa excede 5%. Verifique o Logs guia em implantações individuais para diagnosticar erros.

Mapa Mundi

O mapa-múndi interativo mostra:

Pinos de região para todas as 43 regiões disponíveis
Pinos verdes para regiões implantadas
Pinos azuis animados para regiões com implantações ativas em andamento
Tamanho do pino varia com base no status de implantação e latência

Plataforma Ultralytics Página de Implantação Mapa Mundial com Regiões Implantadas

Lista de Implantações

Abaixo dos cartões de visão geral, a lista de implantações mostra todos os endpoints em seus projetos. Use o alternador de modo de visualização para alternar entre:

Visualizar	Descrição
Cartões	Cartões de detalhes completos com métricas, logs, código e abas de previsão
Compacto	Grade de cartões menores (1-4 colunas) com métricas chave
Tabela	Tabela de Dados com colunas classificáveis: Nome, Região, Status, Requisições, P95, Erros

Atualizações em Tempo Real

O painel consulta a cada 30 segundos para atualizações de métricas. Quando as implantações estão em estado de transição (criando, implantando), a frequência de consulta aumenta para a cada 3 segundos. Clique no botão de atualização para obter atualizações imediatas.

Métricas por Implantação

Cada cartão de implantação (na visualização de cartões) exibe métricas em tempo real:

Linha de Métricas

Métrica	Descrição
Requisições	Contagem de requisições (24h) com ícone
Latência P95	Tempo de resposta no percentil 95
Taxa de Erros	Porcentagem de requisições com falha

As métricas são obtidas do endpoint da API sparkline e atualizam a cada 60 segundos.

Verificação de Saúde

Implantações em execução mostram um indicador de verificação de integridade:

Indicador	Significado
Coração verde	Saudável — mostra a latência de resposta
Coração vermelho	Não saudável — mostra mensagem de erro
Ícone giratório	Verificação de integridade em andamento

As verificações de integridade são automaticamente repetidas a cada 20 segundos quando o sistema está em estado não saudável. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio em endpoints com escala para zero.

Ultralytics Platform: Cartão de Implantação - Verificação de Saúde Saudável com Latência

Tolerância à Inicialização a Frio

A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio em endpoints de escala para zero (até ~45 segundos no pior cenário). Uma vez que o endpoint é inicializado, as verificações de integridade são concluídas em milissegundos.

Logs

Cada cartão de implantação inclui um Logs guia para visualização de entradas de log recentes:

Ultralytics Platform: Cartão de Implantação - Aba de Logs com Filtro de Severidade

Entradas de Log

Cada entrada de log exibe:

Campo	Descrição
Severidade	Barra codificada por cores (ver abaixo)
Timestamp	Tempo da requisição (formato local)
Mensagem	Conteúdo do log
Informações HTTP	Código de status e latência (se aplicável)

Níveis de SeveridadeControles de Log

Filtrar logs por severidade usando os botões de filtro:

Nível	Cor	Descrição
DEBUG	Cinza	Mensagens de depuração
INFO	Azul	Requisições normais
WARNING	Amarelo	Problemas não críticos
ERROR	Vermelho	Requisições falhas
CRÍTICO	Vermelho Escuro	Falhas críticas

Controle	Descrição
Erros	Filtrar para entradas de ERRO e AVISO
Todos os	Mostrar todas as entradas de registo
Copiar	Copiar todos os logs visíveis para a área de transferência
Atualizar	Recarregar entradas de log

A UI mostra as 20 entradas mais recentes. A API assume 50 entradas por pedido (máximo 200).

Fluxo de Trabalho de Depuração

Ao investigar erros: primeiro clique em Errors para filtrar as entradas de ERRO e AVISO, depois revise os carimbos de data/hora e os códigos de status HTTP. Copie os logs para a área de transferência para compartilhar com sua equipe.

Exemplos de Código

Cada cartão de implantação inclui um Code o separador que mostra código de API pronto a usar com o seu URL de endpoint real e chave de API:

PythonJavaScriptcURL

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);

# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Credenciais Preenchidas Automaticamente

Ao visualizar o Code guia na plataforma, sua URL de endpoint e chave de API reais são preenchidas automaticamente. Copie o código e execute-o diretamente. Veja Chaves de API para gerar uma chave.

Previsão de Implantação

O Predict guia em cada cartão de implantação fornece um painel de previsão embutido — a mesma interface do modelo Predict separador, mas a executar inferência através do endpoint de implementação em vez do serviço partilhado. Isto é útil para testar um endpoint implementado diretamente a partir do navegador. Ver Inferência para detalhes de parâmetros e formatos de resposta.

Endpoints da API

Visão Geral do Monitoramento

GET /api/monitoring

Retorna métricas agregadas para todas as implantações de propriedade do usuário autenticado. Compatível com workspace via opcional owner parâmetro de consulta.

Métricas de Implantação

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Retorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.

Parâmetro	Tipo	Descrição
`sparkline`	booleano	Incluir dados de sparkline
`range`	string	Intervalo de tempo: `1h`, `6h`, `24h`, `7d`, ou `30d`

Registros de Implantação

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Retorna entradas de log recentes com filtro de severidade opcional e paginação.

Parâmetro	Tipo	Descrição
`limit`	int	Máximo de entradas a retornar (padrão: 50, máximo: 200)
`severity`	string	Filtro de severidade separado por vírgulas
`pageToken`	string	Token de paginação da resposta anterior

Saúde da Implantação

GET /api/deployments/{deploymentId}/health

Retorna o status da verificação de saúde com a latência de resposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Otimização de Desempenho

Utilize dados de monitoramento para otimizar suas implantações:

Alta LatênciaAlta Taxa de ErrosProblemas de Escalabilidade

Se a latência estiver muito alta:

Verifique a contagem de instâncias (pode ser necessário mais)
Verifique se o tamanho do modelo é apropriado
Considere uma região mais próxima
Verifique os tamanhos das imagens sendo enviadas

Redução da Latência

Mudar de imgsz=1280 para imgsz=640 para um aumento de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implante em uma região mais próxima dos seus usuários para menor latência de rede.

Se estiverem ocorrendo erros:

Revise os logs de erro em Logs guia
Verifique o formato da requisição (formulário multipart é necessário)
Verifique se a chave da API é válida
Verifique os limites de taxa

Se estiver atingindo a capacidade:

Considere múltiplas regiões
Otimize o agrupamento de requisições
Aumentar os recursos de CPU e memória

FAQ

Por quanto tempo os dados são retidos?

Tipo de Dado	Retenção
Métricas	30 dias
Logs	7 dias

Posso configurar monitoramento externo?

Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:

Monitoramento de disponibilidade (Pingdom, UptimeRobot)
Ferramentas APM (Datadog, New Relic)
Verificações de integridade personalizadas via o /health endpoint

Qual a precisão dos números de latência?

As métricas de latência medem:

P50: Tempo médio de resposta
P95: Percentil 95
P99: Percentil 99

Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.

Por que minhas métricas estão atrasadas?

As métricas têm um atraso de aproximadamente 2 minutos devido a:

Pipeline de agregação de métricas
Janelas de agregação
Cache do dashboard

Para depuração em tempo real, verifique os logs, que são quase instantâneos.

Posso monitorar múltiplos endpoints simultaneamente?

Sim, a página de implementações mostra todos os endpoints com cartões de visão geral agregados. Utilize a vista de tabela para comparar o desempenho entre as implementações.

📅 Criado há 2 meses ✏️ Atualizado há 24 dias