Ir para o conteúdo

Monitoramento

Ultralytics fornece monitorização para terminais implementados. Acompanhe métricas de pedidos, visualize registos e verifique o estado de saúde com sondagem automática.

Visão geral da página de implementação Ultralytics Cartões e mapa-múndi

Painel de implantações

O Deploy A página na barra lateral funciona como o painel de monitorização de todas as suas implementações. Ela combina o mapa-múndi, métricas gerais e gestão de implementações numa única visualização. Veja Endpoints Dedicados para criar e gerir implementações.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Cartões de Visão Geral

Quatro cartões resumidos na parte superior da página mostram:

Página de implementação Ultralytics Quatro cartões de visão geral

MétricaDescrição
Total de pedidos (24h)Pedidos em todos os pontos finais
Implantações AtivasEndpoints atualmente em execução
Taxa de erro (24h)Porcentagem de requisições com falha
Latência P95 (24h)Tempo de resposta no percentil 95

Alerta de taxa de erro

O cartão de taxa de erro destaca em vermelho quando a taxa excede 5%. Verifique o Logs guia em implementações individuais para diagnosticar erros.

Mapa-múndi

O mapa-múndi interativo mostra:

  • Pins regionais para todas as 43 regiões disponíveis
  • Pinos verdes para regiões implementadas
  • Pinos azuis animados para regiões com implementações ativas em andamento
  • O tamanho do pin varia de acordo com o estado da implantação e a latência

Página de implementação Ultralytics Mapa-múndi com regiões implementadas

Lista de implementações

Abaixo dos cartões de visão geral, a lista de implementações mostra todos os pontos finais dos seus projetos. Use o botão de alternância do modo de visualização para alternar entre:

VisualizarDescrição
CartõesCartões detalhados com métricas, registos, código e guias de previsão
CompactoGrelha de cartões mais pequenos (1-4 colunas) com métricas-chave
TabelaTabela de dados com colunas classificáveis: Nome, Região, Estado, Solicitações, P95, Erros

Atualizações em Tempo Real

O painel realiza pesquisas a cada 30 segundos para obter atualizações métricas. Quando as implementações estão em um estado de transição (criação, implementação), as pesquisas aumentam para a cada 3 segundos. Clique no botão Atualizar para obter atualizações imediatas.

Métricas por implementação

Cada cartão de implementação (na visualização de cartões) mostra métricas em tempo real:

Linha de métricas

MétricaDescrição
RequisiçõesContagem de pedidos (24h) com ícone
Latência P95Tempo de resposta no percentil 95
Taxa de ErrosPorcentagem de requisições com falha

As métricas são obtidas a partir do ponto final da API sparkline e atualizadas a cada 60 segundos.

Verificação de Saúde

As implementações em execução mostram um indicador de verificação de integridade:

IndicadorSignificado
Coração verdeSaudável — mostra latência de resposta
Coração vermelhoNão saudável — mostra mensagem de erro
Ícone giratórioVerificação de saúde em andamento

As verificações de integridade são repetidas automaticamente a cada 20 segundos quando não estão em boas condições. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade usa um tempo limite de 55 segundos para acomodar inicializações a frio em pontos finais com escala para zero.

Verificação do estado do cartão de implementação Ultralytics Saudável com latência

Tolerância ao arranque a frio

A verificação de integridade usa um tempo limite de 55 segundos para contabilizar inicializações a frio em pontos finais escalonados para zero (até ~45 segundos no pior caso). Depois que o ponto final é aquecido, as verificações de integridade são concluídas em milissegundos.

Logs

Cada cartão de implantação inclui um Logs guia para visualizar entradas recentes do registo:

Guia Registos do Cartão de Implementação Ultralytics com Filtro de Gravidade

Entradas de Log

Cada entrada de log exibe:

CampoDescrição
SeveridadeBarra codificada por cores (ver abaixo)
TimestampHora da solicitação (formato local)
MensagemConteúdo do log
Informações HTTPCódigo de estado e latência (se aplicável)

Filtre os registos por gravidade utilizando os botões de filtro:

NívelCorDescrição
DEBUGCinzaMensagens de depuração
INFOAzulRequisições normais
WARNINGAmareloProblemas não críticos
ERRORVermelhoRequisições falhas
CRÍTICOVermelho escuroFalhas críticas
ControloDescrição
ErrosFiltrar para entradas ERROR e WARNING
Todos osMostrar todas as entradas do registo
CopiarCopiar todos os registos visíveis para a área de transferência
AtualizarRecarregar entradas do registo

A interface do utilizador mostra as 20 entradas mais recentes. A API tem como padrão 50 entradas por pedido (máximo de 200).

Fluxo de trabalho de depuração

Ao investigar erros: primeiro clique em Erros para filtrar as entradas ERROR e WARNING, depois analise os carimbos de data/hora e os códigos de estado HTTP. Copie os registos para a área de transferência para partilhar com a sua equipa.

Exemplos de Código

Cada cartão de implantação inclui um Code aba mostrando o código API pronto para uso com o URL do seu endpoint real e a chave API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Credenciais preenchidas automaticamente

Ao visualizar o Code na plataforma, o URL do seu endpoint real e a chave API são preenchidos automaticamente. Copie o código e execute-o diretamente. Veja Chaves de API para gerar uma chave.

Previsão de implementação

O Predict A guia em cada cartão de implementação fornece um painel de previsão embutido — a mesma interface do modelo. Predict , mas executando a inferência através do ponto de extremidade de implementação em vez do serviço partilhado. Isto é útil para testar um ponto de extremidade implementado diretamente a partir do navegador. Consulte Inferência para obter detalhes sobre os parâmetros e formatos de resposta.

Pontos finais da API

Visão geral da monitorização

GET /api/monitoring

Retorna métricas agregadas para todas as implementações pertencentes ao utilizador autenticado. Compatível com o espaço de trabalho através de opcional owner parâmetro de consulta.

Métricas de implementação

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Retorna dados de sparkline e métricas resumidas para uma implementação específica. Intervalo de atualização: 60 segundos.

ParâmetroTipoDescrição
sparklinebooleanoIncluir dados de sparkline
rangestringIntervalo de tempo: 1h, 6h, 24h, 7d, ou 30d

Registos de implementação

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Retorna entradas recentes do registo com filtro de gravidade opcional e paginação.

ParâmetroTipoDescrição
limitintMáximo de entradas a retornar (padrão: 50, máximo: 200)
severitystringFiltro de gravidade separado por vírgulas
pageTokenstringToken de paginação da resposta anterior

Saúde da implantação

GET /api/deployments/{deploymentId}/health

Retorna o estado da verificação de integridade com a latência da resposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Otimização de Desempenho

Use dados de monitoramento para otimizar suas implementações:

Se a latência estiver muito alta:

  1. Verifique a contagem de instâncias (pode ser necessário mais)
  2. Verifique se o tamanho do modelo é apropriado
  3. Considere uma região mais próxima
  4. Verifique os tamanhos das imagens sendo enviadas

Reduzindo a latência

Mudar de imgsz=1280 para imgsz=640 para um aumento de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implemente numa região mais próxima dos seus utilizadores para obter menor latência de rede.

Se estiverem ocorrendo erros:

  1. Revise os registos de erros no Logs aba
  2. Verifique o formato do pedido (é necessário um formulário multiparte)
  3. Verifique se a chave da API é válida
  4. Verifique os limites de taxa

Se estiver atingindo a capacidade:

  1. Considere múltiplas regiões
  2. Otimize o agrupamento de requisições
  3. Aumente os recursos CPU da memória

FAQ

Por quanto tempo os dados são retidos?

Tipo de DadoRetenção
Métricas30 dias
Logs7 dias

Posso configurar monitoramento externo?

Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:

  • Monitoramento de disponibilidade (Pingdom, UptimeRobot)
  • Ferramentas APM (Datadog, New Relic)
  • Verificações de saúde personalizadas através do /health ponto final

Qual a precisão dos números de latência?

As métricas de latência medem:

  • P50: Tempo médio de resposta
  • P95: Percentil 95
  • P99: Percentil 99

Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.

Por que minhas métricas estão atrasadas?

As métricas têm um atraso de aproximadamente 2 minutos devido a:

  • Pipeline de agregação de métricas
  • Janelas de agregação
  • Cache do dashboard

Para depuração em tempo real, verifique os logs, que são quase instantâneos.

Posso monitorar múltiplos endpoints simultaneamente?

Sim, a página de implementações mostra todos os pontos finais com cartões de visão geral agregados. Use a visualização da tabela para comparar o desempenho entre as implementações.



📅 Criado há 1 mês ✏️ Atualizado há 4 dias
glenn-jochersergiuwaxmann

Comentários