Ir para o conteúdo

Monitoramento

Plataforma Ultralytics oferece monitoramento abrangente para endpoints implantados. track métricas de requisição, visualize logs e analise o desempenho em tempo real.

Painel de Monitoramento

Acesse o painel de monitoramento global na barra lateral:

  1. Clique em Monitoramento na barra lateral
  2. Visualize todas as implantações em um relance
  3. Clique nos endpoints individuais para ver os detalhes

Cartões de Visão Geral

MétricaDescrição
Total de RequisiçõesRequisições em todos os endpoints (24h)
Implantações AtivasEndpoints atualmente em execução
Taxa de ErrosPorcentagem de requisições com falha
Latência MédiaTempo médio de resposta

Tabela de Implantações

Visualize todas as implantações com as principais métricas:

ColunaDescrição
ModeloNome do modelo com link
RegiãoRegião de implantação com bandeira
StatusIndicador de Em Execução/Parado
RequisiçõesContagem de requisições (24h)
LatênciaTempo de resposta P50
ErrosContagem de erros (24h)
MinigráficoVisualização da tendência de tráfego

Atualizações em Tempo Real

O painel de controle atualiza a cada 30 segundos. Clique em atualizar para obter atualizações imediatas.

Métricas de Endpoint

Visualize métricas detalhadas para endpoints individuais:

  1. Navegue para a aba Deploy do seu modelo
  2. Clique em um endpoint
  3. Visualizar o painel de métricas

Métricas Disponíveis

MétricaDescriçãoUnidade
Contagem de RequisiçõesTotal de requisições ao longo do tempocontagem
Latência da RequisiçãoDistribuição do tempo de respostams
Taxa de ErrosPercentual de requisições falhas%
Contagem de InstânciasInstâncias de contêiner ativascontagem
Utilização da CPUUso do processador%
Uso de MemóriaConsumo de RAMMB

Intervalos de Tempo

Selecionar intervalo de tempo para as métricas:

IntervaloDescrição
1hÚltima hora
6hÚltimas 6 horas
24hÚltimas 24 horas (padrão)
7dÚltimos 7 dias

Gráficos de Métricas

Gráficos interativos mostram:

  • Gráficos de linha para tendências ao longo do tempo
  • Passe o mouse para valores exatos
  • Amplie para analisar períodos específicos

Logs

Visualizar logs de requisição para depuração:

Entradas de Log

Cada entrada de log exibe:

CampoDescrição
TimestampTempo da requisição
SeveridadeINFO, WARNING, ERROR
MensagemConteúdo do log
ID da requisiçãoIdentificador único

Níveis de Severidade

Filtrar logs por severidade:

NívelCorDescrição
INFOAzulRequisições normais
WARNINGAmareloProblemas não críticos
ERRORVermelhoRequisições falhas

Filtragem de Log

Filtrar logs para encontrar problemas:

  1. Selecionar nível de severidade
  2. Pesquisar por palavra-chave
  3. Filtrar por intervalo de tempo

Alertas

Configurar alertas para problemas de endpoint (em breve):

Tipo de AlertaGatilho
Alta Taxa de ErrosTaxa de erro > limite
Alta LatênciaLatência P95 > limite
Sem RequisiçõesZero requisições para o período
DimensionamentoInstâncias na capacidade máxima

Otimização de Desempenho

Utilize os dados de monitoramento para otimizar:

Alta Latência

Se a latência estiver muito alta:

  1. Verifique a contagem de instâncias (pode ser necessário mais)
  2. Verifique se o tamanho do modelo é apropriado
  3. Considere uma região mais próxima
  4. Verifique os tamanhos das imagens sendo enviadas

Alta Taxa de Erros

Se estiverem ocorrendo erros:

  1. Revise os logs de erro para detalhes
  2. Verifique o formato da requisição
  3. Verifique se a chave da API é válida
  4. Verifique os limites de taxa

Problemas de Escalabilidade

Se estiver atingindo a capacidade:

  1. Aumente o número máximo de instâncias
  2. Defina o número mínimo de instâncias > 0
  3. Considere múltiplas regiões
  4. Otimize o agrupamento de requisições

Exportar Dados

Exporte os dados de monitoramento para análise:

  1. Selecione o intervalo de tempo
  2. Clique em Exportar
  3. Baixar arquivo CSV

A exportação inclui:

  • Timestamp
  • Contagem de requisições
  • Métricas de latência
  • Contagem de erros
  • Métricas de instância

FAQ

Por quanto tempo os dados são retidos?

Tipo de DadoRetenção
Métricas30 dias
Logs7 dias
Alertas90 dias

Posso configurar monitoramento externo?

Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:

  • Monitoramento de disponibilidade (Pingdom, UptimeRobot)
  • Ferramentas APM (Datadog, New Relic)
  • Verificações de saúde personalizadas

Qual a precisão dos números de latência?

As métricas de latência medem:

  • P50: Tempo médio de resposta
  • P95: Percentil 95
  • P99: Percentil 99

Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.

Por que minhas métricas estão atrasadas?

As métricas têm um atraso de aproximadamente 2 minutos devido a:

  • Pipeline de agregação de métricas
  • Janelas de agregação
  • Cache do dashboard

Para depuração em tempo real, verifique os logs, que são quase instantâneos.

Posso monitorar múltiplos endpoints simultaneamente?

Sim, o painel de monitoramento global exibe todos os endpoints. Utilize a tabela para comparar o desempenho entre as implantações.



📅 Criado há 20 dias ✏️ Atualizado há 20 dias
glenn-jocher

Comentários