Monitoramento
Plataforma Ultralytics oferece monitoramento abrangente para endpoints implantados. track métricas de requisição, visualize logs e analise o desempenho em tempo real.
Painel de Monitoramento
Acesse o painel de monitoramento global na barra lateral:
- Clique em Monitoramento na barra lateral
- Visualize todas as implantações em um relance
- Clique nos endpoints individuais para ver os detalhes
Cartões de Visão Geral
| Métrica | Descrição |
|---|---|
| Total de Requisições | Requisições em todos os endpoints (24h) |
| Implantações Ativas | Endpoints atualmente em execução |
| Taxa de Erros | Porcentagem de requisições com falha |
| Latência Média | Tempo médio de resposta |
Tabela de Implantações
Visualize todas as implantações com as principais métricas:
| Coluna | Descrição |
|---|---|
| Modelo | Nome do modelo com link |
| Região | Região de implantação com bandeira |
| Status | Indicador de Em Execução/Parado |
| Requisições | Contagem de requisições (24h) |
| Latência | Tempo de resposta P50 |
| Erros | Contagem de erros (24h) |
| Minigráfico | Visualização da tendência de tráfego |
Atualizações em Tempo Real
O painel de controle atualiza a cada 30 segundos. Clique em atualizar para obter atualizações imediatas.
Métricas de Endpoint
Visualize métricas detalhadas para endpoints individuais:
- Navegue para a aba Deploy do seu modelo
- Clique em um endpoint
- Visualizar o painel de métricas
Métricas Disponíveis
| Métrica | Descrição | Unidade |
|---|---|---|
| Contagem de Requisições | Total de requisições ao longo do tempo | contagem |
| Latência da Requisição | Distribuição do tempo de resposta | ms |
| Taxa de Erros | Percentual de requisições falhas | % |
| Contagem de Instâncias | Instâncias de contêiner ativas | contagem |
| Utilização da CPU | Uso do processador | % |
| Uso de Memória | Consumo de RAM | MB |
Intervalos de Tempo
Selecionar intervalo de tempo para as métricas:
| Intervalo | Descrição |
|---|---|
| 1h | Última hora |
| 6h | Últimas 6 horas |
| 24h | Últimas 24 horas (padrão) |
| 7d | Últimos 7 dias |
Gráficos de Métricas
Gráficos interativos mostram:
- Gráficos de linha para tendências ao longo do tempo
- Passe o mouse para valores exatos
- Amplie para analisar períodos específicos
Logs
Visualizar logs de requisição para depuração:
Entradas de Log
Cada entrada de log exibe:
| Campo | Descrição |
|---|---|
| Timestamp | Tempo da requisição |
| Severidade | INFO, WARNING, ERROR |
| Mensagem | Conteúdo do log |
| ID da requisição | Identificador único |
Níveis de Severidade
Filtrar logs por severidade:
| Nível | Cor | Descrição |
|---|---|---|
| INFO | Azul | Requisições normais |
| WARNING | Amarelo | Problemas não críticos |
| ERROR | Vermelho | Requisições falhas |
Filtragem de Log
Filtrar logs para encontrar problemas:
- Selecionar nível de severidade
- Pesquisar por palavra-chave
- Filtrar por intervalo de tempo
Alertas
Configurar alertas para problemas de endpoint (em breve):
| Tipo de Alerta | Gatilho |
|---|---|
| Alta Taxa de Erros | Taxa de erro > limite |
| Alta Latência | Latência P95 > limite |
| Sem Requisições | Zero requisições para o período |
| Dimensionamento | Instâncias na capacidade máxima |
Otimização de Desempenho
Utilize os dados de monitoramento para otimizar:
Alta Latência
Se a latência estiver muito alta:
- Verifique a contagem de instâncias (pode ser necessário mais)
- Verifique se o tamanho do modelo é apropriado
- Considere uma região mais próxima
- Verifique os tamanhos das imagens sendo enviadas
Alta Taxa de Erros
Se estiverem ocorrendo erros:
- Revise os logs de erro para detalhes
- Verifique o formato da requisição
- Verifique se a chave da API é válida
- Verifique os limites de taxa
Problemas de Escalabilidade
Se estiver atingindo a capacidade:
- Aumente o número máximo de instâncias
- Defina o número mínimo de instâncias > 0
- Considere múltiplas regiões
- Otimize o agrupamento de requisições
Exportar Dados
Exporte os dados de monitoramento para análise:
- Selecione o intervalo de tempo
- Clique em Exportar
- Baixar arquivo CSV
A exportação inclui:
- Timestamp
- Contagem de requisições
- Métricas de latência
- Contagem de erros
- Métricas de instância
FAQ
Por quanto tempo os dados são retidos?
| Tipo de Dado | Retenção |
|---|---|
| Métricas | 30 dias |
| Logs | 7 dias |
| Alertas | 90 dias |
Posso configurar monitoramento externo?
Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:
- Monitoramento de disponibilidade (Pingdom, UptimeRobot)
- Ferramentas APM (Datadog, New Relic)
- Verificações de saúde personalizadas
Qual a precisão dos números de latência?
As métricas de latência medem:
- P50: Tempo médio de resposta
- P95: Percentil 95
- P99: Percentil 99
Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.
Por que minhas métricas estão atrasadas?
As métricas têm um atraso de aproximadamente 2 minutos devido a:
- Pipeline de agregação de métricas
- Janelas de agregação
- Cache do dashboard
Para depuração em tempo real, verifique os logs, que são quase instantâneos.
Posso monitorar múltiplos endpoints simultaneamente?
Sim, o painel de monitoramento global exibe todos os endpoints. Utilize a tabela para comparar o desempenho entre as implantações.