Monitorização
Ultralytics oferece monitoramento abrangente para terminais implementados. Acompanhe métricas de solicitações, visualize registos e analise o desempenho em tempo real.
Painel de monitorização
Aceda ao painel de monitorização global a partir da barra lateral:
- Clique em Monitorização na barra lateral
- Veja todas as implementações num relance
- Clique nos pontos finais individuais para obter detalhes
Cartões de visão geral
| Métrica | Descrição |
|---|---|
| Total de pedidos | Pedidos em todos os pontos finais (24 horas) |
| Implementações ativas | Endpoints atualmente em execução |
| Taxa de erro | Porcentagem de pedidos com falha |
| Latência média | Tempo médio de resposta |
Tabela de implementações
Veja todas as implementações com métricas importantes:
| Coluna | Descrição |
|---|---|
| Modelo | Nome do modelo com link |
| Região | Região implementada com sinalizador |
| Status | Indicador em funcionamento/parado |
| Pedidos | Contagem de pedidos (24h) |
| Latência | Tempo de resposta P50 |
| Erros | Contagem de erros (24h) |
| Sparkline | Visualização da tendência do tráfego |
Atualizações em tempo real
O painel faz uma sondagem a cada 30 segundos. Clique em atualizar para obter atualizações imediatas.
Métricas de ponto final
Veja métricas detalhadas para pontos finais individuais:
- Navegue até a guia Implantação do seu modelo
- Clique num ponto final
- Ver o painel de métricas
Métricas disponíveis
| Métrica | Descrição | Unidade |
|---|---|---|
| Contagem de pedidos | Total de pedidos ao longo do tempo | contar |
| Latência da solicitação | Distribuição do tempo de resposta | ms |
| Taxa de erro | Percentagem de pedidos falhados | % |
| Contagem de Instâncias | Instanças de contentores ativas | contar |
| CPU | Utilização do processador | % |
| Utilização da memória | Consumo de RAM | MB |
Intervalos de tempo
Selecione o intervalo de tempo para as métricas:
| Intervalo | Descrição |
|---|---|
| 1h | Última hora |
| 6h | Últimas 6 horas |
| 24h | Últimas 24 horas (padrão) |
| 7d | Últimos 7 dias |
Tabelas métricas
Os gráficos interativos mostram:
- Gráficos de linha para tendências ao longo do tempo
- Passe o cursor para ver os valores exatos
- Ampliar para analisar períodos específicos
Registos
Ver registos de pedidos para depuração:
Entradas de registo
Cada entrada do registo mostra:
| Campo | Descrição |
|---|---|
| Carimbo de data/hora | Tempo de solicitação |
| Gravidade | INFORMAÇÃO, AVISO, ERRO |
| Mensagem | Conteúdo do registo |
| ID da solicitação | Identificador único |
Níveis de gravidade
Filtrar registos por gravidade:
| Nível | Cor | Descrição |
|---|---|---|
| INFORMAÇÃO | Azul | Pedidos normais |
| AVISO | Amarelo | Questões não críticas |
| ERRO | Vermelho | Pedidos falhados |
Filtragem de registos
Filtre os registos para encontrar problemas:
- Selecione o nível de gravidade
- Pesquisar por palavra-chave
- Filtrar por intervalo de tempo
Alertas
Configure alertas para problemas em terminais (em breve):
| Tipo de alerta | Gatilho |
|---|---|
| Alta taxa de erro | Taxa de erro > limite |
| Alta latência | Latência P95 > limite |
| Sem pedidos | Zero pedidos para o período |
| Escalonamento | Instancias na capacidade máxima |
Otimização de Desempenho
Use os dados de monitorização para otimizar:
Alta latência
Se a latência for muito alta:
- Verifique a contagem de instâncias (pode ser necessário aumentar)
- Verifique se o tamanho do modelo é adequado
- Considere uma região mais próxima
- Verifique os tamanhos das imagens que estão a ser enviadas
Alta taxa de erro
Se ocorrerem erros:
- Verifique os registos de erros para obter detalhes
- Verifique o formato do pedido
- Verifique se a chave API é válida
- Verifique os limites de taxa
Problemas de dimensionamento
Se atingir a capacidade:
- Aumentar o número máximo de instâncias
- Definir instâncias mínimas > 0
- Considere várias regiões
- Otimizar o agrupamento de pedidos
Exportar dados
Exportar dados de monitorização para análise:
- Selecione o intervalo de tempo
- Clique em Exportar
- Descarregar ficheiro CSV
A exportação inclui:
- Carimbo de data/hora
- Contagem de pedidos
- Métricas de latência
- Contagem de erros
- Métricas de instância
FAQ
Por quanto tempo os dados são mantidos?
| Tipo de Dado | Retenção |
|---|---|
| Métricas | 30 dias |
| Registos | 7 dias |
| Alertas | 90 dias |
Posso configurar monitorização externa?
Sim, os URLs dos pontos finais funcionam com ferramentas de monitorização externas:
- Monitorização do tempo de atividade (Pingdom, UptimeRobot)
- Ferramentas APM (Datadog, New Relic)
- Verificações de saúde personalizadas
Quão precisos são os números de latência?
Métricas de latência medem:
- P50: Tempo médio de resposta
- P95: percentil 95
- P99: percentil 99
Estes valores representam o tempo de processamento do lado do servidor, sem incluir a latência da rede para os seus utilizadores.
Por que as minhas métricas estão atrasadas?
As métricas têm um atraso de aproximadamente 2 minutos devido a:
- Pipeline de agregação de métricas
- Janelas de agregação
- Cache do painel
Para depuração em tempo real, verifique os registos, que são quase instantâneos.
Posso monitorar vários terminais juntos?
Sim, o painel de monitorização global mostra todos os pontos finais. Utilize a tabela para comparar o desempenho entre as implementações.