Monitoramento
Ultralytics Platform fornece monitoramento para endpoints implantados. Acompanhe as métricas de solicitação, visualize logs e verifique o status de saúde com sondagem automática.

Painel de Implantações
O Deploy página na barra lateral serve como painel de monitoramento para todas as suas implantações. Ela combina o mapa-múndi, métricas de visão geral e gerenciamento de implantações em uma única visualização. Veja Endpoints Dedicados para criar e gerenciar implementações.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fff
Cartões de Visão Geral
Quatro cartões de resumo no topo da página mostram:

| Métrica | Descrição |
|---|---|
| Total de Requisições (24h) | Requisições em todos os endpoints |
| Implantações Ativas | Endpoints atualmente em execução |
| Taxa de Erro (24h) | Porcentagem de requisições com falha |
| Latência P95 (24h) | Tempo de resposta no percentil 95 |
Alerta de Taxa de Erro
O cartão de taxa de erro destaca em vermelho quando a taxa excede 5%. Verifique o Logs guia em implantações individuais para diagnosticar erros.
Mapa Mundi
O mapa-múndi interativo mostra:
- Pinos de região para todas as 43 regiões disponíveis
- Pinos verdes para regiões implantadas
- Pinos azuis animados para regiões com implantações ativas em andamento
- Tamanho do pino varia com base no status de implantação e latência

Lista de Implantações
Abaixo dos cartões de visão geral, a lista de implantações mostra todos os endpoints em seus projetos. Use o alternador de modo de visualização para alternar entre:
| Visualizar | Descrição |
|---|---|
| Cartões | Cartões de detalhes completos com métricas, logs, código e abas de previsão |
| Compacto | Grade de cartões menores (1-4 colunas) com métricas chave |
| Tabela | Tabela de Dados com colunas classificáveis: Nome, Região, Status, Requisições, P95, Erros |
Atualizações em Tempo Real
O painel consulta a cada 30 segundos para atualizações de métricas. Quando as implantações estão em estado de transição (criando, implantando), a frequência de consulta aumenta para a cada 3 segundos. Clique no botão de atualização para obter atualizações imediatas.
Métricas por Implantação
Cada cartão de implantação (na visualização de cartões) exibe métricas em tempo real:
Linha de Métricas
| Métrica | Descrição |
|---|---|
| Requisições | Contagem de requisições (24h) com ícone |
| Latência P95 | Tempo de resposta no percentil 95 |
| Taxa de Erros | Porcentagem de requisições com falha |
As métricas são obtidas do endpoint da API sparkline e atualizam a cada 60 segundos.
Verificação de Saúde
Implantações em execução mostram um indicador de verificação de integridade:
| Indicador | Significado |
|---|---|
| Coração verde | Saudável — mostra a latência de resposta |
| Coração vermelho | Não saudável — mostra mensagem de erro |
| Ícone giratório | Verificação de integridade em andamento |
As verificações de integridade são automaticamente repetidas a cada 20 segundos quando o sistema está em estado não saudável. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio em endpoints com escala para zero.

Tolerância à Inicialização a Frio
A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio em endpoints de escala para zero (até ~45 segundos no pior cenário). Uma vez que o endpoint é inicializado, as verificações de integridade são concluídas em milissegundos.
Logs
Cada cartão de implantação inclui um Logs guia para visualização de entradas de log recentes:

Entradas de Log
Cada entrada de log exibe:
| Campo | Descrição |
|---|---|
| Severidade | Barra codificada por cores (ver abaixo) |
| Timestamp | Tempo da requisição (formato local) |
| Mensagem | Conteúdo do log |
| Informações HTTP | Código de status e latência (se aplicável) |
Filtrar logs por severidade usando os botões de filtro:
| Nível | Cor | Descrição |
|---|---|---|
| DEBUG | Cinza | Mensagens de depuração |
| INFO | Azul | Requisições normais |
| WARNING | Amarelo | Problemas não críticos |
| ERROR | Vermelho | Requisições falhas |
| CRÍTICO | Vermelho Escuro | Falhas críticas |
| Controle | Descrição |
|---|---|
| Erros | Filtrar para entradas de ERRO e AVISO |
| Todos os | Mostrar todas as entradas de registo |
| Copiar | Copiar todos os logs visíveis para a área de transferência |
| Atualizar | Recarregar entradas de log |
A UI mostra as 20 entradas mais recentes. A API assume 50 entradas por pedido (máximo 200).
Fluxo de Trabalho de Depuração
Ao investigar erros: primeiro clique em Errors para filtrar as entradas de ERRO e AVISO, depois revise os carimbos de data/hora e os códigos de status HTTP. Copie os logs para a área de transferência para compartilhar com sua equipe.
Exemplos de Código
Cada cartão de implantação inclui um Code o separador que mostra código de API pronto a usar com o seu URL de endpoint real e chave de API:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Credenciais Preenchidas Automaticamente
Ao visualizar o Code guia na plataforma, sua URL de endpoint e chave de API reais são preenchidas automaticamente. Copie o código e execute-o diretamente. Veja Chaves de API para gerar uma chave.
Previsão de Implantação
O Predict guia em cada cartão de implantação fornece um painel de previsão embutido — a mesma interface do modelo Predict separador, mas a executar inferência através do endpoint de implementação em vez do serviço partilhado. Isto é útil para testar um endpoint implementado diretamente a partir do navegador. Ver Inferência para detalhes de parâmetros e formatos de resposta.
Endpoints da API
Visão Geral do Monitoramento
GET /api/monitoring
Retorna métricas agregadas para todas as implantações de propriedade do usuário autenticado. Compatível com workspace via opcional owner parâmetro de consulta.
Métricas de Implantação
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h
Retorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.
| Parâmetro | Tipo | Descrição |
|---|---|---|
sparkline | booleano | Incluir dados de sparkline |
range | string | Intervalo de tempo: 1h, 6h, 24h, 7d, ou 30d |
Registros de Implantação
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING
Retorna entradas de log recentes com filtro de severidade opcional e paginação.
| Parâmetro | Tipo | Descrição |
|---|---|---|
limit | int | Máximo de entradas a retornar (padrão: 50, máximo: 200) |
severity | string | Filtro de severidade separado por vírgulas |
pageToken | string | Token de paginação da resposta anterior |
Saúde da Implantação
GET /api/deployments/{deploymentId}/health
Retorna o status da verificação de saúde com a latência de resposta.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}
Otimização de Desempenho
Utilize dados de monitoramento para otimizar suas implantações:
Se a latência estiver muito alta:
- Verifique a contagem de instâncias (pode ser necessário mais)
- Verifique se o tamanho do modelo é apropriado
- Considere uma região mais próxima
- Verifique os tamanhos das imagens sendo enviadas
Redução da Latência
Mudar de imgsz=1280 para imgsz=640 para um aumento de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implante em uma região mais próxima dos seus usuários para menor latência de rede.
Se estiverem ocorrendo erros:
- Revise os logs de erro em
Logsguia - Verifique o formato da requisição (formulário multipart é necessário)
- Verifique se a chave da API é válida
- Verifique os limites de taxa
Se estiver atingindo a capacidade:
- Considere múltiplas regiões
- Otimize o agrupamento de requisições
- Aumentar os recursos de CPU e memória
FAQ
Por quanto tempo os dados são retidos?
| Tipo de Dado | Retenção |
|---|---|
| Métricas | 30 dias |
| Logs | 7 dias |
Posso configurar monitoramento externo?
Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:
- Monitoramento de disponibilidade (Pingdom, UptimeRobot)
- Ferramentas APM (Datadog, New Relic)
- Verificações de integridade personalizadas via o
/healthendpoint
Qual a precisão dos números de latência?
As métricas de latência medem:
- P50: Tempo médio de resposta
- P95: Percentil 95
- P99: Percentil 99
Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.
Por que minhas métricas estão atrasadas?
As métricas têm um atraso de aproximadamente 2 minutos devido a:
- Pipeline de agregação de métricas
- Janelas de agregação
- Cache do dashboard
Para depuração em tempo real, verifique os logs, que são quase instantâneos.
Posso monitorar múltiplos endpoints simultaneamente?
Sim, a página de implementações mostra todos os endpoints com cartões de visão geral agregados. Utilize a vista de tabela para comparar o desempenho entre as implementações.