Monitoramento
Ultralytics fornece monitorização para terminais implementados. Acompanhe métricas de pedidos, visualize registos e verifique o estado de saúde com sondagem automática.

Painel de implantações
O Deploy A página na barra lateral funciona como o painel de monitorização de todas as suas implementações. Ela combina o mapa-múndi, métricas gerais e gestão de implementações numa única visualização. Veja Endpoints Dedicados para criar e gerir implementações.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fff
Cartões de Visão Geral
Quatro cartões resumidos na parte superior da página mostram:

| Métrica | Descrição |
|---|---|
| Total de pedidos (24h) | Pedidos em todos os pontos finais |
| Implantações Ativas | Endpoints atualmente em execução |
| Taxa de erro (24h) | Porcentagem de requisições com falha |
| Latência P95 (24h) | Tempo de resposta no percentil 95 |
Alerta de taxa de erro
O cartão de taxa de erro destaca em vermelho quando a taxa excede 5%. Verifique o Logs guia em implementações individuais para diagnosticar erros.
Mapa-múndi
O mapa-múndi interativo mostra:
- Pins regionais para todas as 43 regiões disponíveis
- Pinos verdes para regiões implementadas
- Pinos azuis animados para regiões com implementações ativas em andamento
- O tamanho do pin varia de acordo com o estado da implantação e a latência

Lista de implementações
Abaixo dos cartões de visão geral, a lista de implementações mostra todos os pontos finais dos seus projetos. Use o botão de alternância do modo de visualização para alternar entre:
| Visualizar | Descrição |
|---|---|
| Cartões | Cartões detalhados com métricas, registos, código e guias de previsão |
| Compacto | Grelha de cartões mais pequenos (1-4 colunas) com métricas-chave |
| Tabela | Tabela de dados com colunas classificáveis: Nome, Região, Estado, Solicitações, P95, Erros |
Atualizações em Tempo Real
O painel realiza pesquisas a cada 30 segundos para obter atualizações métricas. Quando as implementações estão em um estado de transição (criação, implementação), as pesquisas aumentam para a cada 3 segundos. Clique no botão Atualizar para obter atualizações imediatas.
Métricas por implementação
Cada cartão de implementação (na visualização de cartões) mostra métricas em tempo real:
Linha de métricas
| Métrica | Descrição |
|---|---|
| Requisições | Contagem de pedidos (24h) com ícone |
| Latência P95 | Tempo de resposta no percentil 95 |
| Taxa de Erros | Porcentagem de requisições com falha |
As métricas são obtidas a partir do ponto final da API sparkline e atualizadas a cada 60 segundos.
Verificação de Saúde
As implementações em execução mostram um indicador de verificação de integridade:
| Indicador | Significado |
|---|---|
| Coração verde | Saudável — mostra latência de resposta |
| Coração vermelho | Não saudável — mostra mensagem de erro |
| Ícone giratório | Verificação de saúde em andamento |
As verificações de integridade são repetidas automaticamente a cada 20 segundos quando não estão em boas condições. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade usa um tempo limite de 55 segundos para acomodar inicializações a frio em pontos finais com escala para zero.

Tolerância ao arranque a frio
A verificação de integridade usa um tempo limite de 55 segundos para contabilizar inicializações a frio em pontos finais escalonados para zero (até ~45 segundos no pior caso). Depois que o ponto final é aquecido, as verificações de integridade são concluídas em milissegundos.
Logs
Cada cartão de implantação inclui um Logs guia para visualizar entradas recentes do registo:

Entradas de Log
Cada entrada de log exibe:
| Campo | Descrição |
|---|---|
| Severidade | Barra codificada por cores (ver abaixo) |
| Timestamp | Hora da solicitação (formato local) |
| Mensagem | Conteúdo do log |
| Informações HTTP | Código de estado e latência (se aplicável) |
Filtre os registos por gravidade utilizando os botões de filtro:
| Nível | Cor | Descrição |
|---|---|---|
| DEBUG | Cinza | Mensagens de depuração |
| INFO | Azul | Requisições normais |
| WARNING | Amarelo | Problemas não críticos |
| ERROR | Vermelho | Requisições falhas |
| CRÍTICO | Vermelho escuro | Falhas críticas |
| Controlo | Descrição |
|---|---|
| Erros | Filtrar para entradas ERROR e WARNING |
| Todos os | Mostrar todas as entradas do registo |
| Copiar | Copiar todos os registos visíveis para a área de transferência |
| Atualizar | Recarregar entradas do registo |
A interface do utilizador mostra as 20 entradas mais recentes. A API tem como padrão 50 entradas por pedido (máximo de 200).
Fluxo de trabalho de depuração
Ao investigar erros: primeiro clique em Erros para filtrar as entradas ERROR e WARNING, depois analise os carimbos de data/hora e os códigos de estado HTTP. Copie os registos para a área de transferência para partilhar com a sua equipa.
Exemplos de Código
Cada cartão de implantação inclui um Code aba mostrando o código API pronto para uso com o URL do seu endpoint real e a chave API:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Credenciais preenchidas automaticamente
Ao visualizar o Code na plataforma, o URL do seu endpoint real e a chave API são preenchidos automaticamente. Copie o código e execute-o diretamente. Veja Chaves de API para gerar uma chave.
Previsão de implementação
O Predict A guia em cada cartão de implementação fornece um painel de previsão embutido — a mesma interface do modelo. Predict , mas executando a inferência através do ponto de extremidade de implementação em vez do serviço partilhado. Isto é útil para testar um ponto de extremidade implementado diretamente a partir do navegador. Consulte Inferência para obter detalhes sobre os parâmetros e formatos de resposta.
Pontos finais da API
Visão geral da monitorização
GET /api/monitoring
Retorna métricas agregadas para todas as implementações pertencentes ao utilizador autenticado. Compatível com o espaço de trabalho através de opcional owner parâmetro de consulta.
Métricas de implementação
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h
Retorna dados de sparkline e métricas resumidas para uma implementação específica. Intervalo de atualização: 60 segundos.
| Parâmetro | Tipo | Descrição |
|---|---|---|
sparkline | booleano | Incluir dados de sparkline |
range | string | Intervalo de tempo: 1h, 6h, 24h, 7d, ou 30d |
Registos de implementação
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING
Retorna entradas recentes do registo com filtro de gravidade opcional e paginação.
| Parâmetro | Tipo | Descrição |
|---|---|---|
limit | int | Máximo de entradas a retornar (padrão: 50, máximo: 200) |
severity | string | Filtro de gravidade separado por vírgulas |
pageToken | string | Token de paginação da resposta anterior |
Saúde da implantação
GET /api/deployments/{deploymentId}/health
Retorna o estado da verificação de integridade com a latência da resposta.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}
Otimização de Desempenho
Use dados de monitoramento para otimizar suas implementações:
Se a latência estiver muito alta:
- Verifique a contagem de instâncias (pode ser necessário mais)
- Verifique se o tamanho do modelo é apropriado
- Considere uma região mais próxima
- Verifique os tamanhos das imagens sendo enviadas
Reduzindo a latência
Mudar de imgsz=1280 para imgsz=640 para um aumento de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implemente numa região mais próxima dos seus utilizadores para obter menor latência de rede.
Se estiverem ocorrendo erros:
- Revise os registos de erros no
Logsaba - Verifique o formato do pedido (é necessário um formulário multiparte)
- Verifique se a chave da API é válida
- Verifique os limites de taxa
Se estiver atingindo a capacidade:
- Considere múltiplas regiões
- Otimize o agrupamento de requisições
- Aumente os recursos CPU da memória
FAQ
Por quanto tempo os dados são retidos?
| Tipo de Dado | Retenção |
|---|---|
| Métricas | 30 dias |
| Logs | 7 dias |
Posso configurar monitoramento externo?
Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:
- Monitoramento de disponibilidade (Pingdom, UptimeRobot)
- Ferramentas APM (Datadog, New Relic)
- Verificações de saúde personalizadas através do
/healthponto final
Qual a precisão dos números de latência?
As métricas de latência medem:
- P50: Tempo médio de resposta
- P95: Percentil 95
- P99: Percentil 99
Estes representam o tempo de processamento do lado do servidor, não incluindo a latência de rede para os seus usuários.
Por que minhas métricas estão atrasadas?
As métricas têm um atraso de aproximadamente 2 minutos devido a:
- Pipeline de agregação de métricas
- Janelas de agregação
- Cache do dashboard
Para depuração em tempo real, verifique os logs, que são quase instantâneos.
Posso monitorar múltiplos endpoints simultaneamente?
Sim, a página de implementações mostra todos os pontos finais com cartões de visão geral agregados. Use a visualização da tabela para comparar o desempenho entre as implementações.