Monitorização
A Ultralytics Platform disponibiliza monitorização para endpoints implementados. Segue as métricas de pedidos, visualiza registos e verifica o estado de integridade com sondagem automática.

Painel de Implementações
A página Deploy na barra lateral serve como painel de monitorização para todas as tuas implementações. Combina o mapa mundial, métricas de visão geral e gestão de implementações numa única vista. Consulta Dedicated Endpoints para criar e gerir implementações.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffCartões de Visão Geral
Quatro cartões de resumo na parte superior da página mostram:

| Métrica | Descrição |
|---|---|
| Total de Pedidos (24h) | Pedidos em todos os endpoints |
| Implementações Ativas | Endpoints em execução atualmente |
| Taxa de Erro (24h) | Percentagem de pedidos falhados |
| Latência P95 (24h) | 95º percentil do tempo de resposta |
O cartão de taxa de erro destaca-se a vermelho quando a taxa excede 5%. Verifica o separador Logs em implementações individuais para diagnosticar erros.
Mapa Mundial
O mapa mundial interativo mostra:
- Pin de região para todas as 43 regiões disponíveis
- Pin verde para regiões implementadas
- Pin azul animado para regiões com implementações ativas em curso
- Tamanho do pin varia com base no estado da implementação e latência

Lista de Implementações
Abaixo dos cartões de visão geral, a lista de implementações mostra todos os endpoints nos teus projetos. Usa o seletor de modo de visualização para alternar entre:
| Visualizar | Descrição |
|---|---|
| Cartões | Cartões de detalhes completos com separadores de métricas, registos, código e previsão |
| Compacto | Grelha de cartões mais pequenos (1-4 colunas) com métricas principais |
| Tabela | Tabela de dados com colunas ordenáveis: Nome, Região, Estado, Pedidos, P95, Erros |
O painel consulta a cada 15 segundos as atualizações de estado da implementação. Quando as implementações estão num estado de transição (creating, deploying ou stopping), a sondagem aumenta para cada 3 segundos. Os gráficos de métricas são atualizados a cada 60 segundos. Clica no botão de atualizar para obter atualizações imediatas.
Métricas por Implementação
Cada cartão de implementação (na vista de cartões) mostra métricas em tempo real:
Linha de Métricas
| Métrica | Descrição |
|---|---|
| Pedidos | Contagem de pedidos (24h) com ícone |
| Latência P95 | 95º percentil do tempo de resposta |
| Taxa de Erro | Percentagem de pedidos falhados |
As métricas são obtidas a partir do endpoint da API sparkline e atualizadas a cada 60 segundos.
Verificação de Saúde (Health Check)
As implementações em execução mostram um indicador de verificação de integridade:
| Indicador | Significado |
|---|---|
| Coração verde | Saudável — mostra a latência de resposta |
| Coração vermelho | Não saudável — mostra a mensagem de erro |
| Ícone giratório | Verificação de integridade em curso |
As verificações de integridade tentam automaticamente novamente a cada 20 segundos quando não saudáveis. Clica no ícone de atualizar para acionar manualmente uma verificação de integridade. A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar arranques a frio em endpoints com escala para zero.

A verificação de integridade utiliza um tempo limite de 55 segundos para ter em conta os arranques a frio em endpoints com escala para zero (até ~45 segundos no pior caso). Assim que o endpoint aquece, as verificações de integridade concluem em milissegundos.
Registos
Cada cartão de implementação inclui um separador Logs para visualizar entradas de registo recentes:

Entradas de Registo
Cada entrada de registo mostra:
| Campo | Descrição |
|---|---|
| Severidade | Barra codificada por cores (ver abaixo) |
| Timestamp | Hora do pedido (formato local) |
| Mensagem | Conteúdo do registo |
| Informação HTTP | Código de estado e latência (se aplicável) |
Filtra os registos por severidade usando os botões de filtro:
| Nível | Cor | Descrição |
|---|---|---|
| DEBUG | Cinzento | Mensagens de depuração |
| INFO | Azul | Pedidos normais |
| WARNING | Amarelo | Problemas não críticos |
| ERROR | Vermelho | Pedidos falhados |
| CRITICAL | Vermelho Escuro | Falhas críticas |
A IU mostra as 20 entradas mais recentes. A API tem como predefinição 50 entradas por pedido (máximo 200).
Ao investigar erros: primeiro clica em Errors para filtrar para entradas ERROR e WARNING, depois revê os timestamps e códigos de estado HTTP. Copia os registos para a área de transferência para partilhar com a tua equipa.
Exemplos de Código
Cada cartão de implementação inclui um separador Code que mostra código de API pronto a usar com o teu URL de endpoint real e chave de API:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Ao visualizar a guia Code na plataforma, a URL do seu endpoint e a sua chave de API são preenchidas automaticamente. Copie o código e execute-o diretamente. Consulte API Keys para gerar uma chave.
Predict de Deployment
A guia Predict em cada cartão de implantação oferece um painel de predição integrado — a mesma interface que a guia Predict do modelo, mas executando a inferência através do endpoint de implantação em vez do serviço compartilhado. Isso é útil para testar um endpoint implantado diretamente do navegador. Consulte Inference para detalhes sobre parâmetros e formatos de resposta.
Endpoints de API
Visão geral do monitoramento
GET /api/monitoringRetorna métricas agregadas para todas as implantações pertencentes ao usuário autenticado. Ciente do espaço de trabalho através do parâmetro de consulta opcional owner.
Métricas de implantação
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hRetorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.
| Parâmetro | Tipo | Descrição |
|---|---|---|
sparkline | bool | Incluir dados de sparkline |
range | string | Intervalo de tempo: 1h, 6h, 24h, 7d ou 30d |
Logs de implantação
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGRetorna entradas de log recentes com filtro de severidade e paginação opcionais.
| Parâmetro | Tipo | Descrição |
|---|---|---|
limit | int | Número máximo de entradas a retornar (padrão: 50, máximo: 200) |
severity | string | Filtro de severidade separado por vírgulas |
pageToken | string | Token de paginação da resposta anterior |
Status de integridade da implantação
GET /api/deployments/{deploymentId}/healthRetorna o status de verificação de integridade com latência de resposta.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}Otimização de Desempenho
Use os dados de monitoramento para otimizar suas implantações:
Se a latência estiver muito alta:
- Verifique a contagem de instâncias (pode precisar de mais)
- Verifique se o tamanho do modelo é apropriado
- Considere uma região mais próxima
- Verifique os tamanhos das imagens que estão sendo enviadas
Mude de imgsz=1280 para imgsz=640 para um ganho de velocidade de ~4x com perda mínima de precisão na maioria dos casos de uso. Implante em uma região mais próxima de seus usuários para obter menor latência de rede.
FAQ
Por quanto tempo os dados são retidos?
| Tipo de Dados | Retenção |
|---|---|
| Métricas | 30 dias |
| Logs | 7 dias |
Posso configurar um monitoramento externo?
Sim, as URLs dos endpoints funcionam com ferramentas de monitoramento externas:
- Monitoramento de tempo de atividade (Pingdom, UptimeRobot)
- Ferramentas de APM (Datadog, New Relic)
- Verificações de integridade personalizadas através do endpoint
/health
Quão precisos são os números de latência?
As métricas de latência medem:
- P50: Tempo médio de resposta
- P95: 95º percentil
- P99: 99º percentil
Estes representam o tempo de processamento no lado do servidor, não incluindo a latência de rede para os seus usuários.
Por que minhas métricas estão atrasadas?
As métricas têm um atraso de ~2 minutos devido a:
- Pipeline de agregação de métricas
- Janelas de agregação
- Cache do painel
Para depuração em tempo real, verifique os logs, que são quase instantâneos.
Posso monitorar múltiplos endpoints juntos?
Sim, a página de implantações mostra todos os endpoints com cartões de visão geral agregados. Use a visualização em tabela para comparar o desempenho entre as implantações.