Link to this sectionMonitoramento#
A Ultralytics Platform fornece monitoramento para endpoints implantados. Acompanhe métricas de solicitação, visualize logs e verifique o status de integridade com sondagem automática.

Link to this sectionPainel de Implantações#
A página Deploy na barra lateral serve como painel de monitoramento para todas as suas implantações. Ela combina o mapa-múndi, métricas de visão geral e gerenciamento de implantação em uma única visualização. Consulte Endpoints Dedicados para criar e gerenciar implantações.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this sectionCartões de Visão Geral#
Quatro cartões de resumo na parte superior da página mostram:

| Métrica | Descrição |
|---|---|
| Total de Solicitações (24h) | Solicitações em todos os endpoints |
| Implantações Ativas | Endpoints em execução no momento |
| Taxa de Erro (24h) | Porcentagem de solicitações com falha |
| Latência P95 (24h) | Tempo de resposta no percentil 95 |
O cartão de taxa de erro fica destacado em vermelho quando a taxa excede 5%. Verifique a aba Logs em cada implantação para diagnosticar erros.
Link to this sectionMapa-Múndi#
O mapa-múndi interativo mostra:
- Marcadores de Região para todas as 43 regiões disponíveis
- Marcadores verdes para regiões implantadas
- Marcadores azuis animados para regiões com implantações ativas em andamento
- O tamanho do marcador varia conforme o status da implantação e a latência

Link to this sectionLista de Implantações#
Abaixo dos cartões de visão geral, a lista de implantações mostra todos os endpoints em seus projetos. Use o botão de modo de visualização para alternar entre:
| Ver | Descrição |
|---|---|
| Cartões | Cartões de detalhes completos com abas de métricas, logs, código e predição |
| Compacto | Grade de cartões menores (1-4 colunas) com métricas principais |
| Tabela | Tabela de dados com colunas classificáveis: Nome, Região, Status, Solicitações, P95, Erros |
O painel consulta a cada 15 segundos atualizações de status de implantação. Quando as implantações estão em um estado de transição (creating, deploying ou stopping), a sondagem aumenta para cada 3 segundos. Os gráficos de métricas são atualizados a cada 60 segundos. Clique no botão de atualizar para atualizações imediatas.
Link to this sectionMétricas por Implantação#
Cada cartão de implantação (na visualização de cartões) mostra métricas em tempo real:
Link to this sectionLinha de Métricas#
| Métrica | Descrição |
|---|---|
| Solicitações | Contagem de solicitações (24h) com ícone |
| Latência P95 | Tempo de resposta no percentil 95 |
| Taxa de Erro | Porcentagem de solicitações com falha |
As métricas são buscadas no endpoint da API de sparkline e atualizadas a cada 60 segundos.
Link to this sectionVerificação de Saúde#
As implantações em execução mostram um indicador de verificação de integridade:
| Indicador | Significado |
|---|---|
| Coração verde | Saudável — mostra a latência de resposta |
| Coração vermelho | Não saudável — mostra a mensagem de erro |
| Ícone giratório | Verificação de integridade em andamento |
As verificações de integridade tentam novamente automaticamente a cada 20 segundos quando não estão saudáveis. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade usa um tempo limite de 55 segundos para acomodar cold starts em endpoints com escala para zero.

A verificação de integridade usa um tempo limite de 55 segundos para contabilizar cold starts em endpoints com escala para zero (até ~45 segundos no pior caso). Assim que o endpoint aquece, as verificações de integridade são concluídas em milissegundos.
Link to this sectionLogs#
Cada cartão de implantação inclui uma aba Logs para visualizar entradas de log recentes:

Link to this sectionEntradas de Log#
Cada entrada de log mostra:
| Campo | Descrição |
|---|---|
| Severidade | Barra codificada por cores (veja abaixo) |
| Carimbo de data/hora | Hora da solicitação (formato local) |
| Mensagem | Conteúdo do log |
| Informações HTTP | Código de status e latência (se aplicável) |
Filtre logs por severidade usando os botões de filtro:
| Nível | Cor | Descrição |
|---|---|---|
| DEBUG | Cinza | Mensagens de depuração |
| INFO | Azul | Solicitações normais |
| WARNING | Amarelo | Problemas não críticos |
| ERROR | Vermelho | Solicitações com falha |
| CRITICAL | Vermelho Escuro | Falhas críticas |
A interface mostra as 20 entradas mais recentes. A API define como padrão 50 entradas por solicitação (máximo de 200).
Ao investigar erros: primeiro clique em Erros para filtrar para entradas ERROR e WARNING, depois revise os carimbos de data/hora e os códigos de status HTTP. Copie os logs para a área de transferência para compartilhar com sua equipe.
Link to this sectionExemplos de Código#
Cada cartão de implantação inclui uma aba Code mostrando código de API pronto para uso com seu URL de endpoint real e chave de API:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Ao visualizar a aba Code na plataforma, seu URL de endpoint real e chave de API são preenchidos automaticamente. Copie o código e execute-o diretamente. Consulte Chaves de API para gerar uma chave.
Link to this sectionPrevisão de Implementação#
A guia Predict em cada cartão de implantação fornece um painel de predição integrado — a mesma interface da guia Predict do modelo, mas executando a inferência através do endpoint de implantação em vez do serviço compartilhado. Isso é útil para testar um endpoint implantado diretamente do navegador. Veja Inference para detalhes de parâmetros e formatos de resposta.
Link to this sectionEndpoints de API#
Link to this sectionVisão geral de monitoramento#
GET /api/monitoringRetorna métricas agregadas para todas as implantações de propriedade do usuário autenticado. Ciente do workspace através do parâmetro de consulta opcional owner.
Link to this sectionMétricas de implantação#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hRetorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.
| Parâmetro | Tipo | Descrição |
|---|---|---|
sparkline | bool | Incluir dados de sparkline |
range | string | Intervalo de tempo: 1h, 6h, 24h, 7d ou 30d |
Link to this sectionLogs de implantação#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGRetorna entradas de log recentes com filtro de severidade e paginação opcionais.
| Parâmetro | Tipo | Descrição |
|---|---|---|
limit | int | Número máximo de entradas para retornar (padrão: 50, máximo: 200) |
severity | string | Filtro de severidade separado por vírgula |
pageToken | string | Token de paginação da resposta anterior |
Link to this sectionSaúde da implantação#
GET /api/deployments/{deploymentId}/healthRetorna o status da verificação de saúde com latência de resposta.
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this sectionOtimização de Desempenho#
Use dados de monitoramento para otimizar suas implantações:
Se a latência estiver muito alta:
- Verifique a contagem de instâncias (pode precisar de mais)
- Verifique se o tamanho do modelo é apropriado
- Considere uma região mais próxima
- Verifique os tamanhos das imagens sendo enviadas
Mude de imgsz=1280 para imgsz=640 para um ganho de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implante em uma região mais próxima aos seus usuários para menor latência de rede.
Link to this sectionFAQ#
Link to this sectionPor quanto tempo os dados são retidos?#
| Tipo de dados | Retenção |
|---|---|
| Métricas | 30 dias |
| Logs | 7 dias |
Link to this sectionPosso configurar monitoramento externo?#
Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:
- Monitoramento de tempo de atividade (Pingdom, UptimeRobot)
- Ferramentas de APM (Datadog, New Relic)
- Verificações de saúde personalizadas via endpoint
/health
Link to this sectionQuão precisos são os números de latência?#
As métricas de latência medem:
- P50: Tempo médio de resposta
- P95: Percentil 95
- P99: Percentil 99
Eles representam o tempo de processamento no lado do servidor, não incluindo a latência de rede para seus usuários.
Link to this sectionPor que minhas métricas estão atrasadas?#
As métricas têm um atraso de ~2 minutos devido a:
- Pipeline de agregação de métricas
- Janelas de agregação
- Cache do painel
Para depuração em tempo real, verifique os logs, que são quase instantâneos.
Link to this sectionPosso monitorar vários endpoints juntos?#
Sim, a página de implantações mostra todos os endpoints com cartões de visão geral agregados. Use a visualização em tabela para comparar o desempenho entre as implantações.