Meet YOLO26: next-gen vision AI.

Link to this sectionMonitoramento#

A Ultralytics Platform fornece monitoramento para endpoints implantados. Acompanhe métricas de solicitação, visualize logs e verifique o status de integridade com sondagem automática.

Visão geral da página de implantação da Ultralytics Platform com cartões e mapa-múndi

Link to this sectionPainel de Implantações#

A página Deploy na barra lateral serve como painel de monitoramento para todas as suas implantações. Ela combina o mapa-múndi, métricas de visão geral e gerenciamento de implantação em uma única visualização. Consulte Endpoints Dedicados para criar e gerenciar implantações.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionCartões de Visão Geral#

Quatro cartões de resumo na parte superior da página mostram:

Quatro cartões de visão geral da página de implantação da Ultralytics Platform

MétricaDescrição
Total de Solicitações (24h)Solicitações em todos os endpoints
Implantações AtivasEndpoints em execução no momento
Taxa de Erro (24h)Porcentagem de solicitações com falha
Latência P95 (24h)Tempo de resposta no percentil 95
Alerta de Taxa de Erro

O cartão de taxa de erro fica destacado em vermelho quando a taxa excede 5%. Verifique a aba Logs em cada implantação para diagnosticar erros.

Link to this sectionMapa-Múndi#

O mapa-múndi interativo mostra:

  • Marcadores de Região para todas as 43 regiões disponíveis
  • Marcadores verdes para regiões implantadas
  • Marcadores azuis animados para regiões com implantações ativas em andamento
  • O tamanho do marcador varia conforme o status da implantação e a latência

Mapa-múndi da página de implantação da Ultralytics Platform com regiões implantadas

Link to this sectionLista de Implantações#

Abaixo dos cartões de visão geral, a lista de implantações mostra todos os endpoints em seus projetos. Use o botão de modo de visualização para alternar entre:

VerDescrição
CartõesCartões de detalhes completos com abas de métricas, logs, código e predição
CompactoGrade de cartões menores (1-4 colunas) com métricas principais
TabelaTabela de dados com colunas classificáveis: Nome, Região, Status, Solicitações, P95, Erros
Atualizações em Tempo Real

O painel consulta a cada 15 segundos atualizações de status de implantação. Quando as implantações estão em um estado de transição (creating, deploying ou stopping), a sondagem aumenta para cada 3 segundos. Os gráficos de métricas são atualizados a cada 60 segundos. Clique no botão de atualizar para atualizações imediatas.

Link to this sectionMétricas por Implantação#

Cada cartão de implantação (na visualização de cartões) mostra métricas em tempo real:

Link to this sectionLinha de Métricas#

MétricaDescrição
SolicitaçõesContagem de solicitações (24h) com ícone
Latência P95Tempo de resposta no percentil 95
Taxa de ErroPorcentagem de solicitações com falha

As métricas são buscadas no endpoint da API de sparkline e atualizadas a cada 60 segundos.

Link to this sectionVerificação de Saúde#

As implantações em execução mostram um indicador de verificação de integridade:

IndicadorSignificado
Coração verdeSaudável — mostra a latência de resposta
Coração vermelhoNão saudável — mostra a mensagem de erro
Ícone giratórioVerificação de integridade em andamento

As verificações de integridade tentam novamente automaticamente a cada 20 segundos quando não estão saudáveis. Clique no ícone de atualização para acionar manualmente uma verificação de integridade. A verificação de integridade usa um tempo limite de 55 segundos para acomodar cold starts em endpoints com escala para zero.

Cartão de implantação da Ultralytics Platform com verificação de integridade saudável e latência

Tolerância a Cold Start

A verificação de integridade usa um tempo limite de 55 segundos para contabilizar cold starts em endpoints com escala para zero (até ~45 segundos no pior caso). Assim que o endpoint aquece, as verificações de integridade são concluídas em milissegundos.

Link to this sectionLogs#

Cada cartão de implantação inclui uma aba Logs para visualizar entradas de log recentes:

Aba de logs do cartão de implantação da Ultralytics Platform com filtro de severidade

Link to this sectionEntradas de Log#

Cada entrada de log mostra:

CampoDescrição
SeveridadeBarra codificada por cores (veja abaixo)
Carimbo de data/horaHora da solicitação (formato local)
MensagemConteúdo do log
Informações HTTPCódigo de status e latência (se aplicável)

Filtre logs por severidade usando os botões de filtro:

NívelCorDescrição
DEBUGCinzaMensagens de depuração
INFOAzulSolicitações normais
WARNINGAmareloProblemas não críticos
ERRORVermelhoSolicitações com falha
CRITICALVermelho EscuroFalhas críticas

A interface mostra as 20 entradas mais recentes. A API define como padrão 50 entradas por solicitação (máximo de 200).

Fluxo de Trabalho de Depuração

Ao investigar erros: primeiro clique em Erros para filtrar para entradas ERROR e WARNING, depois revise os carimbos de data/hora e os códigos de status HTTP. Copie os logs para a área de transferência para compartilhar com sua equipe.

Link to this sectionExemplos de Código#

Cada cartão de implantação inclui uma aba Code mostrando código de API pronto para uso com seu URL de endpoint real e chave de API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Credenciais Preenchidas Automaticamente

Ao visualizar a aba Code na plataforma, seu URL de endpoint real e chave de API são preenchidos automaticamente. Copie o código e execute-o diretamente. Consulte Chaves de API para gerar uma chave.

Link to this sectionPrevisão de Implementação#

A guia Predict em cada cartão de implantação fornece um painel de predição integrado — a mesma interface da guia Predict do modelo, mas executando a inferência através do endpoint de implantação em vez do serviço compartilhado. Isso é útil para testar um endpoint implantado diretamente do navegador. Veja Inference para detalhes de parâmetros e formatos de resposta.

Link to this sectionEndpoints de API#

Link to this sectionVisão geral de monitoramento#

GET /api/monitoring

Retorna métricas agregadas para todas as implantações de propriedade do usuário autenticado. Ciente do workspace através do parâmetro de consulta opcional owner.

Link to this sectionMétricas de implantação#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Retorna dados de sparkline e métricas de resumo para uma implantação específica. Intervalo de atualização: 60 segundos.

ParâmetroTipoDescrição
sparklineboolIncluir dados de sparkline
rangestringIntervalo de tempo: 1h, 6h, 24h, 7d ou 30d

Link to this sectionLogs de implantação#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Retorna entradas de log recentes com filtro de severidade e paginação opcionais.

ParâmetroTipoDescrição
limitintNúmero máximo de entradas para retornar (padrão: 50, máximo: 200)
severitystringFiltro de severidade separado por vírgula
pageTokenstringToken de paginação da resposta anterior

Link to this sectionSaúde da implantação#

GET /api/deployments/{deploymentId}/health

Retorna o status da verificação de saúde com latência de resposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionOtimização de Desempenho#

Use dados de monitoramento para otimizar suas implantações:

Se a latência estiver muito alta:

  1. Verifique a contagem de instâncias (pode precisar de mais)
  2. Verifique se o tamanho do modelo é apropriado
  3. Considere uma região mais próxima
  4. Verifique os tamanhos das imagens sendo enviadas
Reduzindo a latência

Mude de imgsz=1280 para imgsz=640 para um ganho de velocidade de ~4x com perda mínima de precisão para a maioria dos casos de uso. Implante em uma região mais próxima aos seus usuários para menor latência de rede.

Link to this sectionFAQ#

Link to this sectionPor quanto tempo os dados são retidos?#

Tipo de dadosRetenção
Métricas30 dias
Logs7 dias

Link to this sectionPosso configurar monitoramento externo?#

Sim, URLs de endpoint funcionam com ferramentas de monitoramento externas:

  • Monitoramento de tempo de atividade (Pingdom, UptimeRobot)
  • Ferramentas de APM (Datadog, New Relic)
  • Verificações de saúde personalizadas via endpoint /health

Link to this sectionQuão precisos são os números de latência?#

As métricas de latência medem:

  • P50: Tempo médio de resposta
  • P95: Percentil 95
  • P99: Percentil 99

Eles representam o tempo de processamento no lado do servidor, não incluindo a latência de rede para seus usuários.

Link to this sectionPor que minhas métricas estão atrasadas?#

As métricas têm um atraso de ~2 minutos devido a:

  • Pipeline de agregação de métricas
  • Janelas de agregação
  • Cache do painel

Para depuração em tempo real, verifique os logs, que são quase instantâneos.

Link to this sectionPosso monitorar vários endpoints juntos?#

Sim, a página de implantações mostra todos os endpoints com cartões de visão geral agregados. Use a visualização em tabela para comparar o desempenho entre as implantações.

Comentários