Monitoraggio

Ultralytics Platform fornisce il monitoraggio per gli endpoint distribuiti. Tieni traccia delle metriche delle richieste, visualizza i log e controlla lo stato di salute con il polling automatico.

Ultralytics Platform Deploy Page Overview Cards And World Map

Dashboard delle distribuzioni

La pagina Deploy nella barra laterale funge da dashboard di monitoraggio per tutte le tue distribuzioni. Combina la mappa del mondo, le metriche di panoramica e la gestione delle distribuzioni in un'unica visualizzazione. Consulta Dedicated Endpoints per creare e gestire le distribuzioni.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Schede di panoramica

Quattro schede riepilogative nella parte superiore della pagina mostrano:

Ultralytics Platform Deploy Page Four Overview Cards

MetricaDescrizione
Richieste totali (24h)Richieste su tutti gli endpoint
Distribuzioni attiveEndpoint attualmente in esecuzione
Tasso di errore (24h)Percentuale di richieste fallite
Latenza P95 (24h)95° percentile del tempo di risposta
Avviso sul tasso di errore

La scheda del tasso di errore si illumina di rosso quando il tasso supera il 5%. Controlla la scheda Logs sulle singole distribuzioni per diagnosticare gli errori.

Mappa del mondo

La mappa interattiva del mondo mostra:

  • Pin di regione per tutte le 43 regioni disponibili
  • Pin verdi per le regioni distribuite
  • Pin blu animati per le regioni con distribuzioni attive in corso
  • La dimensione del pin varia in base allo stato della distribuzione e alla latenza

Ultralytics Platform Deploy Page World Map With Deployed Regions

Elenco delle distribuzioni

Sotto le schede di panoramica, l'elenco delle distribuzioni mostra tutti gli endpoint nei tuoi progetti. Usa l'interruttore della modalità di visualizzazione per passare tra:

VistaDescrizione
SchedeSchede di dettaglio completo con schede per metriche, log, codice e previsioni
CompattaGriglia di schede più piccole (1-4 colonne) con metriche chiave
TabellaDataTable con colonne ordinabili: Nome, Regione, Stato, Richieste, P95, Errori
Aggiornamenti in tempo reale

La dashboard esegue il polling ogni 15 secondi per gli aggiornamenti sullo stato della distribuzione. Quando le distribuzioni sono in uno stato transitorio (creating, deploying o stopping), il polling aumenta a ogni 3 secondi. I grafici delle metriche si aggiornano ogni 60 secondi. Fai clic sul pulsante di aggiornamento per aggiornamenti immediati.

Metriche per singola distribuzione

Ogni scheda di distribuzione (nella vista schede) mostra metriche in tempo reale:

Riga delle metriche

MetricaDescrizione
RichiesteConteggio richieste (24h) con icona
Latenza P9595° percentile del tempo di risposta
Tasso di errorePercentuale di richieste fallite

Le metriche vengono recuperate dall'endpoint API sparkline e si aggiornano ogni 60 secondi.

Controllo integrità (Health Check)

Le distribuzioni in esecuzione mostrano un indicatore di controllo dello stato:

IndicatoreSignificato
Cuore verdeSano: mostra la latenza di risposta
Cuore rossoNon sano: mostra il messaggio di errore
Icona rotanteControllo dello stato in corso

I controlli dello stato riprovano automaticamente ogni 20 secondi quando non sono sani. Fai clic sull'icona di aggiornamento per attivare manualmente un controllo dello stato. Il controllo dello stato utilizza un timeout di 55 secondi per accogliere gli avvii a freddo sugli endpoint con scala a zero.

Ultralytics Platform Deployment Card Health Check Healthy With Latency

Tolleranza all'avvio a freddo

Il controllo dello stato utilizza un timeout di 55 secondi per tenere conto degli avvii a freddo sugli endpoint con scala a zero (fino a ~45 secondi nel caso peggiore). Una volta che l'endpoint si riscalda, i controlli dello stato vengono completati in pochi millisecondi.

Log

Ogni scheda di distribuzione include una scheda Logs per visualizzare le voci di log recenti:

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Voci di log

Ogni voce di log mostra:

CampoDescrizione
GravitàBarra codificata a colori (vedi sotto)
TimestampTempo della richiesta (formato locale)
MessaggioContenuto del log
Informazioni HTTPCodice di stato e latenza (se applicabile)

Filtra i log per gravità usando i pulsanti di filtro:

LivelloColoreDescrizione
DEBUGGrigioMessaggi di debug
INFOBluRichieste normali
WARNINGGialloProblemi non critici
ERRORRossoRichieste fallite
CRITICALRosso scuroErrori critici

L'interfaccia mostra le 20 voci più recenti. L'API imposta per impostazione predefinita 50 voci per richiesta (massimo 200).

Flusso di lavoro di debug

Quando indaghi sugli errori: prima fai clic su Errors per filtrare sulle voci ERROR e WARNING, quindi rivedi i timestamp e i codici di stato HTTP. Copia i log negli appunti per condividerli con il tuo team.

Esempi di codice

Ogni scheda di distribuzione include una scheda Code che mostra codice API pronto all'uso con il tuo URL dell'endpoint e la tua chiave API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Credenziali popolate automaticamente

Quando visualizzi la scheda Code sulla piattaforma, l'URL dell'endpoint e la chiave API vengono compilati automaticamente. Copia il codice ed eseguilo direttamente. Consulta API Keys per generare una chiave.

Predict di Deployment

La scheda Predict su ogni scheda di distribuzione offre un pannello di previsione integrato: la stessa interfaccia della scheda Predict del modello, ma che esegue l'inferenza tramite l'endpoint di distribuzione invece che con il servizio condiviso. È utile per testare un endpoint distribuito direttamente dal browser. Consulta Inference per i dettagli sui parametri e i formati di risposta.

Endpoint API

Panoramica del monitoraggio

GET /api/monitoring

Restituisce metriche aggregate per tutte le distribuzioni possedute dall'utente autenticato. Supporta la consapevolezza dell'area di lavoro tramite il parametro di query opzionale owner.

Metriche di distribuzione

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Restituisce dati sparkline e metriche di riepilogo per una specifica distribuzione. Intervallo di aggiornamento: 60 secondi.

ParametroTipoDescrizione
sparklineboolInclude dati sparkline
rangestringIntervallo temporale: 1h, 6h, 24h, 7d o 30d

Log di distribuzione

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Restituisce le voci di log recenti con filtro di gravità opzionale e paginazione.

ParametroTipoDescrizione
limitintNumero massimo di voci da restituire (predefinito: 50, massimo: 200)
severitystringFiltro di gravità separato da virgole
pageTokenstringToken di paginazione dalla risposta precedente

Stato della distribuzione

GET /api/deployments/{deploymentId}/health

Restituisce lo stato del controllo di integrità con la latenza di risposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Ottimizzazione delle Prestazioni

Usa i dati di monitoraggio per ottimizzare le tue distribuzioni:

Se la latenza è troppo elevata:

  1. Controlla il numero di istanze (potresti averne bisogno di più)
  2. Verifica che la dimensione del modello sia appropriata
  3. Considera una regione più vicina
  4. Controlla le dimensioni delle immagini inviate
Riduzione della latenza

Passa da imgsz=1280 a imgsz=640 per un accelerazione di ~4x con una perdita di precisione minima nella maggior parte dei casi d'uso. Distribuisci in una regione più vicina ai tuoi utenti per una minore latenza di rete.

FAQ

Per quanto tempo vengono conservati i dati?

Tipo di datiConservazione
Metriche30 giorni
Log7 giorni

Posso configurare un monitoraggio esterno?

Sì, gli URL degli endpoint funzionano con strumenti di monitoraggio esterni:

  • Monitoraggio dei tempi di attività (Pingdom, UptimeRobot)
  • Strumenti APM (Datadog, New Relic)
  • Controlli di integrità personalizzati tramite l'endpoint /health

Quanto sono accurati i numeri sulla latenza?

Le metriche di latenza misurano:

  • P50: tempo di risposta mediano
  • P95: 95° percentile
  • P99: 99° percentile

Questi rappresentano il tempo di elaborazione lato server, non includendo la latenza di rete verso i tuoi utenti.

Perché le mie metriche sono in ritardo?

Le metriche hanno un ritardo di ~2 minuti dovuto a:

  • Pipeline di aggregazione delle metriche
  • Finestre di aggregazione
  • Caching della dashboard

Per il debug in tempo reale, controlla i log che sono quasi istantanei.

Posso monitorare più endpoint insieme?

Sì, la pagina delle distribuzioni mostra tutti gli endpoint con schede di riepilogo aggregate. Usa la vista tabella per confrontare le prestazioni tra le varie distribuzioni.

Commenti