Monitoraggio
Ultralytics Platform fornisce un monitoraggio completo per gli endpoint distribuiti. Track le metriche delle richieste, visualizza i log e analizza le prestazioni in tempo reale.
Dashboard di Monitoraggio
Accedi alla dashboard di monitoraggio globale dalla barra laterale:
- Clicca su Monitoring nella barra laterale
- Visualizza tutte le distribuzioni a colpo d'occhio
- Clicca sui singoli endpoint per i dettagli
Schede di Panoramica
| Metrica | Descrizione |
|---|---|
| Richieste Totali | Richieste su tutti gli endpoint (24h) |
| Distribuzioni Attive | Endpoint attualmente in esecuzione |
| Tasso di Errore | Percentuale di richieste fallite |
| Latenza Media | Tempo di risposta medio |
Tabella delle Distribuzioni
Visualizza tutte le distribuzioni con le metriche chiave:
| Colonna | Descrizione |
|---|---|
| Modello | Nome del modello con link |
| Regione | Regione di distribuzione con bandiera |
| Stato | Indicatore In Esecuzione/Fermato |
| Richieste | Conteggio richieste (24h) |
| Latenza | Tempo di risposta P50 |
| Errori | Conteggio errori (24h) |
| Sparkline | Visualizzazione dell'andamento del traffico |
Aggiornamenti in tempo reale
La dashboard esegue il polling ogni 30 secondi. Clicca su aggiorna per aggiornamenti immediati.
Metriche degli Endpoint
Visualizza metriche dettagliate per i singoli endpoint:
- Naviga alla scheda Deploy del tuo modello
- Clicca su un endpoint
- Visualizza il pannello delle metriche
Metriche Disponibili
| Metrica | Descrizione | Unità |
|---|---|---|
| Conteggio richieste | Richieste totali nel tempo | conteggio |
| Latenza delle richieste | Distribuzione del tempo di risposta | ms |
| Tasso di Errore | Percentuale di richieste fallite | % |
| Conteggio istanze | Istanze di container attive | conteggio |
| Utilizzo della CPU | Utilizzo del processore | % |
| Utilizzo della memoria | Consumo di RAM | MB |
Intervalli di Tempo
Seleziona l'intervallo di tempo per le metriche:
| Intervallo | Descrizione |
|---|---|
| 1h | Ultima ora |
| 6h | Ultime 6 ore |
| 24h | Ultime 24 ore (predefinito) |
| 7d | Ultimi 7 giorni |
Grafici delle Metriche
I grafici interattivi mostrano:
- Grafici a linee per le tendenze nel tempo
- Passa il mouse per i valori esatti
- Zoom per analizzare periodi specifici
Log
Visualizza i log delle richieste per il debug:
Voci di Log
Ogni voce di log mostra:
| Campo | Descrizione |
|---|---|
| Timestamp | Tempo della richiesta |
| Gravità | INFO, WARNING, ERROR |
| Messaggio | Contenuto del log |
| ID richiesta | Identificatore univoco |
Livelli di Gravità
Filtra i log per gravità:
| Livello | Colore | Descrizione |
|---|---|---|
| INFO | Blu | Richieste normali |
| WARNING | Giallo | Problemi non critici |
| ERRORE | Rosso | Richieste fallite |
Filtro Log
Filtra i log per trovare i problemi:
- Seleziona il livello di gravità
- Cerca per parola chiave
- Filtra per intervallo di tempo
Avvisi
Configura avvisi per problemi agli endpoint (prossimamente):
| Tipo di avviso | Attivatore |
|---|---|
| Tasso di Errore Elevato | Tasso di errore > soglia |
| Latenza Elevata | Latenza P95 > soglia |
| Nessuna richiesta | Zero richieste per il periodo |
| Scalabilità | Istanze alla capacità massima |
Ottimizzazione delle performance
Utilizza i dati di monitoraggio per ottimizzare:
Latenza Elevata
Se la latenza è troppo elevata:
- Verifica il numero di istanze (potrebbero esserne necessarie di più)
- Verifica che la dimensione del modello sia appropriata
- Considera una regione più vicina
- Controlla le dimensioni delle immagini inviate
Tasso di Errore Elevato
Se si verificano errori:
- Esaminare i log degli errori per i dettagli
- Verificare il formato della richiesta
- Verificare che la chiave API sia valida
- Verificare i limiti di frequenza
Problemi di Scalabilità
In caso di raggiungimento della capacità:
- Aumentare il numero massimo di istanze
- Impostare il numero minimo di istanze > 0
- Valutare l'utilizzo di più regioni
- Ottimizzare il batching delle richieste
Esporta Dati
Esportare i dati di monitoraggio per l'analisi:
- Selezionare l'intervallo di tempo
- Clicca su Esporta
- Scaricare il file CSV
L'esportazione include:
- Timestamp
- Conteggio richieste
- Metriche di latenza
- Conteggio errori
- Metriche delle istanze
FAQ
Per quanto tempo vengono conservati i dati?
| Tipo di dati | Periodo di conservazione |
|---|---|
| Metriche | 30 giorni |
| Log | 7 giorni |
| Avvisi | 90 giorni |
È possibile configurare un monitoraggio esterno?
Sì, gli URL degli endpoint funzionano con strumenti di monitoraggio esterni:
- Monitoraggio dell'uptime (Pingdom, UptimeRobot)
- Strumenti APM (Datadog, New Relic)
- Controlli di integrità personalizzati
Quanto sono accurati i valori di latenza?
Le metriche di latenza misurano:
- P50: Tempo di risposta mediano
- P95: 95° percentile
- P99: 99° percentile
Questi rappresentano il tempo di elaborazione lato server, esclusa la latenza di rete verso i tuoi utenti.
Perché le mie metriche sono in ritardo?
Le metriche hanno un ritardo di circa 2 minuti a causa di:
- Pipeline di aggregazione delle metriche
- Finestre di aggregazione
- Caching della dashboard
Per il debug in tempo reale, controlla i log che sono quasi istantanei.
È possibile monitorare più endpoint contemporaneamente?
Sì, la dashboard di monitoraggio globale mostra tutti gli endpoint. Utilizza la tabella per confrontare le prestazioni tra le diverse distribuzioni.