Monitoraggio
Ultralytics offre un monitoraggio completo degli endpoint distribuiti. Traccia le metriche delle richieste, visualizza i log e analizza le prestazioni in tempo reale.
Pannello di controllo
Accedi alla dashboard di monitoraggio globale dalla barra laterale:
- Clicca su Monitoraggio nella barra laterale
- Visualizza tutte le distribuzioni a colpo d'occhio
- Clicca sui singoli endpoint per maggiori dettagli
Schede panoramiche
| Metrica | Descrizione |
|---|---|
| Richieste totali | Richieste su tutti gli endpoint (24 ore) |
| Implementazioni attive | Endpoint attualmente in esecuzione |
| Tasso di errore | Percentuale di richieste non riuscite |
| Latenza media | Tempo medio di risposta |
Tabella delle distribuzioni
Visualizza tutte le distribuzioni con le metriche chiave:
| Colonna | Descrizione |
|---|---|
| Modello | Nome del modello con link |
| Regione | Regione implementata con flag |
| Stato | Indicatore di funzionamento/arresto |
| Richieste | Numero di richieste (24 ore) |
| Latenza | Tempo di risposta P50 |
| Errori | Numero di errori (24 ore) |
| Sparkline | Visualizzazione dell'andamento del traffico |
Aggiornamenti in tempo reale
Il dashboard esegue un sondaggio ogni 30 secondi. Clicca su Aggiorna per ottenere aggiornamenti immediati.
Metriche degli endpoint
Visualizza metriche dettagliate per singoli endpoint:
- Passa alla scheda Distribuzione del tuo modello.
- Clicca su un endpoint
- Visualizza il pannello delle metriche
Metriche disponibili
| Metrica | Descrizione | Unità |
|---|---|---|
| Numero di richieste | Richieste totali nel tempo | conteggio |
| Latenza della richiesta | Distribuzione dei tempi di risposta | ms |
| Tasso di errore | Percentuale di richieste non riuscite | % |
| Conteggio istanze | Istanze di container attive | conteggio |
| CPU | Utilizzo del processore | % |
| Utilizzo della memoria | Consumo di RAM | MB |
Intervalli di tempo
Seleziona l'intervallo di tempo per le metriche:
| Intervallo | Descrizione |
|---|---|
| 1h | Ultima ora |
| 6h | Ultime 6 ore |
| 24h | Ultime 24 ore (impostazione predefinita) |
| 7d | Ultimi 7 giorni |
Tabelle metriche
I grafici interattivi mostrano:
- Grafici lineari per le tendenze nel tempo
- Passa il mouse per visualizzare i valori esatti
- Zoom per analizzare periodi specifici
Tronchi
Visualizza i registri delle richieste per il debug:
Voci di registro
Ogni voce del registro mostra:
| Campo | Descrizione |
|---|---|
| Timestamp | Tempo di richiesta |
| Gravità | INFO, AVVISO, ERRORE |
| Messaggio | Contenuto del registro |
| ID richiesta | Identificatore univoco |
Livelli di gravità
Filtra i log in base alla gravità:
| Livello | Colore | Descrizione |
|---|---|---|
| INFO | Blu | Richieste normali |
| AVVERTENZA | Giallo | Questioni non critiche |
| ERRORE | Rosso | Richieste non riuscite |
Filtraggio dei log
Filtra i registri per individuare i problemi:
- Selezionare il livello di gravità
- Ricerca per parola chiave
- Filtra per intervallo di tempo
Avvisi
Imposta avvisi per problemi relativi agli endpoint (disponibile a breve):
| Tipo di avviso | Grilletto |
|---|---|
| Elevato tasso di errore | Tasso di errore > soglia |
| Latenza elevata | Latenza P95 > soglia |
| Nessuna richiesta | Zero richieste per il periodo |
| Scalabilità | Istanze alla massima capacità |
Ottimizzazione delle performance
Utilizza i dati di monitoraggio per ottimizzare:
Latenza elevata
Se la latenza è troppo elevata:
- Controlla il numero di istanze (potrebbero essere necessarie altre istanze)
- Verificare che le dimensioni del modello siano adeguate
- Considerare la regione più vicina
- Controlla le dimensioni delle immagini inviate
Elevato tasso di errore
Se si verificano errori:
- Controllare i registri degli errori per ulteriori dettagli.
- Controlla il formato della richiesta
- Verifica che la chiave API sia valida
- Controlla i limiti di velocità
Problemi di scalabilità
Se si raggiunge la capacità massima:
- Aumenta il numero massimo di istanze
- Imposta il numero minimo di istanze > 0
- Considerare più regioni
- Ottimizzare il raggruppamento delle richieste
Esporta dati
Esportazione dei dati di monitoraggio per l'analisi:
- Seleziona intervallo di tempo
- Clicca su Esporta
- Scarica il file CSV
L'esportazione include:
- Timestamp
- Numero di richieste
- Metriche di latenza
- Conteggio degli errori
- Metriche dell'istanza
FAQ
Per quanto tempo vengono conservati i dati?
| Tipo di dati | Ritenzione |
|---|---|
| Metriche | 30 giorni |
| Tronchi | 7 giorni |
| Avvisi | 90 giorni |
Posso impostare un monitoraggio esterno?
Sì, gli URL degli endpoint funzionano con strumenti di monitoraggio esterni:
- Monitoraggio dell'uptime (Pingdom, UptimeRobot)
- Strumenti APM (Datadog, New Relic)
- Controlli sanitari personalizzati
Quanto sono accurati i dati relativi alla latenza?
Misurazione delle metriche di latenza:
- P50: tempo di risposta mediano
- P95: 95° percentile
- P99: 99° percentile
Questi valori rappresentano il tempo di elaborazione lato server, esclusa la latenza di rete per gli utenti.
Perché i miei dati sono in ritardo?
Le metriche hanno un ritardo di circa 2 minuti dovuto a:
- Pipeline di aggregazione delle metriche
- Finestre di aggregazione
- Caching del dashboard
Per il debug in tempo reale, controlla i log che sono quasi istantanei.
Posso monitorare più endpoint contemporaneamente?
Sì, il pannello di controllo globale mostra tutti gli endpoint. Utilizza la tabella per confrontare le prestazioni tra le diverse distribuzioni.