Meet YOLO26: next-gen vision AI.

Link to this sectionMonitoraggio#

Ultralytics Platform fornisce il monitoraggio per gli endpoint distribuiti. Tieni traccia delle metriche delle richieste, visualizza i log e controlla lo stato di salute con il polling automatico.

Ultralytics Platform Deploy Page Overview Cards And World Map

Link to this sectionDashboard delle distribuzioni#

La pagina Deploy nella barra laterale funge da dashboard di monitoraggio per tutte le tue distribuzioni. Combina la mappa del mondo, le metriche generali e la gestione delle distribuzioni in un'unica vista. Consulta Dedicated Endpoints per creare e gestire le distribuzioni.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionSchede di panoramica#

Quattro schede di riepilogo nella parte superiore della pagina mostrano:

Ultralytics Platform Deploy Page Four Overview Cards

MetricaDescrizione
Richieste totali (24h)Richieste su tutti gli endpoint
Distribuzioni attiveEndpoint attualmente in esecuzione
Tasso di errore (24h)Percentuale di richieste fallite
Latenza P95 (24h)Tempo di risposta al 95° percentile
Avviso tasso di errore

La scheda del tasso di errore si illumina di rosso quando il tasso supera il 5%. Controlla la scheda Logs sulle singole distribuzioni per diagnosticare gli errori.

Link to this sectionMappa del mondo#

La mappa interattiva del mondo mostra:

  • Pin di regione per tutte le 43 regioni disponibili
  • Pin verdi per le regioni con distribuzioni attive
  • Pin blu animati per le regioni con distribuzioni attive in corso
  • La dimensione dei pin varia in base allo stato della distribuzione e alla latenza

Ultralytics Platform Deploy Page World Map With Deployed Regions

Link to this sectionElenco delle distribuzioni#

Sotto le schede di panoramica, l'elenco delle distribuzioni mostra tutti gli endpoint nei tuoi progetti. Usa il selettore della modalità di visualizzazione per passare tra:

VisualizzaDescrizione
SchedeSchede di dettaglio complete con schede per metriche, log, codice e previsioni
CompattaGriglia di schede più piccole (1-4 colonne) con metriche chiave
TabellaDataTable con colonne ordinabili: Nome, Regione, Stato, Richieste, P95, Errori
Aggiornamenti in tempo reale

La dashboard esegue il polling ogni 15 secondi per gli aggiornamenti dello stato della distribuzione. Quando le distribuzioni sono in uno stato transitorio (creating, deploying o stopping), il polling aumenta a ogni 3 secondi. I grafici delle metriche si aggiornano ogni 60 secondi. Clicca sul pulsante di aggiornamento per aggiornamenti immediati.

Link to this sectionMetriche per singola distribuzione#

Ogni scheda di distribuzione (nella vista schede) mostra metriche in tempo reale:

Link to this sectionRiga delle metriche#

MetricaDescrizione
RichiesteConteggio delle richieste (24h) con icona
Latenza P95Tempo di risposta al 95° percentile
Tasso di errorePercentuale di richieste fallite

Le metriche vengono recuperate dall'endpoint API sparkline e si aggiornano ogni 60 secondi.

Link to this sectionControllo Integrità#

Le distribuzioni in esecuzione mostrano un indicatore di controllo della salute:

IndicatoreSignificato
Cuore verdeSano — mostra la latenza di risposta
Cuore rossoNon sano — mostra il messaggio di errore
Icona rotanteControllo della salute in corso

I controlli di salute riprovano automaticamente ogni 20 secondi quando non sono sani. Clicca sull'icona di aggiornamento per attivare manualmente un controllo della salute. Il controllo della salute utilizza un timeout di 55 secondi per adattarsi agli avvii a freddo sugli endpoint scale-to-zero.

Ultralytics Platform Deployment Card Health Check Healthy With Latency

Tolleranza agli avvii a freddo

Il controllo della salute utilizza un timeout di 55 secondi per considerare gli avvii a freddo sugli endpoint scale-to-zero (fino a ~45 secondi nel caso peggiore). Una volta che l'endpoint si è scaldato, i controlli di salute si completano in millisecondi.

Link to this sectionLog#

Ogni scheda di distribuzione include una scheda Logs per visualizzare le voci di log recenti:

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Link to this sectionVoci di log#

Ogni voce di log mostra:

CampoDescrizione
GravitàBarra codificata a colori (vedi sotto)
TimestampOra della richiesta (formato locale)
MessaggioContenuto del log
Informazioni HTTPCodice di stato e latenza (se applicabile)

Filtra i log per gravità usando i pulsanti di filtro:

LivelloColoreDescrizione
DEBUGGrigioMessaggi di debug
INFOBluRichieste normali
WARNINGGialloProblemi non critici
ERRORRossoRichieste fallite
CRITICALRosso scuroErrori critici

L'interfaccia mostra le 20 voci più recenti. L'API imposta di default 50 voci per richiesta (massimo 200).

Flusso di lavoro di debug

Durante l'indagine sugli errori: prima clicca su Errori per filtrare sulle voci ERROR e WARNING, quindi controlla i timestamp e i codici di stato HTTP. Copia i log negli appunti per condividerli con il tuo team.

Link to this sectionEsempi di codice#

Ogni scheda di distribuzione include una scheda Code che mostra codice API pronto all'uso con il tuo URL endpoint effettivo e la chiave API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Credenziali compilate automaticamente

Quando visualizzi la scheda Code nella piattaforma, il tuo URL endpoint e la chiave API vengono compilati automaticamente. Copia il codice ed eseguilo direttamente. Consulta API Keys per generare una chiave.

Link to this sectionPrevisione su deployment#

La scheda Predict su ogni scheda di deployment fornisce un pannello di previsione integrato: la stessa interfaccia della scheda Predict del modello, ma che esegue l'inferenza tramite l'endpoint di deployment invece che tramite il servizio condiviso. Questo è utile per testare un endpoint distribuito direttamente dal browser. Consulta Inference per i dettagli sui parametri e i formati di risposta.

Link to this sectionEndpoint API#

Link to this sectionPanoramica del monitoraggio#

GET /api/monitoring

Restituisce metriche aggregate per tutti i deployment di proprietà dell'utente autenticato. Consapevole dell'area di lavoro tramite il parametro di query opzionale owner.

Link to this sectionMetriche di deployment#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Restituisce dati sparkline e metriche di riepilogo per uno specifico deployment. Intervallo di aggiornamento: 60 secondi.

ParametroTipoDescrizione
sparklineboolIncludi dati sparkline
rangestringaIntervallo di tempo: 1h, 6h, 24h, 7d o 30d

Link to this sectionLog di deployment#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Restituisce voci di log recenti con filtro di gravità opzionale e impaginazione.

ParametroTipoDescrizione
limitintNumero massimo di voci da restituire (predefinito: 50, massimo: 200)
severitystringaFiltro di gravità separato da virgole
pageTokenstringaToken di paginazione dalla risposta precedente

Link to this sectionStato di salute del deployment#

GET /api/deployments/{deploymentId}/health

Restituisce lo stato del controllo di integrità con la latenza di risposta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionOttimizzazione delle prestazioni#

Usa i dati di monitoraggio per ottimizzare i tuoi deployment:

Se la latenza è troppo elevata:

  1. Controlla il conteggio delle istanze (potresti averne bisogno di più)
  2. Verifica che la dimensione del modello sia appropriata
  3. Considera una regione più vicina
  4. Controlla le dimensioni delle immagini inviate
Riduzione della latenza

Passa da imgsz=1280 a imgsz=640 per un accelerazione di ~4x con una perdita di precisione minima per la maggior parte dei casi d'uso. Effettua il deployment in una regione più vicina ai tuoi utenti per una latenza di rete inferiore.

Link to this sectionFAQ#

Link to this sectionPer quanto tempo vengono conservati i dati?#

Tipo di datoConservazione
Metriche30 giorni
Log7 giorni

Link to this sectionPosso configurare un monitoraggio esterno?#

Sì, gli URL degli endpoint funzionano con strumenti di monitoraggio esterni:

  • Monitoraggio dell'uptime (Pingdom, UptimeRobot)
  • Strumenti APM (Datadog, New Relic)
  • Controlli di integrità personalizzati tramite l'endpoint /health

Link to this sectionQuanto sono accurati i numeri di latenza?#

Le metriche di latenza misurano:

  • P50: Tempo di risposta mediano
  • P95: 95° percentile
  • P99: 99° percentile

Questi rappresentano il tempo di elaborazione lato server, non includendo la latenza di rete verso i tuoi utenti.

Link to this sectionPerché le mie metriche sono in ritardo?#

Le metriche hanno un ritardo di ~2 minuti dovuto a:

  • Pipeline di aggregazione delle metriche
  • Finestre di aggregazione
  • Caching della dashboard

Per il debug in tempo reale, controlla i log che sono quasi istantanei.

Link to this sectionPosso monitorare più endpoint insieme?#

Sì, la pagina dei deployment mostra tutti gli endpoint con schede di panoramica aggregate. Usa la visualizzazione a tabella per confrontare le prestazioni tra i vari deployment.

Commenti