Endpoint Dedicati

Ultralytics Platform ti consente di distribuire modelli YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con comportamento di scale-to-zero, un URL univoco e monitoraggio indipendente.

Scheda di distribuzione del modello della piattaforma Ultralytics con mappa regionale e tabella

Crea endpoint

Dalla scheda Distribuisci

Distribuisci un modello dalla sua scheda Deploy:

  1. Vai al tuo modello
  2. Clicca sulla scheda Deploy
  3. Seleziona una regione dalla mappa interattiva del mondo — le regioni sono codificate a colori in base alla latenza dalla tua posizione (verde < 100ms, giallo < 200ms, rosso > 200ms)
  4. Clicca su Deploy nella riga della regione

Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad es., yolo26n-iowa).

Dalla pagina Distribuzioni

Crea una distribuzione dalla pagina globale Deploy nella barra laterale:

  1. Clicca su New Deployment
  2. Seleziona un modello dal selettore di modelli
  3. Seleziona una regione dalla mappa o dalla tabella
  4. Controlla il nome della distribuzione generato automaticamente (modificabile) e le risorse predefinite
  5. Clicca su Deploy Model

Finestra di dialogo Nuova distribuzione della piattaforma Ultralytics con selettore di modelli e mappa regionale

Ciclo di vita della distribuzione

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Selezione della regione

Scegli tra 43 regioni in tutto il mondo. La mappa regionale interattiva e la tabella mostrano:

  • Pin della regione: Codificati a colori in base alla latenza (verde < 100ms, giallo < 200ms, rosso > 200ms)
  • Regioni distribuite: Evidenziate con un badge "Deployed"
  • Regioni in fase di distribuzione: Indicatore a impulso animato
  • Evidenziazione bidirezionale: Passare il mouse sulla mappa evidenzia la riga della tabella e viceversa

Tabella di latenza regionale della scheda Deploy della piattaforma Ultralytics ordinata per latenza

La tabella delle regioni nella scheda Deploy del modello include:

ColonnaDescrizione
PosizioneCittà e paese con icona della bandiera
ZonaIdentificatore della regione
LatenzaTempo di ping misurato (mediana di 3 ping)
DistanzaDistanza dalla tua posizione in km
AzioniPulsante di distribuzione o badge di stato "Deployed"
Finestra di dialogo Nuova distribuzione

La finestra di dialogo New Deployment (dalla pagina globale Deploy) mostra una tabella delle regioni più semplice con solo le colonne Posizione, Latenza e Seleziona.

Scegli con saggezza

Seleziona la regione più vicina ai tuoi utenti per una latenza minima. Usa il pulsante Rescan per rimisurare la latenza dalla tua posizione attuale.

Regioni disponibili

ZonaPosizione
us-central1Iowa, USA
us-east1South Carolina, USA
us-east4Northern Virginia, USA
us-east5Columbus, USA
us-south1Dallas, USA
us-west1Oregon, USA
us-west2Los Angeles, USA
us-west3Salt Lake City, USA
us-west4Las Vegas, USA
northamerica-northeast1Montreal, Canada
northamerica-northeast2Toronto, Canada
northamerica-south1Queretaro, Messico
southamerica-east1San Paolo, Brasile
southamerica-west1Santiago, Cile

Configurazione dell'endpoint

Finestra di dialogo Nuova distribuzione

La finestra di dialogo New Deployment fornisce:

ImpostazioneDescrizionePredefinito
ModelloSeleziona tra i modelli completati-
RegioneRegione di distribuzione-
Nome della distribuzioneGenerato automaticamente, modificabile-
Core CPUPredefinito fisso1
Memoria (GB)Predefinito fisso2

Pannello risorse della finestra di dialogo New Deployment di Ultralytics Platform espanso

Le distribuzioni utilizzano impostazioni predefinite fisse di 1 CPU, 2 GiB di memoria, minInstances = 0 e maxInstances = 1. Si ridimensionano a zero quando sono inattive, quindi paghi solo per il tempo di inferenza attivo.

Nomi generati automaticamente

Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad es. yolo26n-iowa). Se distribuisci nuovamente lo stesso modello nella stessa regione, viene aggiunto un suffisso numerico (ad es. yolo26n-iowa-2).

Scheda Deploy (Distribuzione rapida)

Quando effettui la distribuzione dalla scheda Deploy del modello, gli endpoint vengono creati con risorse predefinite (1 CPU, 2 GB di memoria) con ridimensionamento a zero abilitato. Il nome della distribuzione viene generato automaticamente.

Gestione endpoint

Modalità di visualizzazione

L'elenco delle distribuzioni supporta tre modalità di visualizzazione:

ModalitàDescrizione
SchedeSchede di dettaglio completo con log, esempi di codice, pannello di predizione
CompattaGriglia di schede più piccole con metriche chiave
TabellaDataTable con colonne ordinabili e ricerca

Visualizzazione schede delle distribuzioni attive nella scheda Deploy di Ultralytics Platform

Scheda di distribuzione (Visualizzazione schede)

Ogni scheda di distribuzione nella visualizzazione a schede mostra:

  • Intestazione: Nome, bandiera della regione, badge di stato, pulsanti start/stop/elimina
  • URL endpoint: URL copiabile con link alla documentazione dell'API
  • Metriche: Conteggio richieste (24h), latenza P95, tasso di errore
  • Controllo integrità: Indicatore di stato in tempo reale con latenza e aggiornamento manuale
  • Schede: Logs, Code e Predict

La scheda Logs mostra le voci di log recenti con filtro di gravità (Tutti / Errori). La scheda Code mostra esempi di codice pronti all'uso in Python, JavaScript e cURL con il tuo URL dell'endpoint reale e la chiave API. La scheda Predict fornisce un pannello di predizione inline per testare direttamente sulla distribuzione.

Stati della distribuzione

StatoDescrizione
Creazione in corsoLa distribuzione è in fase di configurazione
Distribuzione in corsoIl container si sta avviando
ProntoL'endpoint è attivo e accetta richieste
Arresto in corsoL'endpoint si sta spegnendo
ArrestatoL'endpoint è in pausa (nessuna fatturazione)
FallitoDistribuzione fallita (vedi messaggio di errore)

URL endpoint

Ogni endpoint ha un URL univoco, ad esempio:

https://predict-abc123.run.app

URL dell'endpoint nella scheda di distribuzione di Ultralytics Platform con pulsante copia

Fai clic sul pulsante copia per copiare l'URL. Fai clic sull'icona della documentazione per visualizzare la documentazione API generata automaticamente per l'endpoint.

Gestione del ciclo di vita

Controlla lo stato del tuo endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AzioneDescrizione
AvviaRiprendi un endpoint arrestato
ArrestaMetti in pausa l'endpoint (nessuna fatturazione)
EliminaRimuovi definitivamente l'endpoint

Arresta endpoint

Arresta un endpoint per mettere in pausa la fatturazione:

  1. Fai clic sull'icona di pausa sulla scheda della distribuzione
  2. Lo stato dell'endpoint cambia in "Arresto in corso" e poi in "Arrestato"

Endpoint arrestati:

  • Non accettano richieste
  • Non comportano costi
  • Possono essere riavviati in qualsiasi momento

Elimina endpoint

Rimuovi definitivamente un endpoint:

  1. Fai clic sull'icona elimina (cestino) sulla scheda della distribuzione
  2. Conferma l'eliminazione nella finestra di dialogo
Azione permanente

L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.

Utilizzo degli endpoint

Autenticazione

Ogni distribuzione viene creata con una chiave API dal tuo account. Includila nelle richieste:

Authorization: Bearer YOUR_API_KEY

Il prefisso della chiave API viene visualizzato nel piè di pagina della scheda di distribuzione per l'identificazione. Genera le chiavi da API Keys.

Nessun limite di frequenza

Gli endpoint dedicati non sono soggetti ai limiti di frequenza della Platform API. Le richieste vengono inviate direttamente al tuo servizio dedicato, quindi il throughput è limitato solo dalla configurazione di CPU, memoria e scalabilità del tuo endpoint. Questo è un vantaggio chiave rispetto all'inferenza condivisa, che è limitata a 20 richieste/min per chiave API.

Esempio di richiesta

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Parametri di richiesta

ParametroTipoPredefinitoIntervalloDescrizione
filefile--File immagine o video (obbligatorio)
conffloat0.250.01 – 1.0Soglia minima di confidenza
ioufloat0.70.0 – 0.95Soglia IoU di NMS
imgszint64032 – 1280Dimensione dell'immagine in input in pixel
normalizeboolfalse-Restituisci le coordinate del BBox come 0 – 1
decimalsint50 – 10Precisione decimale per i valori delle coordinate
sourcestring--URL dell'immagine o stringa base64 (alternativa a file)
Inferenza video

Gli endpoint dedicati accettano sia immagini che video tramite il parametro file.

  • Formati immagine (fino a 50 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • Formati video (fino a 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Ogni fotogramma video viene elaborato singolarmente e i risultati vengono restituiti per fotogramma. Puoi anche passare un URL di immagine pubblico o un'immagine codificata in base64 tramite il parametro source invece di file.

Formato di risposta

Uguale all'inferenza condivisa con campi specifici per attività.

Prezzi

Gli endpoint dedicati di base sono gratuiti su tutti i piani. Configurazioni con risorse superiori (più vCPU, più memoria, warm start) offriranno in futuro prezzi basati sull'utilizzo.

Ottimizzazione dei costi
  • Usa lo scale-to-zero (impostazione predefinita) in modo che gli endpoint vengano eseguiti solo quando ricevono richieste
  • Imposta il numero massimo di istanze appropriato per il tuo traffico
  • Monitora l'utilizzo nella dashboard di Monitoraggio

FAQ

Quanti endpoint posso creare?

I limiti degli endpoint dipendono dal piano:

  • Free: Fino a 3 distribuzioni
  • Pro: Fino a 10 distribuzioni
  • Enterprise: Distribuzioni illimitate

Ogni modello può ancora essere distribuito in più regioni entro la tua quota di piano.

Posso cambiare la regione dopo la distribuzione?

No, le regioni sono fisse. Per cambiare regione:

  1. Elimina l'endpoint esistente
  2. Crea un nuovo endpoint nella regione desiderata

Come gestisco la distribuzione multi-regione?

Per una copertura globale:

  1. Distribuisci in più regioni
  2. Usa un bilanciatore di carico o il routing DNS
  3. Instrada gli utenti verso l'endpoint più vicino

Qual è il tempo di cold start?

Il tempo di cold start dipende dalle dimensioni del modello e dal fatto che il container sia già memorizzato nella cache della regione. Intervalli tipici:

ScenarioCold Start
Container memorizzato nella cache~5-15 secondi
Prima distribuzione/regione~15-45 secondi

Il controllo di integrità utilizza un timeout di 55 secondi per gestire i casi peggiori di cold start.

Posso usare domini personalizzati?

I domini personalizzati arriveranno presto. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.

Commenti