Endpoint Dedicati
Ultralytics Platform ti consente di distribuire modelli YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con comportamento di scale-to-zero, un URL univoco e monitoraggio indipendente.

Crea endpoint
Dalla scheda Distribuisci
Distribuisci un modello dalla sua scheda Deploy:
- Vai al tuo modello
- Clicca sulla scheda Deploy
- Seleziona una regione dalla mappa interattiva del mondo — le regioni sono codificate a colori in base alla latenza dalla tua posizione (verde < 100ms, giallo < 200ms, rosso > 200ms)
- Clicca su Deploy nella riga della regione
Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad es., yolo26n-iowa).
Dalla pagina Distribuzioni
Crea una distribuzione dalla pagina globale Deploy nella barra laterale:
- Clicca su New Deployment
- Seleziona un modello dal selettore di modelli
- Seleziona una regione dalla mappa o dalla tabella
- Controlla il nome della distribuzione generato automaticamente (modificabile) e le risorse predefinite
- Clicca su Deploy Model

Ciclo di vita della distribuzione
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteSelezione della regione
Scegli tra 43 regioni in tutto il mondo. La mappa regionale interattiva e la tabella mostrano:
- Pin della regione: Codificati a colori in base alla latenza (verde < 100ms, giallo < 200ms, rosso > 200ms)
- Regioni distribuite: Evidenziate con un badge "Deployed"
- Regioni in fase di distribuzione: Indicatore a impulso animato
- Evidenziazione bidirezionale: Passare il mouse sulla mappa evidenzia la riga della tabella e viceversa

La tabella delle regioni nella scheda Deploy del modello include:
| Colonna | Descrizione |
|---|---|
| Posizione | Città e paese con icona della bandiera |
| Zona | Identificatore della regione |
| Latenza | Tempo di ping misurato (mediana di 3 ping) |
| Distanza | Distanza dalla tua posizione in km |
| Azioni | Pulsante di distribuzione o badge di stato "Deployed" |
La finestra di dialogo New Deployment (dalla pagina globale Deploy) mostra una tabella delle regioni più semplice con solo le colonne Posizione, Latenza e Seleziona.
Seleziona la regione più vicina ai tuoi utenti per una latenza minima. Usa il pulsante Rescan per rimisurare la latenza dalla tua posizione attuale.
Regioni disponibili
| Zona | Posizione |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | South Carolina, USA |
| us-east4 | Northern Virginia, USA |
| us-east5 | Columbus, USA |
| us-south1 | Dallas, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| northamerica-northeast1 | Montreal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| northamerica-south1 | Queretaro, Messico |
| southamerica-east1 | San Paolo, Brasile |
| southamerica-west1 | Santiago, Cile |
Configurazione dell'endpoint
Finestra di dialogo Nuova distribuzione
La finestra di dialogo New Deployment fornisce:
| Impostazione | Descrizione | Predefinito |
|---|---|---|
| Modello | Seleziona tra i modelli completati | - |
| Regione | Regione di distribuzione | - |
| Nome della distribuzione | Generato automaticamente, modificabile | - |
| Core CPU | Predefinito fisso | 1 |
| Memoria (GB) | Predefinito fisso | 2 |

Le distribuzioni utilizzano impostazioni predefinite fisse di 1 CPU, 2 GiB di memoria, minInstances = 0 e maxInstances = 1. Si ridimensionano a zero quando sono inattive, quindi paghi solo per il tempo di inferenza attivo.
Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad es. yolo26n-iowa). Se distribuisci nuovamente lo stesso modello nella stessa regione, viene aggiunto un suffisso numerico (ad es. yolo26n-iowa-2).
Scheda Deploy (Distribuzione rapida)
Quando effettui la distribuzione dalla scheda Deploy del modello, gli endpoint vengono creati con risorse predefinite (1 CPU, 2 GB di memoria) con ridimensionamento a zero abilitato. Il nome della distribuzione viene generato automaticamente.
Gestione endpoint
Modalità di visualizzazione
L'elenco delle distribuzioni supporta tre modalità di visualizzazione:
| Modalità | Descrizione |
|---|---|
| Schede | Schede di dettaglio completo con log, esempi di codice, pannello di predizione |
| Compatta | Griglia di schede più piccole con metriche chiave |
| Tabella | DataTable con colonne ordinabili e ricerca |

Scheda di distribuzione (Visualizzazione schede)
Ogni scheda di distribuzione nella visualizzazione a schede mostra:
- Intestazione: Nome, bandiera della regione, badge di stato, pulsanti start/stop/elimina
- URL endpoint: URL copiabile con link alla documentazione dell'API
- Metriche: Conteggio richieste (24h), latenza P95, tasso di errore
- Controllo integrità: Indicatore di stato in tempo reale con latenza e aggiornamento manuale
- Schede:
Logs,CodeePredict
La scheda Logs mostra le voci di log recenti con filtro di gravità (Tutti / Errori). La scheda Code mostra esempi di codice pronti all'uso in Python, JavaScript e cURL con il tuo URL dell'endpoint reale e la chiave API. La scheda Predict fornisce un pannello di predizione inline per testare direttamente sulla distribuzione.
Stati della distribuzione
| Stato | Descrizione |
|---|---|
| Creazione in corso | La distribuzione è in fase di configurazione |
| Distribuzione in corso | Il container si sta avviando |
| Pronto | L'endpoint è attivo e accetta richieste |
| Arresto in corso | L'endpoint si sta spegnendo |
| Arrestato | L'endpoint è in pausa (nessuna fatturazione) |
| Fallito | Distribuzione fallita (vedi messaggio di errore) |
URL endpoint
Ogni endpoint ha un URL univoco, ad esempio:
https://predict-abc123.run.app

Fai clic sul pulsante copia per copiare l'URL. Fai clic sull'icona della documentazione per visualizzare la documentazione API generata automaticamente per l'endpoint.
Gestione del ciclo di vita
Controlla lo stato del tuo endpoint:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| Azione | Descrizione |
|---|---|
| Avvia | Riprendi un endpoint arrestato |
| Arresta | Metti in pausa l'endpoint (nessuna fatturazione) |
| Elimina | Rimuovi definitivamente l'endpoint |
Arresta endpoint
Arresta un endpoint per mettere in pausa la fatturazione:
- Fai clic sull'icona di pausa sulla scheda della distribuzione
- Lo stato dell'endpoint cambia in "Arresto in corso" e poi in "Arrestato"
Endpoint arrestati:
- Non accettano richieste
- Non comportano costi
- Possono essere riavviati in qualsiasi momento
Elimina endpoint
Rimuovi definitivamente un endpoint:
- Fai clic sull'icona elimina (cestino) sulla scheda della distribuzione
- Conferma l'eliminazione nella finestra di dialogo
L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.
Utilizzo degli endpoint
Autenticazione
Ogni distribuzione viene creata con una chiave API dal tuo account. Includila nelle richieste:
Authorization: Bearer YOUR_API_KEYIl prefisso della chiave API viene visualizzato nel piè di pagina della scheda di distribuzione per l'identificazione. Genera le chiavi da API Keys.
Nessun limite di frequenza
Gli endpoint dedicati non sono soggetti ai limiti di frequenza della Platform API. Le richieste vengono inviate direttamente al tuo servizio dedicato, quindi il throughput è limitato solo dalla configurazione di CPU, memoria e scalabilità del tuo endpoint. Questo è un vantaggio chiave rispetto all'inferenza condivisa, che è limitata a 20 richieste/min per chiave API.
Esempio di richiesta
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Parametri di richiesta
| Parametro | Tipo | Predefinito | Intervallo | Descrizione |
|---|---|---|---|---|
file | file | - | - | File immagine o video (obbligatorio) |
conf | float | 0.25 | 0.01 – 1.0 | Soglia minima di confidenza |
iou | float | 0.7 | 0.0 – 0.95 | Soglia IoU di NMS |
imgsz | int | 640 | 32 – 1280 | Dimensione dell'immagine in input in pixel |
normalize | bool | false | - | Restituisci le coordinate del BBox come 0 – 1 |
decimals | int | 5 | 0 – 10 | Precisione decimale per i valori delle coordinate |
source | string | - | - | URL dell'immagine o stringa base64 (alternativa a file) |
Gli endpoint dedicati accettano sia immagini che video tramite il parametro file.
- Formati immagine (fino a 50 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- Formati video (fino a 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Ogni fotogramma video viene elaborato singolarmente e i risultati vengono restituiti per fotogramma. Puoi anche passare un URL di immagine pubblico o un'immagine codificata in base64 tramite il parametro source invece di file.
Formato di risposta
Uguale all'inferenza condivisa con campi specifici per attività.
Prezzi
Gli endpoint dedicati di base sono gratuiti su tutti i piani. Configurazioni con risorse superiori (più vCPU, più memoria, warm start) offriranno in futuro prezzi basati sull'utilizzo.
- Usa lo scale-to-zero (impostazione predefinita) in modo che gli endpoint vengano eseguiti solo quando ricevono richieste
- Imposta il numero massimo di istanze appropriato per il tuo traffico
- Monitora l'utilizzo nella dashboard di Monitoraggio
FAQ
Quanti endpoint posso creare?
I limiti degli endpoint dipendono dal piano:
- Free: Fino a 3 distribuzioni
- Pro: Fino a 10 distribuzioni
- Enterprise: Distribuzioni illimitate
Ogni modello può ancora essere distribuito in più regioni entro la tua quota di piano.
Posso cambiare la regione dopo la distribuzione?
No, le regioni sono fisse. Per cambiare regione:
- Elimina l'endpoint esistente
- Crea un nuovo endpoint nella regione desiderata
Come gestisco la distribuzione multi-regione?
Per una copertura globale:
- Distribuisci in più regioni
- Usa un bilanciatore di carico o il routing DNS
- Instrada gli utenti verso l'endpoint più vicino
Qual è il tempo di cold start?
Il tempo di cold start dipende dalle dimensioni del modello e dal fatto che il container sia già memorizzato nella cache della regione. Intervalli tipici:
| Scenario | Cold Start |
|---|---|
| Container memorizzato nella cache | ~5-15 secondi |
| Prima distribuzione/regione | ~15-45 secondi |
Il controllo di integrità utilizza un timeout di 55 secondi per gestire i casi peggiori di cold start.
Posso usare domini personalizzati?
I domini personalizzati arriveranno presto. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.