Endpoint Dedicati
La piattaforma Ultralytics consente il deployment di modelli YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con auto-scaling, un URL di endpoint unico e monitoraggio indipendente.

Crea Endpoint
Dalla scheda Deploy
Implementa un modello dal suo Deploy scheda:
- Naviga al tuo modello
- Clicca sulla scheda Deploy
- Selezionare una regione dalla tabella delle regioni (ordinata per latenza dalla tua posizione).
- Clicca Distribuisci sulla riga della regione
Il nome del deployment viene generato automaticamente dal nome del modello e dalla città della regione (es., yolo11n-iowa).
Dalla pagina dei Deployments
Crea un deployment dal globale Deploy pagina nella barra laterale:
- Clicca Nuova Distribuzione
- Selezionare un modello dal selettore di modelli.
- Selezionare una regione dalla mappa o dalla tabella.
- Personalizza opzionalmente il nome e le risorse del deployment
- Clicca Distribuisci Modello

Ciclo di Vita del Deployment
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
Selezione della Regione
Scegli tra 43 regioni in tutto il mondo. La mappa e la tabella interattive delle regioni mostrano:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- Regioni distribuite: Evidenziate con un badge "Deployed"
- Regioni in fase di distribuzione: Indicatore a impulsi animato
- Evidenziazione bidirezionale: passando con il mouse sulla mappa si evidenzia la riga della tabella e viceversa.

La tabella delle regioni sul modello Deploy scheda include:
| Colonna | Descrizione |
|---|---|
| Località | Città e paese con icona bandiera |
| Zona | Identificatore della regione |
| Latenza | Tempo di ping misurato (mediana di 3 ping) |
| Distanza | Distanza dalla tua posizione in km |
| Azioni | Pulsante Deploy o badge di stato "Deployed" |
Nuova finestra di dialogo di deployment
Il New Deployment dialog (dal globale Deploy pagina) mostra una tabella delle regioni più semplice con solo le colonne Posizione, Latenza e Seleziona.
Scegli con saggezza
Seleziona la regione più vicina ai tuoi utenti per la latenza più bassa. Utilizza il pulsante Rescan per misurare nuovamente la latenza dalla tua posizione attuale.
Regioni Disponibili
| Zona | Località |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | Carolina del Sud, USA |
| us-east4 | Virginia Settentrionale, USA |
| us-east5 | Columbus, USA |
| us-south1 | Dallas, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| northamerica-northeast1 | Montreal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| northamerica-south1 | Querétaro, Messico |
| southamerica-east1 | San Paolo, Brasile |
| southamerica-west1 | Santiago, Cile |
| Zona | Località |
|---|---|
| europe-west1 | St. Ghislain, Belgio |
| europe-west2 | Londra, Regno Unito |
| europe-west3 | Francoforte, Germania |
| europe-west4 | Eemshaven, Paesi Bassi |
| europe-west6 | Zurigo, Svizzera |
| europe-west8 | Milano, Italia |
| europe-west9 | Parigi, Francia |
| europe-west10 | Berlino, Germania |
| europe-west12 | Torino, Italia |
| europe-north1 | Hamina, Finlandia |
| europe-north2 | Stoccolma, Svezia |
| europe-central2 | Varsavia, Polonia |
| europe-southwest1 | Madrid, Spagna |
| Zona | Località |
|---|---|
| asia-east1 | Changhua, Taiwan |
| asia-east2 | Kowloon, Hong Kong |
| asia-northeast1 | Tokyo, Giappone |
| asia-northeast2 | Osaka, Giappone |
| asia-northeast3 | Seoul, Corea del Sud |
| asia-south1 | Mumbai, India |
| asia-south2 | Delhi, India |
| asia-southeast1 | Jurong West, Singapore |
| asia-southeast2 | Giacarta, Indonesia |
| asia-sudest3 | Bangkok, Thailandia |
| australia-southeast1 | Sydney, Australia |
| australia-southeast2 | Melbourne, Australia |
| Zona | Località |
|---|---|
| africa-south1 | Johannesburg, Sudafrica |
| me-central1 | Doha, Qatar |
| me-central2 | Dammam, Arabia Saudita |
| me-west1 | Tel Aviv, Israele |
Configurazione dell'Endpoint
Nuova finestra di dialogo di deployment
Il New Deployment il dialog fornisce:
| Impostazione | Descrizione | Predefinito |
|---|---|---|
| Modello | Seleziona tra i modelli completati | - |
| Regione | Regione di deployment | - |
| Nome del Deployment | Generato automaticamente, modificabile | - |
| Core CPU | Allocazione CPU (1-8) | 1 |
| Memoria (GB) | Allocazione della memoria (1-32 GB) | 2 |

Le impostazioni delle risorse sono disponibili nella sezione Risorse a scomparsa. I deployment utilizzano lo scale-to-zero per impostazione predefinita (min instances = 0, max instances = 1) — si paga solo per il tempo di inferenza attivo.
Nomi Generati Automaticamente
Il nome del deployment viene generato automaticamente dal nome del modello e dalla città della regione (e.g., yolo11n-iowa). Se si distribuisce lo stesso modello nella stessa regione di nuovo, viene aggiunto un suffisso numerico (es. yolo11n-iowa-2).
Scheda Deploy (Deploy Rapido)
Nel deployment dal modello Deploy scheda, gli endpoint vengono creati con risorse predefinite (1 CPU, 2 GB di memoria) con scale-to-zero abilitato. Il nome del deployment viene generato automaticamente.
Gestisci Endpoint
Modalità di visualizzazione
L'elenco dei deployment supporta tre modalità di visualizzazione:
| Modalità | Descrizione |
|---|---|
| Schede | Schede dettagliate complete con log, esempi di codice, pannello di previsione |
| Compatto | Griglia di schede più piccole con metriche chiave |
| Tabella | DataTable con colonne ordinabili e ricerca |

Scheda di Deployment (Vista a schede)
Ogni scheda di deployment nella vista a schede mostra:
- Intestazione: Nome, flag regione, badge stato, pulsanti avvio/arresto/eliminazione
- URL dell'Endpoint: URL copiabile con link alla documentazione API
- Metriche: Conteggio richieste (24h), latenza P95, tasso di errore
- Controllo dello stato: Indicatore di stato in tempo reale con latenza e aggiornamento manuale
- Schede:
Logs,Code, ePredict
Il Logs scheda mostra le voci di registro recenti con filtro per gravità (Tutti / Errori). La Code scheda mostra esempi di codice pronti all'uso in Python, JavaScript e cURL con l'URL dell'endpoint effettivo e la chiave API. La Predict scheda fornisce un pannello di previsione inline per testare direttamente sul deployment.
Stati del Deployment
| Stato | Descrizione |
|---|---|
| Creazione | Il deployment è in fase di configurazione |
| Implementazione | Il container si sta avviando |
| Pronto | L'endpoint è attivo e accetta richieste |
| Interruzione in corso | L'endpoint è in fase di spegnimento |
| Interrotto | L'endpoint è in pausa (nessun addebito) |
| Fallito | Deployment fallito (vedi messaggio di errore) |
URL dell'Endpoint
Ogni endpoint ha un URL univoco, ad esempio:
https://predict-abc123.run.app

Clicca il pulsante di copia per copiare l'URL. Clicca l'icona della documentazione per visualizzare la documentazione API auto-generata per l'endpoint.
Gestione del Ciclo di Vita
Controlla lo stato del tuo endpoint:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| Azione | Descrizione |
|---|---|
| Avvia | Riprendi un endpoint arrestato |
| Arresta | Metti in pausa l'endpoint (nessun addebito) |
| Elimina | Rimuovi permanentemente l'endpoint |
Arresta Endpoint
Arresta un endpoint per sospendere la fatturazione:
- Fai clic sull'icona di pausa sulla scheda di deployment
- Lo stato dell'endpoint cambia in "Arresto in corso" quindi "Arrestato"
Endpoint arrestati:
- Non accettano richieste
- Non comportano addebiti
- Possono essere riavviati in qualsiasi momento
Elimina Endpoint
Rimuovi permanentemente un endpoint:
- Clicca l'icona di eliminazione (cestino) sulla scheda di deployment
- Conferma l'eliminazione nella finestra di dialogo
Azione Permanente
L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.
Utilizzo degli Endpoint
Autenticazione
Ogni deployment viene creato con una chiave API dal tuo account. Includila nelle richieste:
Authorization: Bearer YOUR_API_KEY
Il prefisso della chiave API è visualizzato nel piè di pagina della scheda di deployment per l'identificazione. Genera le chiavi da API Keys.
Nessun limite di frequenza
Gli endpoint dedicati non sono soggetti ai limiti di frequenza dell'API della piattaforma. Le richieste vanno direttamente al tuo servizio dedicato, quindi il throughput è limitato solo dalla CPU, dalla memoria e dalla configurazione di scaling del tuo endpoint. Questo è un vantaggio chiave rispetto all'inferenza condivisa, che è limitata a 20 richieste/min per chiave API.
Esempio di Richiesta
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Parametri della Richiesta
| Parametro | Tipo | Predefinito | Descrizione |
|---|---|---|---|
file | file | - | File immagine (obbligatorio) |
conf | float | 0.25 | Soglia minima di confidenza |
iou | float | 0.7 | Soglia IoU NMS |
imgsz | int | 640 | Dimensione dell'immagine di input |
normalize | string | - | Restituisci coordinate normalizzate |
Formato della Risposta
Uguale all'inferenza condivisa con campi specifici per l'attività.
Prezzi
Gli endpoint dedicati vengono fatturati in base a:
| Componente | Tariffa |
|---|---|
| CPU | Per vCPU-secondo |
| Memoria | Per GB-secondo |
| Richieste | Per milione di richieste |
Ottimizzazione dei Costi
- Utilizzare lo scale-to-zero per gli endpoint di sviluppo
- Impostare un numero massimo di istanze appropriato
- Monitorare l'utilizzo nella dashboard di Monitoring
- Controlla i costi in Impostazioni > Fatturazione
FAQ
Quanti endpoint posso creare?
I limiti dell'endpoint dipendono dal piano:
- Gratuito: Fino a 3 deployment
- Pro: Fino a 10 deployment
- Enterprise: Deploy illimitati
Ogni modello può comunque essere deployato in più regioni all'interno della quota del tuo piano.
Posso cambiare la regione dopo il deployment?
No, le regioni sono fisse. Per cambiare regione:
- Eliminare l'endpoint esistente
- Creare un nuovo endpoint nella regione desiderata
Come gestisco il deployment multi-regione?
Per una copertura globale:
- Effettuare il deploy in più regioni
- Utilizzare un load balancer o il routing DNS
- Instradare gli utenti all'endpoint più vicino
Qual è il tempo di cold start?
Il tempo di avvio a freddo dipende dalle dimensioni del modello e dal fatto che il container sia già memorizzato nella cache nella regione. Intervalli tipici:
| Scenario | Avvio a freddo |
|---|---|
| Contenitore in cache | ~5-15 secondi |
| Primo deployment/regione | ~15-45 secondi |
Il controllo di integrità utilizza un timeout di 55 secondi per accomodare gli avvii a freddo nel caso peggiore.
Posso usare domini personalizzati?
I domini personalizzati saranno disponibili a breve. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.