Endpoint Dedicati
Ultralytics consente l'implementazione di YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con scalabilità automatica, un URL endpoint univoco e monitoraggio indipendente.

Crea Endpoint
Dalla scheda Distribuzione
Distribuisci un modello dal suo Deploy scheda:
- Naviga al tuo modello
- Clicca sulla scheda Deploy
- Seleziona una regione dalla tabella delle regioni (ordinata in base alla latenza dalla tua posizione)
- Fare clic su Distribuisci nella riga della regione.
Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad esempio, yolo11n-iowa).
Dalla pagina Distribuzioni
Crea una distribuzione dal globale Deploy pagina nella barra laterale:
- Fai clic su Nuova distribuzione
- Seleziona un modello dal selettore modelli
- Seleziona una regione dalla mappa o dalla tabella
- Personalizza facoltativamente il nome della distribuzione e le risorse
- Fai clic su Distribuisci modello

Ciclo di vita dell'implementazione
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
Selezione della Regione
Scegli tra 43 regioni in tutto il mondo. La mappa interattiva delle regioni e la tabella mostrano:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- Regioni implementate: evidenziate con un badge "Implementato"
- Aree di distribuzione: indicatore di impulso animato
- Evidenziazione bidirezionale: passando con il mouse sulla mappa si evidenzia la riga della tabella e viceversa.

La tabella delle regioni sul modello Deploy La scheda include:
| Colonna | Descrizione |
|---|---|
| Località | Città e paese con icona bandiera |
| Zona | Identificatore della regione |
| Latenza | Tempo di ping misurato (mediana di 3 ping) |
| Distanza | Distanza dalla tua posizione in km |
| Azioni | Pulsante Distribuisci o badge di stato "Distribuito" |
Nuova finestra di dialogo di distribuzione
Il New Deployment dialogo (dal globale Deploy pagina) mostra una tabella delle regioni più semplice con solo le colonne Posizione, Latenza e Seleziona.
Scegli con saggezza
Seleziona la regione più vicina ai tuoi utenti per ottenere la latenza più bassa. Utilizza il pulsante "Riesegui scansione " per misurare nuovamente la latenza dalla tua posizione attuale.
Regioni Disponibili
| Zona | Località |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | Carolina del Sud, USA |
| us-east4 | Virginia settentrionale, Stati Uniti d'America |
| us-east5 | Columbus, USA |
| us-south1 | Dallas, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| northamerica-northeast1 | Montreal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| nordamerica-sud1 | Queretaro, Messico |
| southamerica-east1 | San Paolo, Brasile |
| southamerica-west1 | Santiago, Cile |
| Zona | Località |
|---|---|
| europe-west1 | St. Ghislain, Belgio |
| europe-west2 | Londra, Regno Unito |
| europe-west3 | Francoforte, Germania |
| europe-west4 | Eemshaven, Paesi Bassi |
| europe-west6 | Zurigo, Svizzera |
| europe-west8 | Milano, Italia |
| europe-west9 | Parigi, Francia |
| europe-west10 | Berlino, Germania |
| europe-west12 | Torino, Italia |
| europe-north1 | Hamina, Finlandia |
| europa-nord2 | Stoccolma, Svezia |
| europe-central2 | Varsavia, Polonia |
| europe-southwest1 | Madrid, Spagna |
| Zona | Località |
|---|---|
| asia-east1 | Changhua, Taiwan |
| asia-east2 | Kowloon, Hong Kong |
| asia-northeast1 | Tokyo, Giappone |
| asia-northeast2 | Osaka, Giappone |
| asia-northeast3 | Seoul, Corea del Sud |
| asia-south1 | Mumbai, India |
| asia-south2 | Delhi, India |
| asia-southeast1 | Jurong West, Singapore |
| asia-southeast2 | Giacarta, Indonesia |
| asia-sud-est3 | Bangkok, Thailandia |
| australia-southeast1 | Sydney, Australia |
| australia-southeast2 | Melbourne, Australia |
| Zona | Località |
|---|---|
| africa-sud1 | Johannesburg, Sudafrica |
| me-central1 | Doha, Qatar |
| me-central2 | Dammam, Arabia Saudita |
| me-west1 | Tel Aviv, Israele |
Configurazione dell'Endpoint
Nuova finestra di dialogo di distribuzione
Il New Deployment Il dialogo fornisce:
| Impostazione | Descrizione | Predefinito |
|---|---|---|
| Modello | Seleziona tra i modelli completati | - |
| Regione | Regione di deployment | - |
| Nome distribuzione | Generato automaticamente, modificabile | - |
| CPU | CPU (1-8) | 1 |
| Memoria (GB) | Allocazione memoria (1-32 GB) | 2 |

Le impostazioni delle risorse sono disponibili nella sezione Risorse, che può essere compressa. Le distribuzioni utilizzano l'impostazione predefinita "scale-to-zero" (istanze minime = 0, istanze massime = 1): paghi solo per il tempo di inferenza attivo.
Nomi generati automaticamente
Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad esempio, yolo11n-iowa). Se si distribuisce nuovamente lo stesso modello nella stessa regione, viene aggiunto un suffisso numerico (ad esempio, yolo11n-iowa-2).
Scheda Distribuzione (Distribuzione rapida)
Quando si esegue il deployment dal modello Deploy scheda, gli endpoint vengono creati con risorse predefinite (1 CPU, 2 GB di memoria) con l'opzione scale-to-zero abilitata. Il nome della distribuzione viene generato automaticamente.
Gestisci Endpoint
Modalità di visualizzazione
L'elenco delle distribuzioni supporta tre modalità di visualizzazione:
| Modalità | Descrizione |
|---|---|
| Carte | Schede dettagliate complete con registri, esempi di codice, pannello di previsione |
| Compatto | Griglia di schede più piccole con metriche chiave |
| Tabella | DataTable con colonne ordinabili e funzione di ricerca |

Scheda di distribuzione (Visualizzazione schede)
Ogni scheda di distribuzione nella vista schede mostra:
- Intestazione: nome, bandiera della regione, badge di stato, pulsanti Avvia/Interrompi/Elimina
- URL endpoint: URL copiabile con collegamento alla documentazione API
- Metriche: numero di richieste (24 ore), latenza P95, tasso di errore
- Controllo dello stato di salute: indicatore di stato di salute in tempo reale con latenza e aggiornamento manuale
- Schede:
Logs,Code, ePredict
Il Logs La scheda mostra le voci di log recenti con filtro di gravità (Tutte / Errori). Il Code La scheda mostra esempi di codice pronto all'uso in Python, JavaScript e cURL con il tuo URL endpoint effettivo e la chiave API. Il Predict La scheda fornisce un pannello di previsione in linea per eseguire test direttamente sull'implementazione.
Stati di distribuzione
| Stato | Descrizione |
|---|---|
| Creazione | L'implementazione è in fase di configurazione |
| Implementazione | Il contenitore sta avviandosi |
| Pronto | L'endpoint è attivo e accetta richieste |
| Fermarsi | L'endpoint si sta spegnendo |
| Fermato | Endpoint in pausa (nessuna fatturazione) |
| Fallito | Implementazione non riuscita (vedere il messaggio di errore) |
URL dell'Endpoint
Ogni endpoint ha un URL univoco, ad esempio:
https://predict-abc123.run.app

Clicca sul pulsante Copia per copiare l'URL. Clicca sull'icona dei documenti per visualizzare la documentazione API generata automaticamente per l'endpoint.
Gestione del Ciclo di Vita
Controlla lo stato del tuo endpoint:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| Azione | Descrizione |
|---|---|
| Avvia | Riprendi un endpoint arrestato |
| Arresta | Metti in pausa l'endpoint (nessun addebito) |
| Elimina | Rimuovi permanentemente l'endpoint |
Arresta Endpoint
Arresta un endpoint per sospendere la fatturazione:
- Fai clic sull'icona di pausa sulla scheda di distribuzione.
- Lo stato dell'endpoint cambia in "In arresto" e poi in "Arrestato".
Endpoint arrestati:
- Non accettano richieste
- Non comportano addebiti
- Possono essere riavviati in qualsiasi momento
Elimina Endpoint
Rimuovi permanentemente un endpoint:
- Fai clic sull'icona Elimina (cestino) sulla scheda di distribuzione.
- Conferma l'eliminazione nella finestra di dialogo
Azione Permanente
L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.
Utilizzo degli Endpoint
Autenticazione
Ogni distribuzione viene creata con una chiave API dal tuo account. Includila nelle richieste:
Authorization: Bearer YOUR_API_KEY
Il prefisso della chiave API è visualizzato nel piè di pagina della scheda di distribuzione per consentirne l'identificazione. Genera le chiavi da Chiavi API.
Nessun limite di velocità
Gli endpoint dedicati non sono soggetti ai limiti di frequenza dell'API della piattaforma. Le richieste vengono inviate direttamente al servizio dedicato, quindi la velocità effettiva è limitata solo dalla CPU, dalla memoria e dalla configurazione di scalabilità dell'endpoint. Questo è un vantaggio fondamentale rispetto all'inferenza condivisa, che ha un limite di frequenza di 20 richieste al minuto per chiave API.
Esempio di Richiesta
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Parametri della richiesta
| Parametro | Tipo | Predefinito | Descrizione |
|---|---|---|---|
file | file | - | File immagine (obbligatorio) |
conf | float | 0.25 | Soglia minima di confidenza |
iou | float | 0.7 | Soglia IoU NMS |
imgsz | int | 640 | Dimensione dell'immagine di input |
normalize | string | - | Restituisce le coordinate normalizzate |
Formato della Risposta
Uguale all'inferenza condivisa con campi specifici per l'attività.
Prezzi
Gli endpoint dedicati vengono fatturati in base a:
| Componente | Tariffa |
|---|---|
| CPU | Per vCPU-secondo |
| Memoria | Per GB-secondo |
| Richieste | Per milione di richieste |
Ottimizzazione dei Costi
- Utilizzare lo scale-to-zero per gli endpoint di sviluppo
- Impostare un numero massimo di istanze appropriato
- Monitorare l'utilizzo nella dashboard di Monitoring
- Controlla i costi in Impostazioni > Fatturazione
FAQ
Quanti endpoint posso creare?
I limiti degli endpoint dipendono dal piano:
- Gratuito: fino a 3 implementazioni
- Pro: fino a 10 implementazioni
- Azienda: distribuzioni illimitate
Ogni modello può comunque essere distribuito in più regioni entro la quota prevista dal piano.
Posso cambiare la regione dopo il deployment?
No, le regioni sono fisse. Per cambiare regione:
- Eliminare l'endpoint esistente
- Creare un nuovo endpoint nella regione desiderata
Come gestisco il deployment multi-regione?
Per una copertura globale:
- Effettuare il deploy in più regioni
- Utilizzare un load balancer o il routing DNS
- Instradare gli utenti all'endpoint più vicino
Qual è il tempo di cold start?
Il tempo di avvio a freddo dipende dalle dimensioni del modello e dal fatto che il contenitore sia già memorizzato nella cache nella regione. Intervalli tipici:
| Scenario | Avvio a freddo |
|---|---|
| Contenitore memorizzato nella cache | ~5-15 secondi |
| Prima distribuzione/regione | ~15-45 secondi |
Il controllo dello stato di salute utilizza un timeout di 55 secondi per adattarsi ai casi peggiori di avvio a freddo.
Posso usare domini personalizzati?
I domini personalizzati saranno disponibili a breve. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.