Endpoint Dedicati
Ultralytics Platform consente il deployment di modelli YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con auto-scaling, URL personalizzati e monitoraggio indipendente.
Crea Endpoint
Effettua il deployment di un modello su un endpoint dedicato:
- Naviga al tuo modello
- Clicca sulla scheda Deploy
- Seleziona una regione dalla mappa
- Clicca su Deploy
Selezione della Regione
Scegli tra 43 regioni in tutto il mondo:
La mappa interattiva mostra:
- Pin delle regioni: Clicca per selezionare
- Indicatori di latenza: Codificati per colore in base alla distanza
- Green: <100ms
- Giallo: 100-200ms
- Rosso: >200ms
Tabella delle regioni
Visualizza tutte le regioni con dettagli:
| Colonna | Descrizione |
|---|---|
| Regione | Identificatore della regione |
| Località | Città/paese |
| Latenza | Tempo di ping misurato |
| Stato | Disponibile/distribuito |
Scegli con saggezza
Seleziona la regione più vicina ai tuoi utenti per la latenza più bassa. Considera la distribuzione in più regioni per una copertura globale.
Regioni Disponibili
Americhe (14 regioni)
| Zona | Località |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | Carolina del Sud, USA |
| us-east4 | Virginia, USA |
| us-east5 | Ohio, Stati Uniti |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| us-south1 | Dallas, USA |
| northamerica-northeast1 | Montreal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| southamerica-east1 | São Paulo, Brasile |
| southamerica-west1 | Santiago, Cile |
Europa (12 regioni)
| Zona | Località |
|---|---|
| europe-west1 | Belgio |
| europe-west2 | Londra, Regno Unito |
| europe-west3 | Francoforte, Germania |
| europe-west4 | Paesi Bassi |
| europe-west6 | Zurigo, Svizzera |
| europe-west8 | Milano, Italia |
| europe-west9 | Parigi, Francia |
| europe-west10 | Berlino, Germania |
| europe-west12 | Torino, Italia |
| europe-north1 | Finlandia |
| europe-central2 | Varsavia, Polonia |
| europe-southwest1 | Madrid, Spagna |
Asia-Pacifico (14 regioni)
| Zona | Località |
|---|---|
| asia-east1 | Taiwan |
| asia-east2 | Hong Kong |
| asia-northeast1 | Tokyo, Giappone |
| asia-northeast2 | Osaka, Giappone |
| asia-northeast3 | Seoul, Corea del Sud |
| asia-south1 | Mumbai, India |
| asia-south2 | Delhi, India |
| asia-southeast1 | Singapore |
| asia-southeast2 | Giacarta, Indonesia |
| australia-southeast1 | Sydney, Australia |
| australia-southeast2 | Melbourne, Australia |
Medio Oriente e Africa (3 regioni)
| Zona | Località |
|---|---|
| me-central1 | Doha, Qatar |
| me-central2 | Dammam, Arabia Saudita |
| me-west1 | Tel Aviv, Israele |
Configurazione dell'Endpoint
Durante la creazione di un endpoint:
| Impostazione | Descrizione | Predefinito |
|---|---|---|
| Regione | Regione di deployment | - |
| Istanze minime | Numero minimo di istanze in esecuzione | 0 |
| Istanze massime | Limite massimo di scaling | 10 |
Opzioni di Scalabilità
| Impostazione | Comportamento |
|---|---|
| Min = 0 | Scalabilità a zero in caso di inattività (conveniente) |
| Min > 0 | Sempre attivo per evitare cold start |
| Max | Limite superiore per i picchi di traffico |
Cold Start
Con istanze minime = 0, la prima richiesta dopo un periodo di inattività attiva un cold start (2-5 secondi). Impostare min > 0 per applicazioni sensibili alla latenza.
Gestisci Endpoint
Visualizza e gestisci i tuoi endpoint:
Dettagli dell'Endpoint
| Campo | Descrizione |
|---|---|
| URL | Endpoint HTTPS per le richieste |
| Regione | Regione di deployment |
| Stato | In esecuzione, Arrestato, In deployment |
| Istanze | Conteggio istanze attuali/massime |
URL dell'Endpoint
Ogni endpoint ha un URL univoco:
https://model-abc123-us-central1.a.run.app
Clicca il pulsante di copia per copiare l'URL.
Gestione del Ciclo di Vita
Controlla lo stato del tuo endpoint:
| Azione | Descrizione |
|---|---|
| Avvia | Riprendi un endpoint arrestato |
| Arresta | Metti in pausa l'endpoint (nessun addebito) |
| Elimina | Rimuovi permanentemente l'endpoint |
Arresta Endpoint
Arresta un endpoint per sospendere la fatturazione:
- Apri il menu delle azioni dell'endpoint
- Clicca su Arresta
- Conferma azione
Endpoint arrestati:
- Non accettano richieste
- Non comportano addebiti
- Possono essere riavviati in qualsiasi momento
Elimina Endpoint
Rimuovi permanentemente un endpoint:
- Apri il menu delle azioni dell'endpoint
- Clicca su Elimina
- Conferma eliminazione
Azione Permanente
L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.
Utilizzo degli Endpoint
Autenticazione
Includi la tua chiave API nelle richieste:
Authorization: Bearer YOUR_API_KEY
Esempio di Richiesta
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Formato della Risposta
Uguale all'inferenza condivisa con campi specifici per l'attività.
Prezzi
Gli endpoint dedicati vengono fatturati in base a:
| Componente | Tariffa |
|---|---|
| CPU | Per vCPU-secondo |
| Memoria | Per GB-secondo |
| Richieste | Per milione di richieste |
Ottimizzazione dei Costi
- Utilizzare lo scale-to-zero per gli endpoint di sviluppo
- Impostare un numero massimo di istanze appropriato
- Monitorare l'utilizzo nella dashboard di Monitoring
FAQ
Quanti endpoint posso creare?
Non c'è un limite rigido. Ogni modello può avere endpoint in più regioni. Il numero totale di endpoint dipende dal tuo piano.
Posso cambiare la regione dopo il deployment?
No, le regioni sono fisse. Per cambiare regione:
- Eliminare l'endpoint esistente
- Creare un nuovo endpoint nella regione desiderata
Come gestisco il deployment multi-regione?
Per una copertura globale:
- Effettuare il deploy in più regioni
- Utilizzare un load balancer o il routing DNS
- Instradare gli utenti all'endpoint più vicino
Qual è il tempo di cold start?
Il cold start varia in base alla dimensione del modello:
| Modello | Avvio a freddo |
|---|---|
| YOLO26n | ~2 secondi |
| YOLO26m | ~3 secondi |
| YOLO26x | ~5 secondi |
Impostare min instances > 0 per eliminare gli avvii a freddo.
Posso usare domini personalizzati?
I domini personalizzati saranno disponibili a breve. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.