Endpoint dedicati
Ultralytics consente l'implementazione di YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con scalabilità automatica, URL personalizzati e monitoraggio indipendente.
Crea endpoint
Distribuisci un modello su un endpoint dedicato:
- Passa al tuo modello
- Fare clic sulla scheda Distribuzione
- Seleziona una regione dalla mappa
- Fai clic su Distribuisci
Selezione della regione
Scegli tra 43 regioni in tutto il mondo:
La mappa interattiva mostra:
- Puntatori della regione: clicca per selezionare
- Indicatori di latenza: Codifica a colori in base alla distanza
- Green: <100ms
- Giallo: 100-200 ms
- Rosso: >200 ms
Tabella delle regioni
Visualizza tutte le regioni con i dettagli:
| Colonna | Descrizione |
|---|---|
| Regione | Identificatore della regione |
| Posizione | Città/Paese |
| Latenza | Tempo di ping misurato |
| Stato | Disponibile/implementato |
Scegli con saggezza
Seleziona la regione più vicina ai tuoi utenti per ottenere la latenza più bassa. Valuta la possibilità di distribuire il servizio in più regioni per ottenere una copertura globale.
Regioni disponibili
Americhe (15 regioni)
| Regione | Posizione |
|---|---|
| us-central1 | Iowa, Stati Uniti |
| us-east1 | Carolina del Sud, Stati Uniti |
| us-east4 | Virginia, Stati Uniti |
| us-east5 | Columbus, Stati Uniti |
| sud-est degli Stati Uniti | Dallas, Stati Uniti |
| us-west1 | Oregon, Stati Uniti |
| us-west2 | Los Angeles, Stati Uniti |
| us-west3 | Salt Lake City, Stati Uniti |
| us-west4 | Las Vegas, Stati Uniti |
| nordamerica-nordest1 | Montreal, Canada |
| nordamerica-nordest2 | Toronto, Canada |
| sudamerica-est1 | San Paolo, Brasile |
| sudamerica-ovest1 | Santiago, Cile |
Europa (12 regioni)
| Regione | Posizione |
|---|---|
| europa-centrale2 | Varsavia, Polonia |
| europa-nord1 | Finlandia |
| europa-sud-ovest1 | Madrid, Spagna |
| europa-ovest1 | Belgio |
| europa-ovest2 | Londra, Regno Unito |
| europa-ovest3 | Francoforte, Germania |
| europa-ovest4 | Paesi Bassi |
| europa-ovest6 | Zurigo, Svizzera |
| europa-ovest8 | Milano, Italia |
| europa-ovest9 | Parigi, Francia |
| europa-ovest10 | Berlino, Germania |
| europa-ovest12 | Torino, Italia |
Asia-Pacifico (16 regioni)
| Regione | Posizione |
|---|---|
| asia-est1 | Taiwan |
| asia-est2 | Hong Kong |
| asia-nordest1 | Tokyo, Giappone |
| asia-nordest2 | Osaka, Giappone |
| asia-nordest3 | Seoul, Corea |
| asia-sud1 | Mumbai, India |
| asia-sud2 | Delhi, India |
| asia-sud-est1 | Singapore |
| asia-sudest2 | Giacarta, Indonesia |
| australia-sudest1 | Sydney, Australia |
| australia-sudest2 | Melbourne, Australia |
| me-central1 | Doha, Qatar |
| me-centrale2 | Dammam, Arabia Saudita |
| me-west1 | Tel Aviv, Israele |
Configurazione endpoint
Quando si crea un endpoint:
| Impostazione | Descrizione | Predefinito |
|---|---|---|
| Regione | Regione di distribuzione | - |
| Minimo di istanze | Istanze minime in esecuzione | 0 |
| Istanze massime | Limite massimo di scalabilità | 10 |
Opzioni di ridimensionamento
| Impostazione | Comportamento |
|---|---|
| Min = 0 | Riduzione a zero in caso di inattività (conveniente) |
| Min > 0 | Sempre attivo per evitare avviamenti a freddo |
| Massimo | Limite massimo per i picchi di traffico |
Avviamenti a freddo
Con min instances = 0, la prima richiesta dopo un periodo di inattività attiva un avvio a freddo (2-5 secondi). Impostare min > 0 per le applicazioni sensibili alla latenza.
Gestisci endpoint
Visualizza e gestisci i tuoi endpoint:
Dettagli endpoint
| Campo | Descrizione |
|---|---|
| URL | Endpoint HTTPS per le richieste |
| Regione | Regione di distribuzione |
| Stato | In esecuzione, Interrotto, Distribuzione in corso |
| Istanze | Numero di istanze attuale/massimo |
URL endpoint
Ogni endpoint ha un URL univoco:
https://model-abc123-us-central1.a.run.app
Clicca sul pulsante Copia per copiare l'URL.
Gestione del ciclo di vita
Controlla lo stato dei tuoi endpoint:
| Azione | Descrizione |
|---|---|
| Inizio | Riprendi un endpoint interrotto |
| Stop | Sospendi l'endpoint (nessuna fatturazione) |
| Elimina | Rimuovere definitivamente l'endpoint |
Interrompi endpoint
Interrompere un endpoint per sospendere la fatturazione:
- Apri menu azioni endpoint
- Clicca su Stop
- Conferma azione
Endpoint interrotti:
- Non accettare richieste
- Non incorrere in spese
- Può essere riavviato in qualsiasi momento
Elimina endpoint
Rimuovere definitivamente un endpoint:
- Apri menu azioni endpoint
- Clicca su Elimina
- Conferma eliminazione
Azione permanente
La cancellazione è immediata e permanente. È sempre possibile creare un nuovo endpoint.
Utilizzo degli endpoint
Autenticazione
Includi la tua chiave API nelle richieste:
Authorization: Bearer YOUR_API_KEY
Esempio di richiesta
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Formato di risposta
Come l'inferenza condivisa con campi specifici dell'attività.
Prezzi
Fatturazione dedicata degli endpoint basata su:
| Componente | Tasso |
|---|---|
| CPU | Per vCPU al secondo |
| Memoria | Per GB al secondo |
| Richieste | Per milione di richieste |
Ottimizzazione dei costi
- Utilizzare lo zero come scala per gli endpoint di sviluppo
- Imposta il numero massimo di istanze appropriato
- Monitorare l'utilizzo nella dashboard di monitoraggio
FAQ
Quanti endpoint posso creare?
Non c'è un limite massimo. Ogni modello può avere endpoint in più regioni. Il numero totale di endpoint dipende dal tuo piano.
Posso cambiare la regione dopo l'implementazione?
No, le regioni sono fisse. Per cambiare regione:
- Elimina l'endpoint esistente
- Crea un nuovo endpoint nella regione desiderata
Come gestire l'implementazione multiregionale?
Per una copertura globale:
- Distribuzione in più regioni
- Utilizzare un bilanciatore di carico o il routing DNS
- Indirizza gli utenti al punto di arrivo più vicino
Qual è l'ora di inizio del freddo?
L'avvio a freddo varia a seconda delle dimensioni del modello:
| Modello | Avvio a freddo |
|---|---|
| YOLO11n | ~2 secondi |
| YOLO11m | ~3 secondi |
| YOLO11x | ~5 secondi |
Imposta il numero minimo di istanze > 0 per eliminare gli avvii a freddo.
Posso usare domini personalizzati?
I domini personalizzati saranno disponibili a breve. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.