Vai al contenuto

Endpoint dedicati

Ultralytics consente l'implementazione di YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con scalabilità automatica, URL personalizzati e monitoraggio indipendente.

Crea endpoint

Distribuisci un modello su un endpoint dedicato:

  1. Passa al tuo modello
  2. Fare clic sulla scheda Distribuzione
  3. Seleziona una regione dalla mappa
  4. Fai clic su Distribuisci

Selezione della regione

Scegli tra 43 regioni in tutto il mondo:

La mappa interattiva mostra:

  • Puntatori della regione: clicca per selezionare
  • Indicatori di latenza: Codifica a colori in base alla distanza
    • Green: <100ms
    • Giallo: 100-200 ms
    • Rosso: >200 ms

Tabella delle regioni

Visualizza tutte le regioni con i dettagli:

ColonnaDescrizione
RegioneIdentificatore della regione
PosizioneCittà/Paese
LatenzaTempo di ping misurato
StatoDisponibile/implementato

Scegli con saggezza

Seleziona la regione più vicina ai tuoi utenti per ottenere la latenza più bassa. Valuta la possibilità di distribuire il servizio in più regioni per ottenere una copertura globale.

Regioni disponibili

Americhe (15 regioni)

RegionePosizione
us-central1Iowa, Stati Uniti
us-east1Carolina del Sud, Stati Uniti
us-east4Virginia, Stati Uniti
us-east5Columbus, Stati Uniti
sud-est degli Stati UnitiDallas, Stati Uniti
us-west1Oregon, Stati Uniti
us-west2Los Angeles, Stati Uniti
us-west3Salt Lake City, Stati Uniti
us-west4Las Vegas, Stati Uniti
nordamerica-nordest1Montreal, Canada
nordamerica-nordest2Toronto, Canada
sudamerica-est1San Paolo, Brasile
sudamerica-ovest1Santiago, Cile

Europa (12 regioni)

RegionePosizione
europa-centrale2Varsavia, Polonia
europa-nord1Finlandia
europa-sud-ovest1Madrid, Spagna
europa-ovest1Belgio
europa-ovest2Londra, Regno Unito
europa-ovest3Francoforte, Germania
europa-ovest4Paesi Bassi
europa-ovest6Zurigo, Svizzera
europa-ovest8Milano, Italia
europa-ovest9Parigi, Francia
europa-ovest10Berlino, Germania
europa-ovest12Torino, Italia

Asia-Pacifico (16 regioni)

RegionePosizione
asia-est1Taiwan
asia-est2Hong Kong
asia-nordest1Tokyo, Giappone
asia-nordest2Osaka, Giappone
asia-nordest3Seoul, Corea
asia-sud1Mumbai, India
asia-sud2Delhi, India
asia-sud-est1Singapore
asia-sudest2Giacarta, Indonesia
australia-sudest1Sydney, Australia
australia-sudest2Melbourne, Australia
me-central1Doha, Qatar
me-centrale2Dammam, Arabia Saudita
me-west1Tel Aviv, Israele

Configurazione endpoint

Quando si crea un endpoint:

ImpostazioneDescrizionePredefinito
RegioneRegione di distribuzione-
Minimo di istanzeIstanze minime in esecuzione0
Istanze massimeLimite massimo di scalabilità10

Opzioni di ridimensionamento

ImpostazioneComportamento
Min = 0Riduzione a zero in caso di inattività (conveniente)
Min > 0Sempre attivo per evitare avviamenti a freddo
MassimoLimite massimo per i picchi di traffico

Avviamenti a freddo

Con min instances = 0, la prima richiesta dopo un periodo di inattività attiva un avvio a freddo (2-5 secondi). Impostare min > 0 per le applicazioni sensibili alla latenza.

Gestisci endpoint

Visualizza e gestisci i tuoi endpoint:

Dettagli endpoint

CampoDescrizione
URLEndpoint HTTPS per le richieste
RegioneRegione di distribuzione
StatoIn esecuzione, Interrotto, Distribuzione in corso
IstanzeNumero di istanze attuale/massimo

URL endpoint

Ogni endpoint ha un URL univoco:

https://model-abc123-us-central1.a.run.app

Clicca sul pulsante Copia per copiare l'URL.

Gestione del ciclo di vita

Controlla lo stato dei tuoi endpoint:

AzioneDescrizione
InizioRiprendi un endpoint interrotto
StopSospendi l'endpoint (nessuna fatturazione)
EliminaRimuovere definitivamente l'endpoint

Interrompi endpoint

Interrompere un endpoint per sospendere la fatturazione:

  1. Apri menu azioni endpoint
  2. Clicca su Stop
  3. Conferma azione

Endpoint interrotti:

  • Non accettare richieste
  • Non incorrere in spese
  • Può essere riavviato in qualsiasi momento

Elimina endpoint

Rimuovere definitivamente un endpoint:

  1. Apri menu azioni endpoint
  2. Clicca su Elimina
  3. Conferma eliminazione

Azione permanente

La cancellazione è immediata e permanente. È sempre possibile creare un nuovo endpoint.

Utilizzo degli endpoint

Autenticazione

Includi la tua chiave API nelle richieste:

Authorization: Bearer YOUR_API_KEY

Esempio di richiesta

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Formato di risposta

Come l'inferenza condivisa con campi specifici dell'attività.

Prezzi

Fatturazione dedicata degli endpoint basata su:

ComponenteTasso
CPUPer vCPU al secondo
MemoriaPer GB al secondo
RichiestePer milione di richieste

Ottimizzazione dei costi

  • Utilizzare lo zero come scala per gli endpoint di sviluppo
  • Imposta il numero massimo di istanze appropriato
  • Monitorare l'utilizzo nella dashboard di monitoraggio

FAQ

Quanti endpoint posso creare?

Non c'è un limite massimo. Ogni modello può avere endpoint in più regioni. Il numero totale di endpoint dipende dal tuo piano.

Posso cambiare la regione dopo l'implementazione?

No, le regioni sono fisse. Per cambiare regione:

  1. Elimina l'endpoint esistente
  2. Crea un nuovo endpoint nella regione desiderata

Come gestire l'implementazione multiregionale?

Per una copertura globale:

  1. Distribuzione in più regioni
  2. Utilizzare un bilanciatore di carico o il routing DNS
  3. Indirizza gli utenti al punto di arrivo più vicino

Qual è l'ora di inizio del freddo?

L'avvio a freddo varia a seconda delle dimensioni del modello:

ModelloAvvio a freddo
YOLO11n~2 secondi
YOLO11m~3 secondi
YOLO11x~5 secondi

Imposta il numero minimo di istanze > 0 per eliminare gli avvii a freddo.

Posso usare domini personalizzati?

I domini personalizzati saranno disponibili a breve. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.



📅 Creato 0 giorni fa ✏️ Aggiornato 0 giorni fa
glenn-jocher

Commenti