Vai al contenuto

Endpoint Dedicati

Ultralytics consente l'implementazione di YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio single-tenant con scalabilità automatica, un URL endpoint univoco e monitoraggio indipendente.

Scheda Implementazione modello Ultralytics con mappa regionale e tabella

Crea Endpoint

Dalla scheda Distribuzione

Distribuisci un modello dal suo Deploy scheda:

  1. Naviga al tuo modello
  2. Clicca sulla scheda Deploy
  3. Seleziona una regione dalla tabella delle regioni (ordinata in base alla latenza dalla tua posizione)
  4. Fare clic su Distribuisci nella riga della regione.

Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad esempio, yolo11n-iowa).

Dalla pagina Distribuzioni

Crea una distribuzione dal globale Deploy pagina nella barra laterale:

  1. Fai clic su Nuova distribuzione
  2. Seleziona un modello dal selettore modelli
  3. Seleziona una regione dalla mappa o dalla tabella
  4. Personalizza facoltativamente il nome della distribuzione e le risorse
  5. Fai clic su Distribuisci modello

Nuova finestra di dialogo di distribuzione Ultralytics con selettore di modelli e mappa delle regioni

Ciclo di vita dell'implementazione

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Selezione della Regione

Scegli tra 43 regioni in tutto il mondo. La mappa interattiva delle regioni e la tabella mostrano:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Regioni implementate: evidenziate con un badge "Implementato"
  • Aree di distribuzione: indicatore di impulso animato
  • Evidenziazione bidirezionale: passando con il mouse sulla mappa si evidenzia la riga della tabella e viceversa.

Ultralytics Scheda Distribuzione Tabella Latenza regione ordinata per latenza

La tabella delle regioni sul modello Deploy La scheda include:

ColonnaDescrizione
LocalitàCittà e paese con icona bandiera
ZonaIdentificatore della regione
LatenzaTempo di ping misurato (mediana di 3 ping)
DistanzaDistanza dalla tua posizione in km
AzioniPulsante Distribuisci o badge di stato "Distribuito"

Nuova finestra di dialogo di distribuzione

Il New Deployment dialogo (dal globale Deploy pagina) mostra una tabella delle regioni più semplice con solo le colonne Posizione, Latenza e Seleziona.

Scegli con saggezza

Seleziona la regione più vicina ai tuoi utenti per ottenere la latenza più bassa. Utilizza il pulsante "Riesegui scansione " per misurare nuovamente la latenza dalla tua posizione attuale.

Regioni Disponibili

ZonaLocalità
us-central1Iowa, USA
us-east1Carolina del Sud, USA
us-east4Virginia settentrionale, Stati Uniti d'America
us-east5Columbus, USA
us-south1Dallas, USA
us-west1Oregon, USA
us-west2Los Angeles, USA
us-west3Salt Lake City, USA
us-west4Las Vegas, USA
northamerica-northeast1Montreal, Canada
northamerica-northeast2Toronto, Canada
nordamerica-sud1Queretaro, Messico
southamerica-east1San Paolo, Brasile
southamerica-west1Santiago, Cile
ZonaLocalità
europe-west1St. Ghislain, Belgio
europe-west2Londra, Regno Unito
europe-west3Francoforte, Germania
europe-west4Eemshaven, Paesi Bassi
europe-west6Zurigo, Svizzera
europe-west8Milano, Italia
europe-west9Parigi, Francia
europe-west10Berlino, Germania
europe-west12Torino, Italia
europe-north1Hamina, Finlandia
europa-nord2Stoccolma, Svezia
europe-central2Varsavia, Polonia
europe-southwest1Madrid, Spagna
ZonaLocalità
asia-east1Changhua, Taiwan
asia-east2Kowloon, Hong Kong
asia-northeast1Tokyo, Giappone
asia-northeast2Osaka, Giappone
asia-northeast3Seoul, Corea del Sud
asia-south1Mumbai, India
asia-south2Delhi, India
asia-southeast1Jurong West, Singapore
asia-southeast2Giacarta, Indonesia
asia-sud-est3Bangkok, Thailandia
australia-southeast1Sydney, Australia
australia-southeast2Melbourne, Australia
ZonaLocalità
africa-sud1Johannesburg, Sudafrica
me-central1Doha, Qatar
me-central2Dammam, Arabia Saudita
me-west1Tel Aviv, Israele

Configurazione dell'Endpoint

Nuova finestra di dialogo di distribuzione

Il New Deployment Il dialogo fornisce:

ImpostazioneDescrizionePredefinito
ModelloSeleziona tra i modelli completati-
RegioneRegione di deployment-
Nome distribuzioneGenerato automaticamente, modificabile-
CPUCPU (1-8)1
Memoria (GB)Allocazione memoria (1-32 GB)2

Ultralytics Nuova finestra di dialogo Implementazione Pannello Risorse ampliato

Le impostazioni delle risorse sono disponibili nella sezione Risorse, che può essere compressa. Le distribuzioni utilizzano l'impostazione predefinita "scale-to-zero" (istanze minime = 0, istanze massime = 1): paghi solo per il tempo di inferenza attivo.

Nomi generati automaticamente

Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad esempio, yolo11n-iowa). Se si distribuisce nuovamente lo stesso modello nella stessa regione, viene aggiunto un suffisso numerico (ad esempio, yolo11n-iowa-2).

Scheda Distribuzione (Distribuzione rapida)

Quando si esegue il deployment dal modello Deploy scheda, gli endpoint vengono creati con risorse predefinite (1 CPU, 2 GB di memoria) con l'opzione scale-to-zero abilitata. Il nome della distribuzione viene generato automaticamente.

Gestisci Endpoint

Modalità di visualizzazione

L'elenco delle distribuzioni supporta tre modalità di visualizzazione:

ModalitàDescrizione
CarteSchede dettagliate complete con registri, esempi di codice, pannello di previsione
CompattoGriglia di schede più piccole con metriche chiave
TabellaDataTable con colonne ordinabili e funzione di ricerca

Scheda Distribuzione Ultralytics Schede delle distribuzioni attive

Scheda di distribuzione (Visualizzazione schede)

Ogni scheda di distribuzione nella vista schede mostra:

  • Intestazione: nome, bandiera della regione, badge di stato, pulsanti Avvia/Interrompi/Elimina
  • URL endpoint: URL copiabile con collegamento alla documentazione API
  • Metriche: numero di richieste (24 ore), latenza P95, tasso di errore
  • Controllo dello stato di salute: indicatore di stato di salute in tempo reale con latenza e aggiornamento manuale
  • Schede: Logs, Code, e Predict

Il Logs La scheda mostra le voci di log recenti con filtro di gravità (Tutte / Errori). Il Code La scheda mostra esempi di codice pronto all'uso in Python, JavaScript e cURL con il tuo URL endpoint effettivo e la chiave API. Il Predict La scheda fornisce un pannello di previsione in linea per eseguire test direttamente sull'implementazione.

Stati di distribuzione

StatoDescrizione
CreazioneL'implementazione è in fase di configurazione
ImplementazioneIl contenitore sta avviandosi
ProntoL'endpoint è attivo e accetta richieste
FermarsiL'endpoint si sta spegnendo
FermatoEndpoint in pausa (nessuna fatturazione)
FallitoImplementazione non riuscita (vedere il messaggio di errore)

URL dell'Endpoint

Ogni endpoint ha un URL univoco, ad esempio:

https://predict-abc123.run.app

Ultralytics Implementazione Scheda Endpoint URL con pulsante Copia

Clicca sul pulsante Copia per copiare l'URL. Clicca sull'icona dei documenti per visualizzare la documentazione API generata automaticamente per l'endpoint.

Gestione del Ciclo di Vita

Controlla lo stato del tuo endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AzioneDescrizione
AvviaRiprendi un endpoint arrestato
ArrestaMetti in pausa l'endpoint (nessun addebito)
EliminaRimuovi permanentemente l'endpoint

Arresta Endpoint

Arresta un endpoint per sospendere la fatturazione:

  1. Fai clic sull'icona di pausa sulla scheda di distribuzione.
  2. Lo stato dell'endpoint cambia in "In arresto" e poi in "Arrestato".

Endpoint arrestati:

  • Non accettano richieste
  • Non comportano addebiti
  • Possono essere riavviati in qualsiasi momento

Elimina Endpoint

Rimuovi permanentemente un endpoint:

  1. Fai clic sull'icona Elimina (cestino) sulla scheda di distribuzione.
  2. Conferma l'eliminazione nella finestra di dialogo

Azione Permanente

L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.

Utilizzo degli Endpoint

Autenticazione

Ogni distribuzione viene creata con una chiave API dal tuo account. Includila nelle richieste:

Authorization: Bearer YOUR_API_KEY

Il prefisso della chiave API è visualizzato nel piè di pagina della scheda di distribuzione per consentirne l'identificazione. Genera le chiavi da Chiavi API.

Nessun limite di velocità

Gli endpoint dedicati non sono soggetti ai limiti di frequenza dell'API della piattaforma. Le richieste vengono inviate direttamente al servizio dedicato, quindi la velocità effettiva è limitata solo dalla CPU, dalla memoria e dalla configurazione di scalabilità dell'endpoint. Questo è un vantaggio fondamentale rispetto all'inferenza condivisa, che ha un limite di frequenza di 20 richieste al minuto per chiave API.

Esempio di Richiesta

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Parametri della richiesta

ParametroTipoPredefinitoDescrizione
filefile-File immagine (obbligatorio)
conffloat0.25Soglia minima di confidenza
ioufloat0.7Soglia IoU NMS
imgszint640Dimensione dell'immagine di input
normalizestring-Restituisce le coordinate normalizzate

Formato della Risposta

Uguale all'inferenza condivisa con campi specifici per l'attività.

Prezzi

Gli endpoint dedicati vengono fatturati in base a:

ComponenteTariffa
CPUPer vCPU-secondo
MemoriaPer GB-secondo
RichiestePer milione di richieste

Ottimizzazione dei Costi

  • Utilizzare lo scale-to-zero per gli endpoint di sviluppo
  • Impostare un numero massimo di istanze appropriato
  • Monitorare l'utilizzo nella dashboard di Monitoring
  • Controlla i costi in Impostazioni > Fatturazione

FAQ

Quanti endpoint posso creare?

I limiti degli endpoint dipendono dal piano:

  • Gratuito: fino a 3 implementazioni
  • Pro: fino a 10 implementazioni
  • Azienda: distribuzioni illimitate

Ogni modello può comunque essere distribuito in più regioni entro la quota prevista dal piano.

Posso cambiare la regione dopo il deployment?

No, le regioni sono fisse. Per cambiare regione:

  1. Eliminare l'endpoint esistente
  2. Creare un nuovo endpoint nella regione desiderata

Come gestisco il deployment multi-regione?

Per una copertura globale:

  1. Effettuare il deploy in più regioni
  2. Utilizzare un load balancer o il routing DNS
  3. Instradare gli utenti all'endpoint più vicino

Qual è il tempo di cold start?

Il tempo di avvio a freddo dipende dalle dimensioni del modello e dal fatto che il contenitore sia già memorizzato nella cache nella regione. Intervalli tipici:

ScenarioAvvio a freddo
Contenitore memorizzato nella cache~5-15 secondi
Prima distribuzione/regione~15-45 secondi

Il controllo dello stato di salute utilizza un timeout di 55 secondi per adattarsi ai casi peggiori di avvio a freddo.

Posso usare domini personalizzati?

I domini personalizzati saranno disponibili a breve. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.



📅 Creato 1 mese fa ✏️ Aggiornato 5 giorni fa
glenn-jochersergiuwaxmann

Commenti