Link to this sectionEndpoint dedicati#

Q: Quanti endpoint posso creare?

I limiti degli endpoint dipendono dal piano: - Free: Fino a 3 deployment - Pro: Fino a 10 deployment - Enterprise: Deployment illimitati Ogni modello può comunque essere distribuito in più regioni entro la quota del tuo piano.

Q: Posso cambiare regione dopo il deployment?

No, le regioni sono fisse. Per cambiare regione: 1. Elimina l'endpoint esistente 2. Crea un nuovo endpoint nella regione desiderata

Q: Come gestisco il deployment multi-regione?

Per una copertura globale: 1. Esegui il deployment in più regioni 2. Usa un bilanciatore di carico o il routing DNS 3. Indirizza gli utenti verso l'endpoint più vicino

Ultralytics Platform ti consente di distribuire modelli YOLO su endpoint dedicati in 43 regioni globali. Ogni endpoint è un servizio a tenant singolo con comportamento di scale-to-zero, un URL univoco e monitoraggio indipendente.

Ultralytics Platform Model Deploy Tab With Region Map And Table

Link to this sectionCrea Endpoint#

Link to this sectionDalla scheda Deploy#

Distribuisci un modello dalla sua scheda Deploy:

Vai al tuo modello
Fai clic sulla scheda Deploy
Seleziona una regione dalla mappa interattiva del mondo: le regioni sono codificate a colori in base alla latenza dalla tua posizione su un gradiente da verde a rosso (le regioni più veloci sono più verdi, quelle più lente sono più rosse)
Fai clic su Deploy nella riga della regione

Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad esempio, yolo26n-iowa).

Link to this sectionDalla pagina Deployments#

Crea una distribuzione dalla pagina globale Deploy nella barra laterale:

Fai clic su New Deployment
Seleziona un modello dal selettore di modelli
Seleziona una regione dalla mappa o dalla tabella
Rivedi il nome della distribuzione generato automaticamente (modificabile) e le risorse predefinite
Fai clic su Deploy Model

Ultralytics Platform New Deployment Dialog With Model Selector And Region Map

Link to this sectionCiclo di vita della distribuzione#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Link to this sectionSelezione Regione#

Scegli tra 43 regioni in tutto il mondo. La mappa interattiva delle regioni e la tabella mostrano:

Pin delle regioni: codificati a colori per latenza su un gradiente da verde a rosso (le regioni più veloci sono più verdi, quelle più lente sono più rosse)
Regioni distribuite: evidenziate con un badge "Deployed"
Regioni in fase di distribuzione: indicatore pulsante animato
Evidenziazione bidirezionale: passando il mouse sulla mappa viene evidenziata la riga della tabella e viceversa

Ultralytics Platform Deploy Tab Region Latency Table Sorted By Latency

La tabella delle regioni nella scheda Deploy del modello include:

Colonna	Descrizione
Location	Città e paese con icona della bandiera
Zone	Identificatore della regione
Latenza	Tempo di ping misurato (mediana di 3 ping)
Distance	Distanza dalla tua posizione in km
Actions	Pulsante Deploy o badge di stato "Deployed"

Finestra di dialogo New Deployment

La finestra di dialogo New Deployment (dalla pagina Deploy globale) mostra una tabella delle regioni più semplice con sole colonne Location, Latency e Select.

Scegli con saggezza

Seleziona la regione più vicina ai tuoi utenti per la latenza più bassa. Usa il pulsante Rescan per misurare nuovamente la latenza dalla tua posizione attuale.

Link to this sectionRegioni disponibili#

Zone	Posizione
us-central1	Iowa, USA
us-east1	Carolina del Sud, USA
us-east4	Virginia settentrionale, USA
us-east5	Columbus, USA
us-south1	Dallas, USA
us-west1	Oregon, USA
us-west2	Los Angeles, USA
us-west3	Salt Lake City, USA
us-west4	Las Vegas, USA
northamerica-northeast1	Montreal, Canada
northamerica-northeast2	Toronto, Canada
northamerica-south1	Queretaro, Messico
southamerica-east1	San Paolo, Brasile
southamerica-west1	Santiago, Cile

Link to this sectionConfigurazione endpoint#

Link to this sectionFinestra di dialogo New Deployment#

La finestra di dialogo New Deployment fornisce:

Impostazione	Descrizione	Predefinito
Modello	Seleziona tra i modelli completati	-
Regione	Regione del deployment	-
Nome distribuzione	Generato automaticamente, modificabile	-
Core CPU	Predefinito fisso	1
Memoria (GB)	Predefinito fisso	2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Le distribuzioni utilizzano impostazioni predefinite fisse di 1 CPU, 2 GiB di memoria, minInstances = 0 e maxInstances = 1. Si ridimensionano a zero quando sono inattive, quindi paghi solo per il tempo di inferenza attivo.

Nomi generati automaticamente

Il nome della distribuzione viene generato automaticamente dal nome del modello e dalla città della regione (ad esempio, yolo26n-iowa). Se distribuisci nuovamente lo stesso modello nella stessa regione, verrà aggiunto un suffisso numerico (ad esempio, yolo26n-iowa-2).

Link to this sectionScheda Distribuisci (Distribuzione rapida)#

Quando effettui la distribuzione dalla scheda Deploy del modello, gli endpoint vengono creati con risorse predefinite (1 CPU, 2 GB di memoria) con il ridimensionamento a zero abilitato. Il nome della distribuzione viene generato automaticamente.

Link to this sectionGestisci endpoint#

Link to this sectionModalità di visualizzazione#

L'elenco delle distribuzioni supporta tre modalità di visualizzazione:

Modalità	Descrizione
Schede	Schede con dettagli completi comprensive di log, esempi di codice e pannello di predizione
Compatta	Griglia di schede più piccole con metriche chiave
Tabella	DataTable con colonne ordinabili e ricerca

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this sectionScheda distribuzione (Vista schede)#

Ogni scheda di distribuzione nella vista a schede mostra:

Intestazione: Nome, bandiera della regione, badge di stato, pulsanti di avvio/arresto/eliminazione
URL endpoint: URL copiabile con link alla documentazione dell'API
Metriche: Conteggio richieste (24 ore), latenza P95, tasso di errore
Controllo integrità: Indicatore di stato live con latenza e aggiornamento manuale
Schede: Logs, Code e Predict

La scheda Logs mostra le voci di log recenti con filtro di gravità (Tutti / Errori). La scheda Code mostra esempi di codice pronti all'uso in Python, JavaScript e cURL con il tuo URL dell'endpoint effettivo e la chiave API. La scheda Predict fornisce un pannello di predizione integrato per i test direttamente sulla distribuzione.

Link to this sectionStati della distribuzione#

Stato	Descrizione
Creazione in corso	La distribuzione è in fase di configurazione
Distribuzione in corso	Il container è in fase di avvio
Pronto	L'endpoint è attivo e accetta richieste
Arresto in corso	L'endpoint si sta chiudendo
Arrestato	L'endpoint è in pausa (nessuna fatturazione)
Failed	Distribuzione non riuscita (vedi messaggio di errore)

Link to this sectionURL endpoint#

Ogni endpoint ha un URL univoco, ad esempio:

https://predict-abc123.run.app

Fai clic sul pulsante di copia per copiare l'URL. Fai clic sull'icona della documentazione per visualizzare la documentazione API generata automaticamente per l'endpoint.

Link to this sectionGestione del ciclo di vita#

Controlla lo stato del tuo endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff

Azione	Descrizione
Avvia	Riprendi un endpoint arrestato
Arresta	Metti in pausa l'endpoint (nessuna fatturazione)
Elimina	Rimuovi permanentemente l'endpoint

Link to this sectionArresta endpoint#

Arresta un endpoint per sospendere la fatturazione:

Fai clic sull'icona di pausa sulla scheda di distribuzione
Lo stato dell'endpoint cambia in "Arresto in corso" e poi in "Arrestato"

Endpoint arrestati:

Non accettano richieste
Non comportano costi
Possono essere riavviati in qualsiasi momento

Link to this sectionElimina endpoint#

Rimuovi permanentemente un endpoint:

Fai clic sull'icona di eliminazione (cestino) sulla scheda di distribuzione
Conferma l'eliminazione nella finestra di dialogo

Azione permanente

L'eliminazione è immediata e permanente. Puoi sempre creare un nuovo endpoint.

Link to this sectionUtilizzo degli endpoint#

Link to this sectionAutenticazione#

Ogni distribuzione viene creata con una chiave API dal tuo account. Includila nelle richieste:

Authorization: Bearer YOUR_API_KEY

Il prefisso della chiave API viene visualizzato nel piè di pagina della scheda di distribuzione per l'identificazione. Genera le chiavi da API Keys.

Link to this sectionNessun limite di frequenza#

Le richieste inviate direttamente all'URL del tuo endpoint dedicato non sono soggette ai limiti di velocità della Platform API: il throughput è limitato solo dalla configurazione di CPU, memoria e scalabilità del tuo endpoint. (Le richieste inoltrate tramite la Platform API, come quelle del tester nel browser, utilizzano comunque il limite standard di 20 richieste/min per la predizione). Questo è un vantaggio chiave rispetto all'inferenza condivisa, che è limitata a 20 richieste/min per chiave API.

Link to this sectionEsempio di richiesta#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this sectionParametri della richiesta#

Parametro	Tipo	Predefinito	Intervallo	Descrizione
`file`	file	-	-	File immagine o video (obbligatorio)
`conf`	float	0.25	0,01 – 1,0	Soglia minima di confidenza
`iou`	float	0.7	0,0 – 0,95	Soglia IoU per NMS
`imgsz`	int	640	32 – 1280	Dimensione dell'immagine in input in pixel
`normalize`	bool	false	-	Restituisci le coordinate del BBox come 0 – 1
`decimals`	int	5	0 – 10	Precisione decimale per i valori delle coordinate
`source`	stringa	-	-	URL dell'immagine o stringa base64 (alternativa a `file`)

Inferenza video

Gli endpoint dedicati accettano sia immagini che video tramite il parametro file.

Formati immagine (fino a 100 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
Formati video (fino a 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Ogni fotogramma del video viene elaborato individualmente e i risultati vengono restituiti per ogni fotogramma. Puoi anche passare un URL pubblico dell'immagine o un'immagine codificata in base64 tramite il parametro source al posto di file.

Link to this sectionFormato risposta#

Uguale all'inferenza condivisa con campi specifici per il task.

Link to this sectionPrezzi#

Gli endpoint dedicati di base sono gratuiti su tutti i piani. Le configurazioni con risorse superiori (più vCPU, più memoria, avvio a caldo) offriranno in futuro prezzi basati sull'utilizzo.

Ottimizzazione dei costi

Usa lo scale-to-zero (impostazione predefinita) affinché gli endpoint vengano eseguiti solo quando ricevono richieste
Imposta le istanze massime appropriate per il tuo traffico
Monitora l'utilizzo nella dashboard Monitoraggio

Link to this sectionFAQ#

Link to this sectionQuanti endpoint posso creare?#

I limiti degli endpoint dipendono dal piano:

Free: Fino a 3 deployment
Pro: Fino a 10 deployment
Enterprise: Deployment illimitati

Ogni modello può comunque essere distribuito in più regioni entro la quota del tuo piano.

Link to this sectionPosso cambiare regione dopo il deployment?#

No, le regioni sono fisse. Per cambiare regione:

Elimina l'endpoint esistente
Crea un nuovo endpoint nella regione desiderata

Link to this sectionCome gestisco il deployment multi-regione?#

Per una copertura globale:

Esegui il deployment in più regioni
Usa un bilanciatore di carico o il routing DNS
Indirizza gli utenti verso l'endpoint più vicino

Link to this sectionQual è il tempo di cold start?#

Il tempo di cold start dipende dalle dimensioni del modello e dal fatto che il container sia già memorizzato nella cache della regione. Intervalli tipici:

Scenario	Cold Start
Container nella cache	~5-15 secondi
Primo deployment/regione	~15-45 secondi

Il controllo dello stato utilizza un timeout di 55 secondi per gestire i casi peggiori di cold start.

Link to this sectionPosso usare domini personalizzati?#

I domini personalizzati arriveranno presto. Attualmente, gli endpoint utilizzano URL generati dalla piattaforma.

Collaboratori

GLglenn-jocher¹⁰ T-t-hakobyan¹ SEsergiuwaxmann¹

Creato 4 mesi faAggiornato 23 ore fa