Puntos de enlace dedicados
Ultralytics Platform permite el despliegue de modelos YOLO en endpoints dedicados en 43 regiones globales. Cada endpoint es un servicio de inquilino único con comportamiento de escalado a cero, una URL de endpoint única y supervisión independiente.

Crear endpoint
Desde la pestaña de despliegue
Despliega un modelo desde su pestaña Deploy:
- Navega hasta tu modelo
- Haz clic en la pestaña Deploy
- Selecciona una región del mapa mundial interactivo: las regiones están codificadas por colores según la latencia desde tu ubicación (verde < 100ms, amarillo < 200ms, rojo > 200ms)
- Haz clic en Deploy en la fila de la región
El nombre del despliegue se genera automáticamente a partir del nombre del modelo y la ciudad de la región (por ejemplo, yolo26n-iowa).
Desde la página de despliegues
Crea un despliegue desde la página global Deploy en la barra lateral:
- Haz clic en New Deployment
- Selecciona un modelo desde el selector de modelos
- Selecciona una región desde el mapa o la tabla
- Revisa el nombre del despliegue generado automáticamente (editable) y los recursos predeterminados
- Haz clic en Deploy Model

Ciclo de vida del despliegue
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteSelección de región
Elige entre 43 regiones en todo el mundo. El mapa interactivo de regiones y la tabla muestran:
- Pines de región: codificados por colores según la latencia (verde < 100ms, amarillo < 200ms, rojo > 200ms)
- Regiones desplegadas: resaltadas con una insignia de "Deployed"
- Regiones en despliegue: indicador de pulso animado
- Resaltado bidireccional: pasar el cursor sobre el mapa resalta la fila de la tabla, y viceversa

La tabla de regiones en la pestaña Deploy del modelo incluye:
| Columna | Descripción |
|---|---|
| Ubicación | Ciudad y país con icono de bandera |
| Zona | Identificador de región |
| Latencia | Tiempo de ping medido (mediana de 3 pings) |
| Distancia | Distancia desde tu ubicación en km |
| Acciones | Botón de despliegue o insignia de estado "Deployed" |
El cuadro de diálogo New Deployment (desde la página global Deploy) muestra una tabla de regiones más sencilla con solo las columnas Ubicación, Latencia y Seleccionar.
Selecciona la región más cercana a tus usuarios para obtener la menor latencia. Usa el botón Rescan para volver a medir la latencia desde tu ubicación actual.
Regiones disponibles
| Zona | Ubicación |
|---|---|
| us-central1 | Iowa, EE. UU. |
| us-east1 | Carolina del Sur, EE. UU. |
| us-east4 | Virginia del Norte, EE. UU. |
| us-east5 | Columbus, EE. UU. |
| us-south1 | Dallas, EE. UU. |
| us-west1 | Oregón, EE. UU. |
| us-west2 | Los Ángeles, EE. UU. |
| us-west3 | Salt Lake City, EE. UU. |
| us-west4 | Las Vegas, EE. UU. |
| northamerica-northeast1 | Montreal, Canadá |
| northamerica-northeast2 | Toronto, Canadá |
| northamerica-south1 | Querétaro, México |
| southamerica-east1 | São Paulo, Brasil |
| southamerica-west1 | Santiago, Chile |
Configuración de endpoints
Cuadro de diálogo de nuevo despliegue
El cuadro de diálogo New Deployment ofrece:
| Configuración | Descripción | Predeterminado |
|---|---|---|
| Modelo | Selecciona entre modelos completados | - |
| Región | Región de despliegue | - |
| Nombre del despliegue | Generado automáticamente, editable | - |
| Núcleos de CPU | Predeterminado fijo | 1 |
| Memoria (GB) | Predeterminado fijo | 2 |

Los despliegues utilizan valores predeterminados fijos de 1 CPU, 2 GiB de memoria, minInstances = 0 y maxInstances = 1. Se reducen a cero cuando están inactivos, por lo que solo pagas por el tiempo de inferencia activo.
El nombre del despliegue se genera automáticamente a partir del nombre del modelo y la ciudad de la región (p. ej., yolo26n-iowa). Si vuelves a desplegar el mismo modelo en la misma región, se añade un sufijo numérico (p. ej., yolo26n-iowa-2).
Pestaña de despliegue (Despliegue rápido)
Al desplegar desde la pestaña Deploy del modelo, los endpoints se crean con recursos predeterminados (1 CPU, 2 GB de memoria) con el escalado a cero habilitado. El nombre del despliegue se genera automáticamente.
Gestionar endpoints
Modos de visualización
La lista de despliegues admite tres modos de visualización:
| Modo | Descripción |
|---|---|
| Tarjetas | Tarjetas detalladas con registros, ejemplos de código y panel de predicción |
| Compacta | Cuadrícula de tarjetas más pequeñas con métricas clave |
| Tabla | DataTable con columnas ordenables y búsqueda |

Tarjeta de despliegue (Vista de tarjetas)
Cada tarjeta de despliegue en la vista de tarjetas muestra:
- Encabezado: nombre, bandera de la región, distintivo de estado, botones de iniciar/detener/eliminar
- URL del endpoint: URL copiable con enlace a la documentación de la API
- Métricas: número de solicitudes (24h), latencia P95, tasa de error
- Comprobación de estado: indicador de estado en tiempo real con latencia y actualización manual
- Pestañas:
Logs,CodeyPredict
La pestaña Logs muestra las entradas de registro recientes con filtrado de gravedad (Todas / Errores). La pestaña Code muestra ejemplos de código listos para usar en Python, JavaScript y cURL con la URL de tu endpoint real y tu clave de API. La pestaña Predict proporciona un panel de predicción integrado para realizar pruebas directamente en el despliegue.
Estados del despliegue
| Estado | Descripción |
|---|---|
| Creando | El despliegue se está configurando |
| Desplegando | El contenedor se está iniciando |
| Listo | El endpoint está activo y aceptando solicitudes |
| Deteniendo | El endpoint se está cerrando |
| Detenido | El endpoint está en pausa (sin facturación) |
| Failed | El despliegue falló (consulta el mensaje de error) |
URL del endpoint
Cada endpoint tiene una URL única, por ejemplo:
https://predict-abc123.run.app

Haz clic en el botón de copia para copiar la URL. Haz clic en el icono de documentación para ver la documentación de la API generada automáticamente para el endpoint.
Gestión del ciclo de vida
Controla el estado de tu endpoint:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| Acción | Descripción |
|---|---|
| Iniciar | Reanuda un endpoint detenido |
| Detener | Pausa el endpoint (sin facturación) |
| Eliminar | Eliminar permanentemente el endpoint |
Detener endpoint
Detén un endpoint para pausar la facturación:
- Haz clic en el icono de pausa en la tarjeta de despliegue
- El estado del endpoint cambia a "Deteniendo" y luego a "Detenido"
Endpoints detenidos:
- No aceptan solicitudes
- No generan cargos
- Se pueden reiniciar en cualquier momento
Eliminar endpoint
Elimina permanentemente un endpoint:
- Haz clic en el icono de eliminar (papelera) en la tarjeta de despliegue
- Confirma la eliminación en el cuadro de diálogo
La eliminación es inmediata y permanente. Siempre puedes crear un nuevo endpoint.
Uso de endpoints
Autenticación
Cada despliegue se crea con una clave de API de tu cuenta. Inclúyela en las solicitudes:
Authorization: Bearer YOUR_API_KEYEl prefijo de la clave de API se muestra en el pie de página de la tarjeta de despliegue para su identificación. Genera claves desde API Keys.
Sin límites de tasa
Los endpoints dedicados no están sujetos a los límites de tasa de la API de la plataforma. Las solicitudes van directamente a tu servicio dedicado, por lo que el rendimiento está limitado solo por la CPU, la memoria y la configuración de escalado de tu endpoint. Esta es una ventaja clave sobre la inferencia compartida, que está limitada a 20 solicitudes/min por cada clave de API.
Ejemplo de solicitud
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Parámetros de solicitud
| Parámetro | Tipo | Predeterminado | Rango | Descripción |
|---|---|---|---|---|
file | file | - | - | Archivo de imagen o vídeo (obligatorio) |
conf | float | 0.25 | 0.01 – 1.0 | Umbral mínimo de confianza |
iou | float | 0,7 | 0.0 – 0.95 | Umbral IoU para NMS |
imgsz | int | 640 | 32 – 1280 | Tamaño de la imagen de entrada en píxeles |
normalize | bool | false | - | Devuelve las coordenadas del bbox como 0 – 1 |
decimals | int | 5 | 0 – 10 | Precisión decimal para los valores de coordenadas |
source | string | - | - | URL de la imagen o cadena base64 (alternativa a file) |
Los endpoints dedicados aceptan imágenes y vídeos a través del parámetro file.
- Formatos de imagen (hasta 50 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- Formatos de vídeo (hasta 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Cada fotograma de vídeo se procesa individualmente y los resultados se devuelven por fotograma. También puedes pasar una URL de imagen pública o una imagen codificada en base64 a través del parámetro source en lugar de file.
Formato de respuesta
Igual que la inferencia compartida con campos específicos de la tarea.
Precios
Los endpoints dedicados básicos son gratuitos en todos los planes. Las configuraciones con mayores recursos (más vCPU, más memoria, arranque en caliente) ofrecerán precios basados en el uso en el futuro.
- Usa el escalado a cero (predeterminado) para que los endpoints solo se ejecuten cuando reciban solicitudes
- Establece las instancias máximas adecuadas para tu tráfico
- Monitoriza el uso en el panel de Monitorización
Preguntas frecuentes
¿Cuántos endpoints puedo crear?
Los límites de los endpoints dependen del plan:
- Free: Hasta 3 despliegues
- Pro: Hasta 10 despliegues
- Enterprise: Despliegues ilimitados
Cada modelo puede seguir desplegándose en múltiples regiones dentro de la cuota de tu plan.
¿Puedo cambiar la región después del despliegue?
No, las regiones son fijas. Para cambiar de región:
- Elimina el endpoint existente
- Crea un nuevo endpoint en la región deseada
¿Cómo gestiono el despliegue en varias regiones?
Para cobertura global:
- Despliega en múltiples regiones
- Usa un equilibrador de carga o enrutamiento DNS
- Dirige a los usuarios al endpoint más cercano
¿Cuál es el tiempo de arranque en frío?
El tiempo de arranque en frío depende del tamaño del modelo y de si el contenedor ya está en caché en la región. Rangos típicos:
| Escenario | Arranque en frío |
|---|---|
| Contenedor en caché | ~5-15 segundos |
| Primer despliegue/región | ~15-45 segundos |
La comprobación de salud utiliza un tiempo de espera de 55 segundos para adaptarse a los peores casos de arranque en frío.
¿Puedo usar dominios personalizados?
Los dominios personalizados llegarán pronto. Actualmente, los endpoints usan URLs generadas por la plataforma.