Puntos de enlace dedicados

Ultralytics Platform permite el despliegue de modelos YOLO en endpoints dedicados en 43 regiones globales. Cada endpoint es un servicio de inquilino único con comportamiento de escalado a cero, una URL de endpoint única y supervisión independiente.

Pestaña de despliegue de modelos de Ultralytics Platform con mapa de regiones y tabla

Crear endpoint

Desde la pestaña de despliegue

Despliega un modelo desde su pestaña Deploy:

  1. Navega hasta tu modelo
  2. Haz clic en la pestaña Deploy
  3. Selecciona una región del mapa mundial interactivo: las regiones están codificadas por colores según la latencia desde tu ubicación (verde < 100ms, amarillo < 200ms, rojo > 200ms)
  4. Haz clic en Deploy en la fila de la región

El nombre del despliegue se genera automáticamente a partir del nombre del modelo y la ciudad de la región (por ejemplo, yolo26n-iowa).

Desde la página de despliegues

Crea un despliegue desde la página global Deploy en la barra lateral:

  1. Haz clic en New Deployment
  2. Selecciona un modelo desde el selector de modelos
  3. Selecciona una región desde el mapa o la tabla
  4. Revisa el nombre del despliegue generado automáticamente (editable) y los recursos predeterminados
  5. Haz clic en Deploy Model

Cuadro de diálogo de nuevo despliegue de Ultralytics Platform con selector de modelos y mapa de regiones

Ciclo de vida del despliegue

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Selección de región

Elige entre 43 regiones en todo el mundo. El mapa interactivo de regiones y la tabla muestran:

  • Pines de región: codificados por colores según la latencia (verde < 100ms, amarillo < 200ms, rojo > 200ms)
  • Regiones desplegadas: resaltadas con una insignia de "Deployed"
  • Regiones en despliegue: indicador de pulso animado
  • Resaltado bidireccional: pasar el cursor sobre el mapa resalta la fila de la tabla, y viceversa

Tabla de latencia de regiones de la pestaña Deploy de Ultralytics Platform ordenada por latencia

La tabla de regiones en la pestaña Deploy del modelo incluye:

ColumnaDescripción
UbicaciónCiudad y país con icono de bandera
ZonaIdentificador de región
LatenciaTiempo de ping medido (mediana de 3 pings)
DistanciaDistancia desde tu ubicación en km
AccionesBotón de despliegue o insignia de estado "Deployed"
Cuadro de diálogo de nuevo despliegue

El cuadro de diálogo New Deployment (desde la página global Deploy) muestra una tabla de regiones más sencilla con solo las columnas Ubicación, Latencia y Seleccionar.

Elige con cuidado

Selecciona la región más cercana a tus usuarios para obtener la menor latencia. Usa el botón Rescan para volver a medir la latencia desde tu ubicación actual.

Regiones disponibles

ZonaUbicación
us-central1Iowa, EE. UU.
us-east1Carolina del Sur, EE. UU.
us-east4Virginia del Norte, EE. UU.
us-east5Columbus, EE. UU.
us-south1Dallas, EE. UU.
us-west1Oregón, EE. UU.
us-west2Los Ángeles, EE. UU.
us-west3Salt Lake City, EE. UU.
us-west4Las Vegas, EE. UU.
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
northamerica-south1Querétaro, México
southamerica-east1São Paulo, Brasil
southamerica-west1Santiago, Chile

Configuración de endpoints

Cuadro de diálogo de nuevo despliegue

El cuadro de diálogo New Deployment ofrece:

ConfiguraciónDescripciónPredeterminado
ModeloSelecciona entre modelos completados-
RegiónRegión de despliegue-
Nombre del despliegueGenerado automáticamente, editable-
Núcleos de CPUPredeterminado fijo1
Memoria (GB)Predeterminado fijo2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Los despliegues utilizan valores predeterminados fijos de 1 CPU, 2 GiB de memoria, minInstances = 0 y maxInstances = 1. Se reducen a cero cuando están inactivos, por lo que solo pagas por el tiempo de inferencia activo.

Nombres generados automáticamente

El nombre del despliegue se genera automáticamente a partir del nombre del modelo y la ciudad de la región (p. ej., yolo26n-iowa). Si vuelves a desplegar el mismo modelo en la misma región, se añade un sufijo numérico (p. ej., yolo26n-iowa-2).

Pestaña de despliegue (Despliegue rápido)

Al desplegar desde la pestaña Deploy del modelo, los endpoints se crean con recursos predeterminados (1 CPU, 2 GB de memoria) con el escalado a cero habilitado. El nombre del despliegue se genera automáticamente.

Gestionar endpoints

Modos de visualización

La lista de despliegues admite tres modos de visualización:

ModoDescripción
TarjetasTarjetas detalladas con registros, ejemplos de código y panel de predicción
CompactaCuadrícula de tarjetas más pequeñas con métricas clave
TablaDataTable con columnas ordenables y búsqueda

Ultralytics Platform Deploy Tab Active Deployments Cards View

Tarjeta de despliegue (Vista de tarjetas)

Cada tarjeta de despliegue en la vista de tarjetas muestra:

  • Encabezado: nombre, bandera de la región, distintivo de estado, botones de iniciar/detener/eliminar
  • URL del endpoint: URL copiable con enlace a la documentación de la API
  • Métricas: número de solicitudes (24h), latencia P95, tasa de error
  • Comprobación de estado: indicador de estado en tiempo real con latencia y actualización manual
  • Pestañas: Logs, Code y Predict

La pestaña Logs muestra las entradas de registro recientes con filtrado de gravedad (Todas / Errores). La pestaña Code muestra ejemplos de código listos para usar en Python, JavaScript y cURL con la URL de tu endpoint real y tu clave de API. La pestaña Predict proporciona un panel de predicción integrado para realizar pruebas directamente en el despliegue.

Estados del despliegue

EstadoDescripción
CreandoEl despliegue se está configurando
DesplegandoEl contenedor se está iniciando
ListoEl endpoint está activo y aceptando solicitudes
DeteniendoEl endpoint se está cerrando
DetenidoEl endpoint está en pausa (sin facturación)
FailedEl despliegue falló (consulta el mensaje de error)

URL del endpoint

Cada endpoint tiene una URL única, por ejemplo:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

Haz clic en el botón de copia para copiar la URL. Haz clic en el icono de documentación para ver la documentación de la API generada automáticamente para el endpoint.

Gestión del ciclo de vida

Controla el estado de tu endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AcciónDescripción
IniciarReanuda un endpoint detenido
DetenerPausa el endpoint (sin facturación)
EliminarEliminar permanentemente el endpoint

Detener endpoint

Detén un endpoint para pausar la facturación:

  1. Haz clic en el icono de pausa en la tarjeta de despliegue
  2. El estado del endpoint cambia a "Deteniendo" y luego a "Detenido"

Endpoints detenidos:

  • No aceptan solicitudes
  • No generan cargos
  • Se pueden reiniciar en cualquier momento

Eliminar endpoint

Elimina permanentemente un endpoint:

  1. Haz clic en el icono de eliminar (papelera) en la tarjeta de despliegue
  2. Confirma la eliminación en el cuadro de diálogo
Acción permanente

La eliminación es inmediata y permanente. Siempre puedes crear un nuevo endpoint.

Uso de endpoints

Autenticación

Cada despliegue se crea con una clave de API de tu cuenta. Inclúyela en las solicitudes:

Authorization: Bearer YOUR_API_KEY

El prefijo de la clave de API se muestra en el pie de página de la tarjeta de despliegue para su identificación. Genera claves desde API Keys.

Sin límites de tasa

Los endpoints dedicados no están sujetos a los límites de tasa de la API de la plataforma. Las solicitudes van directamente a tu servicio dedicado, por lo que el rendimiento está limitado solo por la CPU, la memoria y la configuración de escalado de tu endpoint. Esta es una ventaja clave sobre la inferencia compartida, que está limitada a 20 solicitudes/min por cada clave de API.

Ejemplo de solicitud

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Parámetros de solicitud

ParámetroTipoPredeterminadoRangoDescripción
filefile--Archivo de imagen o vídeo (obligatorio)
conffloat0.250.01 – 1.0Umbral mínimo de confianza
ioufloat0,70.0 – 0.95Umbral IoU para NMS
imgszint64032 – 1280Tamaño de la imagen de entrada en píxeles
normalizeboolfalse-Devuelve las coordenadas del bbox como 0 – 1
decimalsint50 – 10Precisión decimal para los valores de coordenadas
sourcestring--URL de la imagen o cadena base64 (alternativa a file)
Inferencia de vídeo

Los endpoints dedicados aceptan imágenes y vídeos a través del parámetro file.

  • Formatos de imagen (hasta 50 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • Formatos de vídeo (hasta 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Cada fotograma de vídeo se procesa individualmente y los resultados se devuelven por fotograma. También puedes pasar una URL de imagen pública o una imagen codificada en base64 a través del parámetro source en lugar de file.

Formato de respuesta

Igual que la inferencia compartida con campos específicos de la tarea.

Precios

Los endpoints dedicados básicos son gratuitos en todos los planes. Las configuraciones con mayores recursos (más vCPU, más memoria, arranque en caliente) ofrecerán precios basados en el uso en el futuro.

Optimización de costes
  • Usa el escalado a cero (predeterminado) para que los endpoints solo se ejecuten cuando reciban solicitudes
  • Establece las instancias máximas adecuadas para tu tráfico
  • Monitoriza el uso en el panel de Monitorización

Preguntas frecuentes

¿Cuántos endpoints puedo crear?

Los límites de los endpoints dependen del plan:

  • Free: Hasta 3 despliegues
  • Pro: Hasta 10 despliegues
  • Enterprise: Despliegues ilimitados

Cada modelo puede seguir desplegándose en múltiples regiones dentro de la cuota de tu plan.

¿Puedo cambiar la región después del despliegue?

No, las regiones son fijas. Para cambiar de región:

  1. Elimina el endpoint existente
  2. Crea un nuevo endpoint en la región deseada

¿Cómo gestiono el despliegue en varias regiones?

Para cobertura global:

  1. Despliega en múltiples regiones
  2. Usa un equilibrador de carga o enrutamiento DNS
  3. Dirige a los usuarios al endpoint más cercano

¿Cuál es el tiempo de arranque en frío?

El tiempo de arranque en frío depende del tamaño del modelo y de si el contenedor ya está en caché en la región. Rangos típicos:

EscenarioArranque en frío
Contenedor en caché~5-15 segundos
Primer despliegue/región~15-45 segundos

La comprobación de salud utiliza un tiempo de espera de 55 segundos para adaptarse a los peores casos de arranque en frío.

¿Puedo usar dominios personalizados?

Los dominios personalizados llegarán pronto. Actualmente, los endpoints usan URLs generadas por la plataforma.

Comentarios