Ir al contenido

Endpoints Dedicados

La Plataforma Ultralytics permite el despliegue de modelos YOLO en puntos finales dedicados en 43 regiones globales. Cada punto final es un servicio de inquilino único con autoescalado, una URL de punto final única y monitoreo independiente.

Pestaña de despliegue del modelo con mapa de regiones y tabla de la Plataforma Ultralytics

Crear Punto de Conexión

Desde la pestaña Desplegar

Implementar un modelo desde su Deploy pestaña:

  1. Navega a tu modelo
  2. Haz clic en la pestaña Desplegar
  3. Seleccione una región de la tabla de regiones (ordenada por latencia desde su ubicación)
  4. Haz clic en Desplegar en la fila de la región

El nombre de la implementación se genera automáticamente a partir del nombre del modelo y la ciudad de la región (p. ej., yolo11n-iowa).

Desde la página de Despliegues

Crear un despliegue desde el global Deploy página en la barra lateral:

  1. Haz clic en Nuevo despliegue
  2. Seleccione un modelo del selector de modelos
  3. Seleccione una región del mapa o la tabla
  4. Opcionalmente, personalice el nombre y los recursos del despliegue
  5. Haz clic en Desplegar modelo

Plataforma Ultralytics Diálogo de Nueva Implementación con Selector de Modelo y Mapa de Regiones

Ciclo de Vida del Despliegue

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Selección de región

Elija entre 43 regiones en todo el mundo. El mapa y la tabla de regiones interactivos muestran:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Regiones desplegadas: Resaltadas con una insignia de "Desplegado"
  • Regiones en despliegue: Indicador de pulso animado
  • Resaltado bidireccional: Al pasar el ratón sobre el mapa, se resalta la fila de la tabla, y viceversa.

Tabla de latencia por región ordenada por latencia de la pestaña de Despliegue de la Plataforma Ultralytics

La tabla de regiones en el modelo Deploy la pestaña incluye:

ColumnaDescripción
UbicaciónCiudad y país con icono de bandera
ZonaIdentificador de región
LatenciaTiempo de ping medido (mediana de 3 pings)
DistanciaDistancia desde su ubicación en km
AccionesBotón de Implementar o insignia de estado "Implementado"

Nuevo diálogo de despliegue

El New Deployment diálogo (desde el global Deploy página) muestra una tabla de región más sencilla con solo las columnas Ubicación, Latencia y Selección.

Elija sabiamente

Seleccione la región más cercana a sus usuarios para obtener la latencia más baja. Utilice el botón Volver a escanear para volver a medir la latencia desde su ubicación actual.

Regiones Disponibles

ZonaUbicación
us-central1Iowa, EE. UU.
us-east1Carolina del Sur, EE. UU.
us-east4Norte de Virginia, EE. UU.
us-east5Columbus, EE. UU.
us-south1Dallas, EE. UU.
us-west1Oregón, EE. UU.
us-west2Los Ángeles, EE. UU.
us-west3Salt Lake City, EE. UU.
us-west4Las Vegas, EE. UU.
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
northamerica-south1Querétaro, México
southamerica-east1São Paulo, Brasil
southamerica-west1Santiago, Chile
ZonaUbicación
europe-west1St. Ghislain, Bélgica
europe-west2Londres, Reino Unido
europe-west3Fráncfort, Alemania
europe-west4Eemshaven, Países Bajos
europe-west6Zúrich, Suiza
europe-west8Milán, Italia
europe-west9París, Francia
europe-west10Berlín, Alemania
europe-west12Turín, Italia
europe-north1Hamina, Finlandia
europe-north2Estocolmo, Suecia
europe-central2Varsovia, Polonia
europe-southwest1Madrid, España
ZonaUbicación
asia-east1Changhua, Taiwán
asia-east2Kowloon, Hong Kong
asia-northeast1Tokio, Japón
asia-northeast2Osaka, Japón
asia-northeast3Seúl, Corea del Sur
asia-south1Mumbai, India
asia-south2Delhi, India
asia-southeast1Jurong Oeste, Singapur
asia-southeast2Yakarta, Indonesia
asia-southeast3Bangkok, Tailandia
australia-southeast1Sídney, Australia
australia-southeast2Melbourne, Australia
ZonaUbicación
africa-south1Johannesburgo, Sudáfrica
me-central1Doha, Catar
me-central2Dammam, Arabia Saudita
me-west1Tel Aviv, Israel

Configuración del Punto de Conexión

Nuevo diálogo de despliegue

El New Deployment El diálogo proporciona:

ConfiguraciónDescripciónPredeterminado
ModeloSeleccione entre los modelos completados-
RegiónRegión de despliegue-
Nombre del DespliegueAutogenerado, editable-
Núcleos de CPUAsignación de CPU (1-8)1
Memoria (GB)Asignación de memoria (1-32 GB)2

Plataforma Ultralytics Diálogo de Nueva Implementación Panel de Recursos Expandido

La configuración de recursos está disponible en la sección desplegable Recursos. Las implementaciones utilizan el escalado a cero por defecto (instancias mínimas = 0, instancias máximas = 1) — solo paga por el tiempo de inferencia activo.

Nombres autogenerados

El nombre de la implementación se genera automáticamente a partir del nombre del modelo y la ciudad de la región (p. ej., yolo11n-iowa). Si despliega el mismo modelo en la misma región de nuevo, se añade un sufijo numérico (p. ej., yolo11n-iowa-2).

Pestaña Implementar (Implementación Rápida)

Al desplegar desde el modelo Deploy pestaña, los endpoints se crean con recursos predeterminados (1 CPU, 2 GB de memoria) con escalado a cero habilitado. El nombre del despliegue se genera automáticamente.

Gestionar Endpoints

Modos de Vista

La lista de implementaciones admite tres modos de vista:

ModoDescripción
TarjetasTarjetas de detalles completos con registros, ejemplos de código, panel de predicción
CompactoCuadrícula de tarjetas más pequeñas con métricas clave
TablaTabla de datos con columnas ordenables y búsqueda

Vista de tarjetas de despliegues activos de la pestaña de Despliegue de la Plataforma Ultralytics

Tarjeta de Despliegue (Vista de Tarjetas)

Cada tarjeta de despliegue en la vista de tarjetas muestra:

  • Encabezado: Nombre, bandera de región, insignia de estado, botones de iniciar/detener/eliminar
  • URL del Endpoint: URL copiable con enlace a la documentación de la API
  • Métricas: Recuento de solicitudes (24h), latencia P95, tasa de error
  • Verificación de estado: Indicador de estado en tiempo real con latencia y actualización manual
  • Pestañas: Logs, Code, y Predict

El Logs pestaña muestra entradas de registro recientes con filtrado por severidad (Todas / Errores). La Code pestaña muestra ejemplos de código listos para usar en Python, JavaScript y cURL con su URL de endpoint y clave API reales. La Predict la pestaña proporciona un panel de predicción en línea para realizar pruebas directamente en el despliegue.

Estados del Despliegue

EstadoDescripción
CreandoEl despliegue se está configurando
ImplementandoEl contenedor se está iniciando
ListoEl endpoint está activo y aceptando solicitudes
DeteniendoEl endpoint se está apagando
DetenidoEl endpoint está pausado (sin facturación)
FallidoDespliegue fallido (ver mensaje de error)

URL del Punto de Conexión

Cada punto final tiene una URL única, por ejemplo:

https://predict-abc123.run.app

URL de endpoint con botón de copiar de la tarjeta de Despliegue de la Plataforma Ultralytics

Haga clic en el botón de copiar para copiar la URL. Haga clic en el icono de documentación para ver la documentación API autogenerada para el endpoint.

Gestión del Ciclo de Vida

Controle el estado de su endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AcciónDescripción
IniciarReanudar un endpoint detenido
DetenerPausar el endpoint (sin facturación)
EliminarEliminar permanentemente el endpoint

Detener Endpoint

Detener un endpoint para pausar la facturación:

  1. Haga clic en el icono de pausa en la tarjeta de despliegue
  2. El estado del endpoint cambia a "Deteniendo" y luego a "Detenido"

Endpoints detenidos:

  • No aceptan solicitudes
  • No generan cargos
  • Pueden reiniciarse en cualquier momento

Eliminar Endpoint

Eliminar permanentemente un endpoint:

  1. Haga clic en el icono de eliminar (papelera) en la tarjeta de despliegue.
  2. Confirmar eliminación en el diálogo

Acción permanente

La eliminación es inmediata y permanente. Siempre puede crear un nuevo endpoint.

Uso de Endpoints

Autenticación

Cada despliegue se crea con una clave API de su cuenta. Inclúyala en las solicitudes:

Authorization: Bearer YOUR_API_KEY

El prefijo de la clave API se muestra en el pie de la tarjeta de despliegue para su identificación. Genere claves desde API Keys.

Sin límites de tasa

Los puntos finales dedicados no están sujetos a los límites de tasa de la API de la Plataforma. Las solicitudes van directamente a su servicio dedicado, por lo que el rendimiento está limitado únicamente por la CPU, la memoria y la configuración de escalado de su punto final. Esta es una ventaja clave sobre la inferencia compartida, que está limitada a 20 solicitudes/min por clave de API.

Ejemplo de Solicitud

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Parámetros de Solicitud

ParámetroTipoPredeterminadoDescripción
filearchivo-Archivo de imagen (obligatorio)
conffloat0.25Umbral mínimo de confianza
ioufloat0.7Umbral de IoU de NMS
imgszint640Tamaño de la imagen de entrada
normalizestring-Devolver coordenadas normalizadas

Formato de Respuesta

Igual que la inferencia compartida con campos específicos de la tarea.

Precios

Los endpoints dedicados facturan en función de:

ComponenteTarifa
CPUPor vCPU-segundo
MemoriaPor GB-segundo
SolicitudesPor millón de solicitudes

Optimización de costes

Preguntas frecuentes

¿Cuántos endpoints puedo crear?

Los límites del endpoint dependen del plan:

  • Gratis: Hasta 3 despliegues
  • Pro: Hasta 10 despliegues
  • Empresarial: Despliegues ilimitados

Cada modelo aún puede ser desplegado a múltiples regiones dentro de la cuota de su plan.

¿Puedo cambiar la región después del despliegue?

No, las regiones son fijas. Para cambiar de región:

  1. Elimine el endpoint existente
  2. Cree un nuevo endpoint en la región deseada

¿Cómo gestiono el despliegue multirregión?

Para cobertura global:

  1. Despliegue en múltiples regiones
  2. Utilice un balanceador de carga o enrutamiento DNS
  3. Dirija a los usuarios al endpoint más cercano

¿Cuál es el tiempo de arranque en frío?

El tiempo de arranque en frío depende del tamaño del modelo y de si el contenedor ya está en caché en la región. Rangos típicos:

EscenarioArranque en frío
Contenedor en caché~5-15 segundos
Primera implementación/región~15-45 segundos

La comprobación de estado utiliza un tiempo de espera de 55 segundos para acomodar los arranques en frío en el peor de los casos.

¿Puedo usar dominios personalizados?

Los dominios personalizados estarán disponibles próximamente. Actualmente, los puntos de conexión utilizan URLs generadas por la plataforma.



📅 Creado hace 2 meses ✏️ Actualizado hace 25 días
glenn-jochersergiuwaxmann

Comentarios