Ir al contenido

Endpoints Dedicados

Ultralytics permite implementar YOLO en terminales dedicados en 43 regiones de todo el mundo. Cada terminal es un servicio de un solo inquilino con autoescalado, una URL de terminal única y supervisión independiente.

Pestaña «Implementar modelo» de Ultralytics con mapa regional y tabla

Crear Punto de Conexión

Desde la pestaña Implementar

Implementar un modelo desde su Deploy pestaña:

  1. Navega a tu modelo
  2. Haz clic en la pestaña Desplegar
  3. Seleccione una región de la tabla de regiones (ordenadas por latencia desde su ubicación).
  4. Haga clic en Implementar en la fila de la región.

El nombre de la implementación se genera automáticamente a partir del nombre del modelo y la ciudad de la región (por ejemplo, yolo11n-iowa).

Desde la página Implementaciones

Crear una implementación desde el global Deploy página en la barra lateral:

  1. Haga clic en Nueva implementación.
  2. Seleccione un modelo en el selector de modelos.
  3. Seleccione una región del mapa o la tabla.
  4. Opcionalmente, personalice el nombre de la implementación y los recursos.
  5. Haga clic en Implementar modelo.

Ultralytics Nuevo cuadro de diálogo de implementación con selector de modelos y mapa de regiones

Ciclo de vida del despliegue

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Selección de región

Elija entre 43 regiones de todo el mundo. El mapa interactivo y la tabla muestran:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Regiones implementadas: resaltadas con una insignia «Implementado».
  • Regiones de implementación: Indicador de pulso animado
  • Resaltado bidireccional: al pasar el cursor por el mapa se resalta la fila de la tabla, y viceversa.

Ultralytics Pestaña Implementación Tabla de latencia regional ordenada por latencia

La tabla de regiones en el modelo Deploy La pestaña incluye:

ColumnaDescripción
UbicaciónCiudad y país con icono de bandera
ZonaIdentificador de región
LatenciaTiempo de ping medido (mediana de 3 pings)
DistanciaDistancia desde tu ubicación en km
AccionesBotón «Implementar» o insignia de estado «Implementado»

Nuevo cuadro de diálogo de implementación

El New Deployment diálogo (desde el global Deploy página) muestra una tabla de regiones más sencilla con solo las columnas Ubicación, Latencia y Selección.

Elija sabiamente

Seleccione la región más cercana a sus usuarios para obtener la menor latencia. Utilice el botón «Volver a escanear» para volver a medir la latencia desde su ubicación actual.

Regiones Disponibles

ZonaUbicación
us-central1Iowa, EE. UU.
us-east1Carolina del Sur, EE. UU.
us-east4Norte de Virginia, EE. UU.
us-east5Columbus, EE. UU.
us-south1Dallas, EE. UU.
us-west1Oregón, EE. UU.
us-west2Los Ángeles, EE. UU.
us-west3Salt Lake City, EE. UU.
us-west4Las Vegas, EE. UU.
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
América del Norte-Sur 1Querétaro, México
southamerica-east1Sao Paulo, Brasil
southamerica-west1Santiago, Chile
ZonaUbicación
europe-west1San Ghislain, Bélgica
europe-west2Londres, Reino Unido
europe-west3Fráncfort, Alemania
europe-west4Eemshaven, Países Bajos
europe-west6Zúrich, Suiza
europe-west8Milán, Italia
europe-west9París, Francia
europe-west10Berlín, Alemania
europe-west12Turín, Italia
europe-north1Hamina, Finlandia
Europa-Norte2Estocolmo, Suecia
europe-central2Varsovia, Polonia
europe-southwest1Madrid, España
ZonaUbicación
asia-east1Changhua, Taiwán
asia-east2Kowloon, Hong Kong
asia-northeast1Tokio, Japón
asia-northeast2Osaka, Japón
asia-northeast3Seúl, Corea del Sur
asia-south1Mumbai, India
asia-south2Delhi, India
asia-southeast1Jurong West, Singapur
asia-southeast2Yakarta, Indonesia
asia-sudeste3Bangkok, Tailandia
australia-southeast1Sídney, Australia
australia-southeast2Melbourne, Australia
ZonaUbicación
África-Sur1Johannesburgo, Sudáfrica
me-central1Doha, Catar
me-central2Dammam, Arabia Saudita
me-west1Tel Aviv, Israel

Configuración del Punto de Conexión

Nuevo cuadro de diálogo de implementación

El New Deployment El diálogo proporciona:

ConfiguraciónDescripciónPredeterminado
ModeloSeleccionar entre modelos completados-
RegiónRegión de despliegue-
Nombre de la implementaciónGenerado automáticamente, editable-
CPUCPU (1-8)1
Memoria (GB)Asignación de memoria (1-32 GB)2

Ultralytics Nuevo cuadro de diálogo de implementación Panel de recursos ampliado

La configuración de recursos está disponible en la sección plegable Recursos. Las implementaciones utilizan la escala a cero de forma predeterminada (instancias mínimas = 0, instancias máximas = 1); solo se paga por el tiempo de inferencia activo.

Nombres generados automáticamente

El nombre de la implementación se genera automáticamente a partir del nombre del modelo y la ciudad de la región (por ejemplo, yolo11n-iowa). Si vuelve a implementar el mismo modelo en la misma región, se añade un sufijo numérico (por ejemplo, yolo11n-iowa-2).

Pestaña Implementar (Implementación rápida)

Al implementar desde el modelo Deploy En la pestaña, los puntos finales se crean con recursos predeterminados (1 CPU, 2 GB de memoria) con la escala a cero habilitada. El nombre de la implementación se genera automáticamente.

Gestionar Endpoints

Modos de visualización

La lista de implementaciones admite tres modos de visualización:

ModoDescripción
TarjetasTarjetas con información detallada con registros, ejemplos de código y panel de predicción.
CompactoCuadrícula de tarjetas más pequeñas con métricas clave
TablaTabla de datos con columnas ordenables y búsqueda

Pestaña Implementación de Ultralytics Vista de tarjetas de implementaciones activas

Tarjeta de implementación (vista de tarjetas)

Cada tarjeta de implementación en la vista de tarjetas muestra:

  • Encabezado: nombre, bandera de la región, insignia de estado, botones de inicio/parada/eliminación.
  • URL del punto final: URL copiable con enlace a la documentación de la API.
  • Métricas: Recuento de solicitudes (24 h), latencia P95, tasa de error
  • Comprobación del estado: indicador de estado en tiempo real con latencia y actualización manual.
  • Pestañas: Logs, Code, y Predict

El Logs La pestaña muestra las entradas recientes del registro con filtrado por gravedad (Todas / Errores). La Code La pestaña muestra ejemplos de código listos para usar en Python, JavaScript y cURL con su URL de punto final real y su clave API. El Predict La pestaña proporciona un panel de predicción en línea para realizar pruebas directamente en la implementación.

Estados de implementación

EstadoDescripción
CreaciónSe está configurando la implementación.
ImplementaciónEl contenedor está arrancando.
ListoEl punto final está activo y aceptando solicitudes.
DetenerEl punto final se está apagando.
DetenidoEl punto final está en pausa (sin facturación).
FallidoEl despliegue ha fallado (véase el mensaje de error).

URL del Punto de Conexión

Cada punto final tiene una URL única, por ejemplo:

https://predict-abc123.run.app

Ultralytics : tarjeta de implementación, URL del punto final con botón Copiar

Haga clic en el botón Copiar para copiar la URL. Haga clic en el icono de documentos para ver la documentación de la API generada automáticamente para el punto final.

Gestión del Ciclo de Vida

Controle el estado de su endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AcciónDescripción
IniciarReanudar un endpoint detenido
DetenerPausar el endpoint (sin facturación)
EliminarEliminar permanentemente el endpoint

Detener Endpoint

Detener un endpoint para pausar la facturación:

  1. Haga clic en el icono de pausa de la tarjeta de implementación.
  2. El estado del punto final cambia a «Deteniéndose» y luego a «Detenido».

Endpoints detenidos:

  • No aceptan solicitudes
  • No generan cargos
  • Pueden reiniciarse en cualquier momento

Eliminar Endpoint

Eliminar permanentemente un endpoint:

  1. Haga clic en el icono de eliminar (papelera) en la tarjeta de implementación.
  2. Confirmar eliminación en el cuadro de diálogo

Acción permanente

La eliminación es inmediata y permanente. Siempre puede crear un nuevo endpoint.

Uso de Endpoints

Autenticación

Cada implementación se crea con una clave API de tu cuenta. Inclúyela en las solicitudes:

Authorization: Bearer YOUR_API_KEY

El prefijo de la clave API se muestra en el pie de página de la tarjeta de implementación para su identificación. Genere claves desde Claves API.

Sin límites de velocidad

Los puntos finales dedicados no están sujetos a los límites de velocidad de la API de la plataforma. Las solicitudes se envían directamente a su servicio dedicado, por lo que el rendimiento solo está limitado por CPU, la memoria y la configuración de escalado de su punto final. Esta es una ventaja clave con respecto a la inferencia compartida, que tiene un límite de velocidad de 20 solicitudes por minuto por clave API.

Ejemplo de Solicitud

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Parámetros de solicitud

ParámetroTipoPredeterminadoDescripción
filearchivo-Archivo de imagen (obligatorio)
conffloat0.25Umbral mínimo de confianza
ioufloat0.7Umbral de IoU de NMS
imgszint640Tamaño de la imagen de entrada
normalizestring-Devolver coordenadas normalizadas

Formato de Respuesta

Igual que la inferencia compartida con campos específicos de la tarea.

Precios

Los endpoints dedicados facturan en función de:

ComponenteTarifa
CPUPor vCPU-segundo
MemoriaPor GB-segundo
SolicitudesPor millón de solicitudes

Optimización de costes

Preguntas frecuentes

¿Cuántos endpoints puedo crear?

Los límites de los puntos finales dependen del plan:

  • Gratis: hasta 3 implementaciones
  • Ventaja: hasta 10 implementaciones.
  • Empresa: Implementaciones ilimitadas

Cada modelo se puede seguir implementando en varias regiones dentro de la cuota de su plan.

¿Puedo cambiar la región después del despliegue?

No, las regiones son fijas. Para cambiar de región:

  1. Elimine el endpoint existente
  2. Cree un nuevo endpoint en la región deseada

¿Cómo gestiono el despliegue multirregión?

Para cobertura global:

  1. Despliegue en múltiples regiones
  2. Utilice un balanceador de carga o enrutamiento DNS
  3. Dirija a los usuarios al endpoint más cercano

¿Cuál es el tiempo de arranque en frío?

El tiempo de inicio en frío depende del tamaño del modelo y de si el contenedor ya está almacenado en caché en la región. Rangos típicos:

EscenarioArranque en frío
Contenedor almacenado en caché~5-15 segundos
Primera implementación/región~15-45 segundos

La comprobación de estado utiliza un tiempo de espera de 55 segundos para adaptarse a los arranques en frío más desfavorables.

¿Puedo usar dominios personalizados?

Los dominios personalizados estarán disponibles próximamente. Actualmente, los puntos de conexión utilizan URLs generadas por la plataforma.



📅 Creado hace 1 mes ✏️ Actualizado hace 5 días
glenn-jochersergiuwaxmann

Comentarios