Ir al contenido

Endpoints Dedicados

Ultralytics Platform permite el despliegue de modelos YOLO en endpoints dedicados en 43 regiones globales. Cada endpoint es un servicio de inquilino único con autoescalado, URLs personalizadas y monitorización independiente.

Crear Punto de Conexión

Desplegar un modelo en un endpoint dedicado:

  1. Navega a tu modelo
  2. Haz clic en la pestaña Desplegar
  3. Selecciona una región del mapa
  4. Haz clic en Desplegar

Selección de región

Elige entre 43 regiones en todo el mundo:

El mapa interactivo muestra:

  • Marcadores de región: Haz clic para seleccionar
  • Indicadores de latencia: Codificados por color según la distancia
    • Green: <100ms
    • Amarillo: 100-200ms
    • Rojo: >200ms

Tabla de Regiones

Ver todas las regiones con detalles:

ColumnaDescripción
RegiónIdentificador de región
UbicaciónCiudad/país
LatenciaTiempo de ping medido
EstadoDisponible/desplegado

Elija sabiamente

Seleccione la región más cercana a sus usuarios para obtener la menor latencia. Considere desplegar en múltiples regiones para una cobertura global.

Regiones Disponibles

América (14 regiones)

ZonaUbicación
us-central1Iowa, EE. UU.
us-east1Carolina del Sur, EE. UU.
us-east4Virginia, EE. UU.
us-east5Ohio, EE. UU.
us-west1Oregón, EE. UU.
us-west2Los Ángeles, EE. UU.
us-west3Salt Lake City, EE. UU.
us-west4Las Vegas, EE. UU.
us-south1Dallas, EE. UU.
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
southamerica-east1São Paulo, Brasil
southamerica-west1Santiago, Chile

Europa (12 regiones)

ZonaUbicación
europe-west1Bélgica
europe-west2Londres, Reino Unido
europe-west3Fráncfort, Alemania
europe-west4Países Bajos
europe-west6Zúrich, Suiza
europe-west8Milán, Italia
europe-west9París, Francia
europe-west10Berlín, Alemania
europe-west12Turín, Italia
europe-north1Finlandia
europe-central2Varsovia, Polonia
europe-southwest1Madrid, España

Asia-Pacífico (14 regiones)

ZonaUbicación
asia-east1Taiwán
asia-east2Hong Kong
asia-northeast1Tokio, Japón
asia-northeast2Osaka, Japón
asia-northeast3Seúl, Corea del Sur
asia-south1Mumbai, India
asia-south2Delhi, India
asia-southeast1Singapur
asia-southeast2Yakarta, Indonesia
australia-southeast1Sídney, Australia
australia-southeast2Melbourne, Australia

Oriente Medio y África (3 regiones)

ZonaUbicación
me-central1Doha, Catar
me-central2Dammam, Arabia Saudita
me-west1Tel Aviv, Israel

Configuración del Punto de Conexión

Al crear un endpoint:

ConfiguraciónDescripciónPredeterminado
RegiónRegión de despliegue-
Instancias mínimasNúmero mínimo de instancias en ejecución0
Instancias máximasLímite máximo de escalado10

Opciones de Escalado

ConfiguraciónComportamiento
Mínimo = 0Escalado a cero cuando está inactivo (rentable)
Mínimo > 0Siempre activo para evitar arranques en frío
MáximoLímite superior para picos de tráfico

Arranques en frío

Con instancias mínimas = 0, la primera solicitud después de un período de inactividad provoca un arranque en frío (2-5 segundos). Establezca un mínimo > 0 para aplicaciones sensibles a la latencia.

Gestionar Endpoints

Visualice y gestione sus endpoints:

Detalles del Punto de Conexión

CampoDescripción
URLEndpoint HTTPS para solicitudes
RegiónRegión desplegada
EstadoEn ejecución, Detenido, Desplegando
InstanciasRecuento actual/máximo de instancias

URL del Punto de Conexión

Cada endpoint tiene una URL única:

https://model-abc123-us-central1.a.run.app

Haga clic en el botón de copiar para copiar la URL.

Gestión del Ciclo de Vida

Controle el estado de su endpoint:

AcciónDescripción
IniciarReanudar un endpoint detenido
DetenerPausar el endpoint (sin facturación)
EliminarEliminar permanentemente el endpoint

Detener Endpoint

Detener un endpoint para pausar la facturación:

  1. Abrir el menú de acciones del endpoint
  2. Haga clic en Detener
  3. Confirmar acción

Endpoints detenidos:

  • No aceptan solicitudes
  • No generan cargos
  • Pueden reiniciarse en cualquier momento

Eliminar Endpoint

Eliminar permanentemente un endpoint:

  1. Abrir el menú de acciones del endpoint
  2. Haz clic en Eliminar
  3. Confirma la eliminación

Acción permanente

La eliminación es inmediata y permanente. Siempre puede crear un nuevo endpoint.

Uso de Endpoints

Autenticación

Incluya su clave API en las solicitudes:

Authorization: Bearer YOUR_API_KEY

Ejemplo de Solicitud

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Formato de Respuesta

Igual que la inferencia compartida con campos específicos de la tarea.

Precios

Los endpoints dedicados facturan en función de:

ComponenteTarifa
CPUPor vCPU-segundo
MemoriaPor GB-segundo
SolicitudesPor millón de solicitudes

Optimización de costes

  • Utilice el escalado a cero para endpoints de desarrollo
  • Establezca un número máximo de instancias adecuado
  • Supervise el uso en el panel de control de Monitorización

Preguntas frecuentes

¿Cuántos endpoints puedo crear?

No hay un límite estricto. Cada modelo puede tener puntos de conexión en varias regiones. El número total de puntos de conexión depende de su plan.

¿Puedo cambiar la región después del despliegue?

No, las regiones son fijas. Para cambiar de región:

  1. Elimine el endpoint existente
  2. Cree un nuevo endpoint en la región deseada

¿Cómo gestiono el despliegue multirregión?

Para cobertura global:

  1. Despliegue en múltiples regiones
  2. Utilice un balanceador de carga o enrutamiento DNS
  3. Dirija a los usuarios al endpoint más cercano

¿Cuál es el tiempo de arranque en frío?

El arranque en frío varía según el tamaño del modelo:

ModeloArranque en frío
YOLO26n~2 segundos
YOLO26m~3 segundos
YOLO26x~5 segundos

Establezca un mínimo de instancias > 0 para eliminar los arranques en frío.

¿Puedo usar dominios personalizados?

Los dominios personalizados estarán disponibles próximamente. Actualmente, los puntos de conexión utilizan URLs generadas por la plataforma.



📅 Creado hace 20 días ✏️ Actualizado hace 14 días
glenn-jocher

Comentarios