Endpoints Dedicados
Ultralytics Platform permite el despliegue de modelos YOLO en endpoints dedicados en 43 regiones globales. Cada endpoint es un servicio de inquilino único con autoescalado, URLs personalizadas y monitorización independiente.
Crear Punto de Conexión
Desplegar un modelo en un endpoint dedicado:
- Navega a tu modelo
- Haz clic en la pestaña Desplegar
- Selecciona una región del mapa
- Haz clic en Desplegar
Selección de región
Elige entre 43 regiones en todo el mundo:
El mapa interactivo muestra:
- Marcadores de región: Haz clic para seleccionar
- Indicadores de latencia: Codificados por color según la distancia
- Green: <100ms
- Amarillo: 100-200ms
- Rojo: >200ms
Tabla de Regiones
Ver todas las regiones con detalles:
| Columna | Descripción |
|---|---|
| Región | Identificador de región |
| Ubicación | Ciudad/país |
| Latencia | Tiempo de ping medido |
| Estado | Disponible/desplegado |
Elija sabiamente
Seleccione la región más cercana a sus usuarios para obtener la menor latencia. Considere desplegar en múltiples regiones para una cobertura global.
Regiones Disponibles
América (14 regiones)
| Zona | Ubicación |
|---|---|
| us-central1 | Iowa, EE. UU. |
| us-east1 | Carolina del Sur, EE. UU. |
| us-east4 | Virginia, EE. UU. |
| us-east5 | Ohio, EE. UU. |
| us-west1 | Oregón, EE. UU. |
| us-west2 | Los Ángeles, EE. UU. |
| us-west3 | Salt Lake City, EE. UU. |
| us-west4 | Las Vegas, EE. UU. |
| us-south1 | Dallas, EE. UU. |
| northamerica-northeast1 | Montreal, Canadá |
| northamerica-northeast2 | Toronto, Canadá |
| southamerica-east1 | São Paulo, Brasil |
| southamerica-west1 | Santiago, Chile |
Europa (12 regiones)
| Zona | Ubicación |
|---|---|
| europe-west1 | Bélgica |
| europe-west2 | Londres, Reino Unido |
| europe-west3 | Fráncfort, Alemania |
| europe-west4 | Países Bajos |
| europe-west6 | Zúrich, Suiza |
| europe-west8 | Milán, Italia |
| europe-west9 | París, Francia |
| europe-west10 | Berlín, Alemania |
| europe-west12 | Turín, Italia |
| europe-north1 | Finlandia |
| europe-central2 | Varsovia, Polonia |
| europe-southwest1 | Madrid, España |
Asia-Pacífico (14 regiones)
| Zona | Ubicación |
|---|---|
| asia-east1 | Taiwán |
| asia-east2 | Hong Kong |
| asia-northeast1 | Tokio, Japón |
| asia-northeast2 | Osaka, Japón |
| asia-northeast3 | Seúl, Corea del Sur |
| asia-south1 | Mumbai, India |
| asia-south2 | Delhi, India |
| asia-southeast1 | Singapur |
| asia-southeast2 | Yakarta, Indonesia |
| australia-southeast1 | Sídney, Australia |
| australia-southeast2 | Melbourne, Australia |
Oriente Medio y África (3 regiones)
| Zona | Ubicación |
|---|---|
| me-central1 | Doha, Catar |
| me-central2 | Dammam, Arabia Saudita |
| me-west1 | Tel Aviv, Israel |
Configuración del Punto de Conexión
Al crear un endpoint:
| Configuración | Descripción | Predeterminado |
|---|---|---|
| Región | Región de despliegue | - |
| Instancias mínimas | Número mínimo de instancias en ejecución | 0 |
| Instancias máximas | Límite máximo de escalado | 10 |
Opciones de Escalado
| Configuración | Comportamiento |
|---|---|
| Mínimo = 0 | Escalado a cero cuando está inactivo (rentable) |
| Mínimo > 0 | Siempre activo para evitar arranques en frío |
| Máximo | Límite superior para picos de tráfico |
Arranques en frío
Con instancias mínimas = 0, la primera solicitud después de un período de inactividad provoca un arranque en frío (2-5 segundos). Establezca un mínimo > 0 para aplicaciones sensibles a la latencia.
Gestionar Endpoints
Visualice y gestione sus endpoints:
Detalles del Punto de Conexión
| Campo | Descripción |
|---|---|
| URL | Endpoint HTTPS para solicitudes |
| Región | Región desplegada |
| Estado | En ejecución, Detenido, Desplegando |
| Instancias | Recuento actual/máximo de instancias |
URL del Punto de Conexión
Cada endpoint tiene una URL única:
https://model-abc123-us-central1.a.run.app
Haga clic en el botón de copiar para copiar la URL.
Gestión del Ciclo de Vida
Controle el estado de su endpoint:
| Acción | Descripción |
|---|---|
| Iniciar | Reanudar un endpoint detenido |
| Detener | Pausar el endpoint (sin facturación) |
| Eliminar | Eliminar permanentemente el endpoint |
Detener Endpoint
Detener un endpoint para pausar la facturación:
- Abrir el menú de acciones del endpoint
- Haga clic en Detener
- Confirmar acción
Endpoints detenidos:
- No aceptan solicitudes
- No generan cargos
- Pueden reiniciarse en cualquier momento
Eliminar Endpoint
Eliminar permanentemente un endpoint:
- Abrir el menú de acciones del endpoint
- Haz clic en Eliminar
- Confirma la eliminación
Acción permanente
La eliminación es inmediata y permanente. Siempre puede crear un nuevo endpoint.
Uso de Endpoints
Autenticación
Incluya su clave API en las solicitudes:
Authorization: Bearer YOUR_API_KEY
Ejemplo de Solicitud
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Formato de Respuesta
Igual que la inferencia compartida con campos específicos de la tarea.
Precios
Los endpoints dedicados facturan en función de:
| Componente | Tarifa |
|---|---|
| CPU | Por vCPU-segundo |
| Memoria | Por GB-segundo |
| Solicitudes | Por millón de solicitudes |
Optimización de costes
- Utilice el escalado a cero para endpoints de desarrollo
- Establezca un número máximo de instancias adecuado
- Supervise el uso en el panel de control de Monitorización
Preguntas frecuentes
¿Cuántos endpoints puedo crear?
No hay un límite estricto. Cada modelo puede tener puntos de conexión en varias regiones. El número total de puntos de conexión depende de su plan.
¿Puedo cambiar la región después del despliegue?
No, las regiones son fijas. Para cambiar de región:
- Elimine el endpoint existente
- Cree un nuevo endpoint en la región deseada
¿Cómo gestiono el despliegue multirregión?
Para cobertura global:
- Despliegue en múltiples regiones
- Utilice un balanceador de carga o enrutamiento DNS
- Dirija a los usuarios al endpoint más cercano
¿Cuál es el tiempo de arranque en frío?
El arranque en frío varía según el tamaño del modelo:
| Modelo | Arranque en frío |
|---|---|
| YOLO26n | ~2 segundos |
| YOLO26m | ~3 segundos |
| YOLO26x | ~5 segundos |
Establezca un mínimo de instancias > 0 para eliminar los arranques en frío.
¿Puedo usar dominios personalizados?
Los dominios personalizados estarán disponibles próximamente. Actualmente, los puntos de conexión utilizan URLs generadas por la plataforma.