Ir al contenido

Terminales dedicados

Ultralytics permite implementar YOLO en terminales dedicados en 43 regiones de todo el mundo. Cada terminal es un servicio de un solo inquilino con autoescalado, URL personalizadas y supervisión independiente.

Crear punto final

Implementar un modelo en un punto final dedicado:

  1. Navega hasta tu modelo
  2. Haga clic en la pestaña Implementar.
  3. Seleccione una región del mapa.
  4. Haga clic en Implementar.

Selección de región

Elige entre 43 regiones de todo el mundo:

El mapa interactivo muestra:

  • Pines de región: Haga clic para seleccionar
  • Indicadores de latencia: Codificado por colores según la distancia
    • Green: <100ms
    • Amarillo: 100-200 ms
    • Rojo: >200 ms

Tabla de regiones

Ver todas las regiones con detalles:

ColumnaDescripción
RegiónIdentificador de región
UbicaciónCiudad/país
LatenciaTiempo de ping medido
EstadoDisponible/implementado

Elige con prudencia

Seleccione la región más cercana a sus usuarios para obtener la menor latencia posible. Considere la posibilidad de implementar en varias regiones para obtener una cobertura global.

Regiones disponibles

América (15 regiones)

RegiónUbicación
us-central1Iowa, EE. UU.
este-de-EE. UU.Carolina del Sur, EE. UU.
us-east4Virginia, Estados Unidos
us-east5Columbus, Estados Unidos
sur-1Dallas, Estados Unidos
us-oeste1Oregón, EE. UU.
us-west2Los Ángeles, EE. UU.
us-oeste3Salt Lake City, Estados Unidos
us-west4Las Vegas, Estados Unidos
norteamérica-noreste1Montreal, Canadá
norteamérica-noreste2Toronto, Canadá
sudamérica-este1São Paulo, Brasil
sudamérica-oeste1Santiago, Chile

Europa (12 regiones)

RegiónUbicación
Europa-Central2Varsovia, Polonia
Europa-Norte1Finlandia
Europa-Suroeste1Madrid, España
Europa-Oeste1Bélgica
Europa-Oeste2Londres, Reino Unido
Europa-Oeste3Fráncfort, Alemania
Europa-Oeste4Países Bajos
Europa-Oeste6Zúrich, Suiza
Europa-Oeste8Milán, Italia
Europa-Oeste9París, Francia
Europa-Oeste10Berlín, Alemania
Europa-Oeste12Turín, Italia

Asia-Pacífico (16 regiones)

RegiónUbicación
asia-este1Taiwán
asia-este2Hong Kong
asia-noreste1Tokio, Japón
asia-noreste2Osaka, Japón
asia-noreste3Seúl, Corea
asia-sur1Mumbai, India
asia-sur2Delhi, India
asia-sudeste1Singapur
asia-sudeste2Yakarta, Indonesia
Australia-Sureste 1Sídney, Australia
Australia-Sureste 2Melbourne, Australia
yo-central1Doha, Catar
yo-central2Dammam, Arabia Saudita
me-oeste1Tel Aviv, Israel

Configuración del punto final

Al crear un punto final:

ConfiguraciónDescripciónPredeterminado
RegiónRegión de implementación-
Mínimo de instanciasInstancias mínimas en ejecución0
Instancias máximasLímite máximo de escalado10

Opciones de escalado

ConfiguraciónComportamiento
Mínimo = 0Escala a cero cuando está inactivo (rentable)
Min > 0Siempre encendido para evitar arranques en frío
MáximoLímite superior para picos de tráfico

Arranques en frío

Con un mínimo de instancias = 0, la primera solicitud tras un periodo de inactividad activa un arranque en frío (2-5 segundos). Establezca un mínimo > 0 para aplicaciones sensibles a la latencia.

Gestionar terminales

Ver y gestionar tus terminales:

Detalles del punto final

CampoDescripción
URLPunto final HTTPS para solicitudes
RegiónRegión desplegada
EstadoEn ejecución, Detenido, Implementando
InstanciasRecuento actual/máximo de instancias

URL del punto final

Cada punto final tiene una URL única:

https://model-abc123-us-central1.a.run.app

Haga clic en el botón Copiar para copiar la URL.

Gestión del ciclo de vida

Controle el estado de su terminal:

AcciónDescripción
InicioReanudar un punto final detenido
DetenerPausar el punto final (sin facturación)
EliminarEliminar permanentemente el punto final

Detener punto final

Detenga un punto final para pausar la facturación:

  1. Abrir el menú de acciones del punto final
  2. Haga clic en Detener.
  3. Confirmar acción

Puntos finales detenidos:

  • No aceptes solicitudes.
  • No incurra en gastos.
  • Se puede reiniciar en cualquier momento.

Eliminar punto final

Eliminar permanentemente un punto final:

  1. Abrir el menú de acciones del punto final
  2. Haga clic en Eliminar.
  3. Confirmar eliminación

Acción permanente

La eliminación es inmediata y permanente. Siempre puede crear un nuevo punto final.

Uso de puntos finales

Autenticación

Incluye tu clave API en las solicitudes:

Authorization: Bearer YOUR_API_KEY

Ejemplo de solicitud

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Formato de respuesta

Igual que la inferencia compartida con campos específicos de la tarea.

Precios

Factura de terminales dedicados basada en:

ComponenteTasa
CPUPor vCPU-segundo
MemoriaPor GB por segundo
SolicitudesPor cada millón de solicitudes

Optimización de costes

  • Utilizar la escala a cero para los puntos finales de desarrollo.
  • Establecer el número máximo adecuado de instancias
  • Supervisar el uso en el panel de control de supervisión.

Preguntas frecuentes

¿Cuántos puntos finales puedo crear?

No hay un límite estricto. Cada modelo puede tener puntos finales en varias regiones. El número total de puntos finales depende de su plan.

¿Puedo cambiar la región después de la implementación?

No, las regiones son fijas. Para cambiar de región:

  1. Eliminar el punto final existente
  2. Cree un nuevo punto final en la región deseada.

¿Cómo gestiono la implementación en varias regiones?

Para cobertura global:

  1. Implementar en varias regiones
  2. Utilice un equilibrador de carga o enrutamiento DNS.
  3. Dirigir a los usuarios al punto final más cercano.

¿Cuál es la hora de inicio en frío?

El arranque en frío varía según el tamaño del modelo:

ModeloArranque en frío
YOLO11n~2 segundos
YOLO11m~3 segundos
YOLO11x~5 segundos

Establezca el número mínimo de instancias > 0 para eliminar los arranques en frío.

¿Puedo utilizar dominios personalizados?

Los dominios personalizados estarán disponibles próximamente. Actualmente, los puntos finales utilizan URL generadas por la plataforma.



📅 Creado hace 0 días ✏️ Actualizado hace 0 días
glenn-jocher

Comentarios