Terminales dedicados
Ultralytics permite implementar YOLO en terminales dedicados en 43 regiones de todo el mundo. Cada terminal es un servicio de un solo inquilino con autoescalado, URL personalizadas y supervisión independiente.
Crear punto final
Implementar un modelo en un punto final dedicado:
- Navega hasta tu modelo
- Haga clic en la pestaña Implementar.
- Seleccione una región del mapa.
- Haga clic en Implementar.
Selección de región
Elige entre 43 regiones de todo el mundo:
El mapa interactivo muestra:
- Pines de región: Haga clic para seleccionar
- Indicadores de latencia: Codificado por colores según la distancia
- Green: <100ms
- Amarillo: 100-200 ms
- Rojo: >200 ms
Tabla de regiones
Ver todas las regiones con detalles:
| Columna | Descripción |
|---|---|
| Región | Identificador de región |
| Ubicación | Ciudad/país |
| Latencia | Tiempo de ping medido |
| Estado | Disponible/implementado |
Elige con prudencia
Seleccione la región más cercana a sus usuarios para obtener la menor latencia posible. Considere la posibilidad de implementar en varias regiones para obtener una cobertura global.
Regiones disponibles
América (15 regiones)
| Región | Ubicación |
|---|---|
| us-central1 | Iowa, EE. UU. |
| este-de-EE. UU. | Carolina del Sur, EE. UU. |
| us-east4 | Virginia, Estados Unidos |
| us-east5 | Columbus, Estados Unidos |
| sur-1 | Dallas, Estados Unidos |
| us-oeste1 | Oregón, EE. UU. |
| us-west2 | Los Ángeles, EE. UU. |
| us-oeste3 | Salt Lake City, Estados Unidos |
| us-west4 | Las Vegas, Estados Unidos |
| norteamérica-noreste1 | Montreal, Canadá |
| norteamérica-noreste2 | Toronto, Canadá |
| sudamérica-este1 | São Paulo, Brasil |
| sudamérica-oeste1 | Santiago, Chile |
Europa (12 regiones)
| Región | Ubicación |
|---|---|
| Europa-Central2 | Varsovia, Polonia |
| Europa-Norte1 | Finlandia |
| Europa-Suroeste1 | Madrid, España |
| Europa-Oeste1 | Bélgica |
| Europa-Oeste2 | Londres, Reino Unido |
| Europa-Oeste3 | Fráncfort, Alemania |
| Europa-Oeste4 | Países Bajos |
| Europa-Oeste6 | Zúrich, Suiza |
| Europa-Oeste8 | Milán, Italia |
| Europa-Oeste9 | París, Francia |
| Europa-Oeste10 | Berlín, Alemania |
| Europa-Oeste12 | Turín, Italia |
Asia-Pacífico (16 regiones)
| Región | Ubicación |
|---|---|
| asia-este1 | Taiwán |
| asia-este2 | Hong Kong |
| asia-noreste1 | Tokio, Japón |
| asia-noreste2 | Osaka, Japón |
| asia-noreste3 | Seúl, Corea |
| asia-sur1 | Mumbai, India |
| asia-sur2 | Delhi, India |
| asia-sudeste1 | Singapur |
| asia-sudeste2 | Yakarta, Indonesia |
| Australia-Sureste 1 | Sídney, Australia |
| Australia-Sureste 2 | Melbourne, Australia |
| yo-central1 | Doha, Catar |
| yo-central2 | Dammam, Arabia Saudita |
| me-oeste1 | Tel Aviv, Israel |
Configuración del punto final
Al crear un punto final:
| Configuración | Descripción | Predeterminado |
|---|---|---|
| Región | Región de implementación | - |
| Mínimo de instancias | Instancias mínimas en ejecución | 0 |
| Instancias máximas | Límite máximo de escalado | 10 |
Opciones de escalado
| Configuración | Comportamiento |
|---|---|
| Mínimo = 0 | Escala a cero cuando está inactivo (rentable) |
| Min > 0 | Siempre encendido para evitar arranques en frío |
| Máximo | Límite superior para picos de tráfico |
Arranques en frío
Con un mínimo de instancias = 0, la primera solicitud tras un periodo de inactividad activa un arranque en frío (2-5 segundos). Establezca un mínimo > 0 para aplicaciones sensibles a la latencia.
Gestionar terminales
Ver y gestionar tus terminales:
Detalles del punto final
| Campo | Descripción |
|---|---|
| URL | Punto final HTTPS para solicitudes |
| Región | Región desplegada |
| Estado | En ejecución, Detenido, Implementando |
| Instancias | Recuento actual/máximo de instancias |
URL del punto final
Cada punto final tiene una URL única:
https://model-abc123-us-central1.a.run.app
Haga clic en el botón Copiar para copiar la URL.
Gestión del ciclo de vida
Controle el estado de su terminal:
| Acción | Descripción |
|---|---|
| Inicio | Reanudar un punto final detenido |
| Detener | Pausar el punto final (sin facturación) |
| Eliminar | Eliminar permanentemente el punto final |
Detener punto final
Detenga un punto final para pausar la facturación:
- Abrir el menú de acciones del punto final
- Haga clic en Detener.
- Confirmar acción
Puntos finales detenidos:
- No aceptes solicitudes.
- No incurra en gastos.
- Se puede reiniciar en cualquier momento.
Eliminar punto final
Eliminar permanentemente un punto final:
- Abrir el menú de acciones del punto final
- Haga clic en Eliminar.
- Confirmar eliminación
Acción permanente
La eliminación es inmediata y permanente. Siempre puede crear un nuevo punto final.
Uso de puntos finales
Autenticación
Incluye tu clave API en las solicitudes:
Authorization: Bearer YOUR_API_KEY
Ejemplo de solicitud
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Formato de respuesta
Igual que la inferencia compartida con campos específicos de la tarea.
Precios
Factura de terminales dedicados basada en:
| Componente | Tasa |
|---|---|
| CPU | Por vCPU-segundo |
| Memoria | Por GB por segundo |
| Solicitudes | Por cada millón de solicitudes |
Optimización de costes
- Utilizar la escala a cero para los puntos finales de desarrollo.
- Establecer el número máximo adecuado de instancias
- Supervisar el uso en el panel de control de supervisión.
Preguntas frecuentes
¿Cuántos puntos finales puedo crear?
No hay un límite estricto. Cada modelo puede tener puntos finales en varias regiones. El número total de puntos finales depende de su plan.
¿Puedo cambiar la región después de la implementación?
No, las regiones son fijas. Para cambiar de región:
- Eliminar el punto final existente
- Cree un nuevo punto final en la región deseada.
¿Cómo gestiono la implementación en varias regiones?
Para cobertura global:
- Implementar en varias regiones
- Utilice un equilibrador de carga o enrutamiento DNS.
- Dirigir a los usuarios al punto final más cercano.
¿Cuál es la hora de inicio en frío?
El arranque en frío varía según el tamaño del modelo:
| Modelo | Arranque en frío |
|---|---|
| YOLO11n | ~2 segundos |
| YOLO11m | ~3 segundos |
| YOLO11x | ~5 segundos |
Establezca el número mínimo de instancias > 0 para eliminar los arranques en frío.
¿Puedo utilizar dominios personalizados?
Los dominios personalizados estarán disponibles próximamente. Actualmente, los puntos finales utilizan URL generadas por la plataforma.