Monitorización
Ultralytics Platform proporciona monitorización para los endpoints desplegados. Realiza un seguimiento de las métricas de solicitud, consulta los registros y comprueba el estado de salud con sondeos automáticos.

Panel de despliegues
La página Deploy en la barra lateral sirve como panel de control de monitorización para todos tus despliegues. Combina el mapa mundial, las métricas de resumen y la gestión de despliegues en una sola vista. Consulta Dedicated Endpoints para crear y gestionar despliegues.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffTarjetas de resumen
Cuatro tarjetas de resumen en la parte superior de la página muestran:

| Métrica | Descripción |
|---|---|
| Total de solicitudes (24h) | Solicitudes en todos los endpoints |
| Despliegues activos | Endpoints en ejecución actualmente |
| Tasa de errores (24h) | Porcentaje de solicitudes fallidas |
| Latencia P95 (24h) | Tiempo de respuesta en el percentil 95 |
La tarjeta de tasa de errores se resalta en rojo cuando la tasa supera el 5%. Consulta la pestaña Logs en cada despliegue individual para diagnosticar errores.
Mapa mundial
El mapa mundial interactivo muestra:
- Marcadores de región para las 43 regiones disponibles
- Marcadores verdes para las regiones desplegadas
- Marcadores azules animados para regiones con despliegues activos en curso
- El tamaño del marcador varía según el estado del despliegue y la latencia

Lista de despliegues
Debajo de las tarjetas de resumen, la lista de despliegues muestra todos los endpoints de tus proyectos. Utiliza el selector de modo de vista para alternar entre:
| Vista | Descripción |
|---|---|
| Tarjetas | Tarjetas con todos los detalles que incluyen pestañas de métricas, registros, código y predicción |
| Compacta | Cuadrícula de tarjetas más pequeñas (1-4 columnas) con métricas clave |
| Tabla | Tabla de datos con columnas ordenables: Nombre, Región, Estado, Solicitudes, P95, Errores |
El panel de control realiza un sondeo cada 15 segundos para obtener actualizaciones del estado del despliegue. Cuando los despliegues se encuentran en un estado de transición (creating, deploying o stopping), el sondeo aumenta a cada 3 segundos. Los gráficos de métricas se actualizan cada 60 segundos. Haz clic en el botón de actualización para obtener cambios inmediatos.
Métricas por despliegue
Cada tarjeta de despliegue (en la vista de tarjetas) muestra métricas en tiempo real:
Fila de métricas
| Métrica | Descripción |
|---|---|
| Solicitudes | Recuento de solicitudes (24h) con icono |
| Latencia P95 | Tiempo de respuesta en el percentil 95 |
| Tasa de errores | Porcentaje de solicitudes fallidas |
Las métricas se obtienen desde el endpoint de la API sparkline y se actualizan cada 60 segundos.
Control de salud (Health Check)
Los despliegues en ejecución muestran un indicador de comprobación de estado:
| Indicador | Significado |
|---|---|
| Corazón verde | Saludable — muestra la latencia de respuesta |
| Corazón rojo | No saludable — muestra el mensaje de error |
| Icono giratorio | Comprobación de estado en curso |
Las comprobaciones de estado se reintentan automáticamente cada 20 segundos cuando no están saludables. Haz clic en el icono de actualización para activar manualmente una comprobación de estado. La comprobación utiliza un tiempo de espera de 55 segundos para adaptarse a los arranques en frío en endpoints con escalado a cero.

La comprobación de estado utiliza un tiempo de espera de 55 segundos para tener en cuenta los arranques en frío en endpoints con escalado a cero (hasta ~45 segundos en el peor de los casos). Una vez que el endpoint se calienta, las comprobaciones de estado se completan en milisegundos.
Registros
Cada tarjeta de despliegue incluye una pestaña Logs para ver las entradas de registro recientes:

Entradas de registro
Cada entrada de registro muestra:
| Campo | Descripción |
|---|---|
| Gravedad | Barra codificada por colores (ver abajo) |
| Marca de tiempo | Hora de la solicitud (formato local) |
| Mensaje | Contenido del registro |
| Información HTTP | Código de estado y latencia (si corresponde) |
Filtra los registros por gravedad usando los botones de filtro:
| Nivel | Color | Descripción |
|---|---|---|
| DEBUG | Gris | Mensajes de depuración |
| INFO | Azul | Solicitudes normales |
| WARNING | Amarillo | Problemas no críticos |
| ERROR | Rojo | Solicitudes fallidas |
| CRITICAL | Rojo oscuro | Fallos críticos |
La interfaz muestra las 20 entradas más recientes. La API tiene como valor predeterminado 50 entradas por solicitud (máximo 200).
Al investigar errores: primero haz clic en Errors para filtrar por las entradas ERROR y WARNING, luego revisa las marcas de tiempo y los códigos de estado HTTP. Copia los registros al portapapeles para compartirlos con tu equipo.
Ejemplos de código
Cada tarjeta de despliegue incluye una pestaña Code que muestra código de API listo para usar con tu URL de endpoint real y tu clave de API:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Al visualizar la pestaña Code en la plataforma, tu URL de endpoint real y tu clave API se rellenan automáticamente. Copia el código y ejecútalo directamente. Consulta API Keys para generar una clave.
Predict en despliegue
La pestaña Predict en cada tarjeta de despliegue proporciona un panel de predicción integrado: la misma interfaz que la pestaña Predict del modelo, pero ejecutando la inferencia a través del endpoint de despliegue en lugar del servicio compartido. Esto es útil para probar un endpoint desplegado directamente desde el navegador. Consulta Inference para conocer los detalles de los parámetros y los formatos de respuesta.
Endpoints de la API
Descripción general de la monitorización
GET /api/monitoringDevuelve métricas agregadas para todos los despliegues propiedad del usuario autenticado. Reconoce el espacio de trabajo mediante el parámetro de consulta opcional owner.
Métricas de despliegue
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hDevuelve datos de sparkline y métricas de resumen para un despliegue específico. Intervalo de actualización: 60 segundos.
| Parámetro | Tipo | Descripción |
|---|---|---|
sparkline | bool | Incluir datos de sparkline |
range | string | Rango de tiempo: 1h, 6h, 24h, 7d o 30d |
Registros de despliegue
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGDevuelve entradas de registro recientes con filtro de gravedad opcional y paginación.
| Parámetro | Tipo | Descripción |
|---|---|---|
limit | int | Máximo de entradas a devolver (por defecto: 50, máximo: 200) |
severity | string | Filtro de gravedad separado por comas |
pageToken | string | Token de paginación de la respuesta anterior |
Estado del despliegue
GET /api/deployments/{deploymentId}/healthDevuelve el estado de la comprobación de salud con la latencia de respuesta.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}Optimización del rendimiento
Usa los datos de monitorización para optimizar tus despliegues:
Si la latencia es demasiado alta:
- Comprueba el número de instancias (es posible que necesites más)
- Verifica que el tamaño del modelo sea el adecuado
- Considera una región más cercana
- Comprueba los tamaños de las imágenes que se envían
Cambia de imgsz=1280 a imgsz=640 para una aceleración de ~4x con una pérdida mínima de precisión para la mayoría de los casos de uso. Despliega en una región más cercana a tus usuarios para una menor latencia de red.
Preguntas frecuentes
¿Cuánto tiempo se retienen los datos?
| Tipo de dato | Retención |
|---|---|
| Métricas | 30 días |
| Registros | 7 días |
¿Puedo configurar una monitorización externa?
Sí, las URLs de endpoint funcionan con herramientas de monitorización externas:
- Monitorización de tiempo de actividad (Pingdom, UptimeRobot)
- Herramientas APM (Datadog, New Relic)
- Comprobaciones de salud personalizadas a través del endpoint
/health
¿Qué precisión tienen las cifras de latencia?
Las métricas de latencia miden:
- P50: Tiempo de respuesta mediano
- P95: Percentil 95
- P99: Percentil 99
Estos valores representan el tiempo de procesamiento en el lado del servidor, sin incluir la latencia de red para tus usuarios.
¿Por qué mis métricas tienen retraso?
Las métricas tienen un retraso de ~2 minutos debido a:
- Canalización de agregación de métricas
- Ventanas de agregación
- Almacenamiento en caché del panel
Para una depuración en tiempo real, consulta los registros, que son casi instantáneos.
¿Puedo monitorizar varios endpoints juntos?
Sí, la página de despliegues muestra todos los endpoints con tarjetas de resumen agregadas. Usa la vista de tabla para comparar el rendimiento entre los distintos despliegues.