Monitorización
La Plataforma Ultralytics proporciona monitoreo para puntos finales desplegados. Rastree métricas de solicitudes, vea registros y verifique el estado de salud con sondeo automático.

Panel de Despliegues
El Deploy página en la barra lateral sirve como el panel de monitoreo para todos sus despliegues. Combina el mapa mundial, las métricas de resumen y la gestión de despliegues en una sola vista. Ver Endpoints Dedicados para la creación y gestión de despliegues.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fff
Tarjetas de Resumen
Cuatro tarjetas de resumen en la parte superior de la página muestran:

| Métrica | Descripción |
|---|---|
| Solicitudes Totales (24h) | Solicitudes en todos los puntos finales |
| Despliegues Activos | Endpoints actualmente en ejecución |
| Tasa de error (24h) | Porcentaje de solicitudes fallidas |
| Latencia P95 (24h) | Tiempo de respuesta del percentil 95 |
Alerta de tasa de error
La tarjeta de tasa de error resalta en rojo cuando la tasa supera el 5%. Consulte la Logs pestaña en despliegues individuales para diagnosticar errores.
Mapa Mundial
El mapa interactivo del mundo muestra:
- Pines de región para las 43 regiones disponibles
- Pines verdes para regiones desplegadas
- Pines azules animados para regiones con despliegues activos en curso
- Tamaño del pin varía según el estado de despliegue y la latencia

Lista de Despliegues
Debajo de las tarjetas de resumen, la lista de despliegues muestra todos los puntos finales de tus proyectos. Usa el interruptor de modo de vista para alternar entre:
| Ver | Descripción |
|---|---|
| Tarjetas | Tarjetas de detalles completos con métricas, registros, código y pestañas de predicción |
| Compacto | Cuadrícula de tarjetas más pequeñas (1-4 columnas) con métricas clave |
| Tabla | Tabla de datos con columnas ordenables: Nombre, Región, Estado, Solicitudes, P95, Errores |
Actualizaciones en tiempo real
El panel de control consulta cada 30 segundos para obtener actualizaciones de métricas. Cuando los despliegues se encuentran en un estado de transición (creando, desplegando), la frecuencia de consulta aumenta a cada 3 segundos. Haga clic en el botón de actualizar para obtener actualizaciones inmediatas.
Métricas por implementación
Cada tarjeta de despliegue (en vista de tarjetas) muestra métricas en tiempo real:
Fila de métricas
| Métrica | Descripción |
|---|---|
| Solicitudes | Recuento de solicitudes (24h) con icono |
| Latencia P95 | Tiempo de respuesta del percentil 95 |
| Tasa de Error | Porcentaje de solicitudes fallidas |
Las métricas se obtienen del endpoint de la API de sparkline y se actualizan cada 60 segundos.
Comprobación del estado
Los despliegues en ejecución muestran un indicador de estado de salud:
| Indicador | Significado |
|---|---|
| Corazón verde | Saludable — muestra la latencia de respuesta |
| Corazón rojo | No saludable — muestra mensaje de error |
| Icono giratorio | Verificación de estado en curso |
Las verificaciones de estado se reintentan automáticamente cada 20 segundos cuando el sistema no está saludable. Haga clic en el icono de actualizar para activar manualmente una verificación de estado. La verificación de estado utiliza un tiempo de espera de 55 segundos para acomodar los arranques en frío en los puntos finales de escalado a cero.

Tolerancia al Arranque en Frío
La comprobación de estado utiliza un tiempo de espera de 55 segundos para tener en cuenta los arranques en frío en los puntos finales de escalado a cero (hasta ~45 segundos en el peor de los casos). Una vez que el punto final se calienta, las comprobaciones de estado se completan en milisegundos.
Registros
Cada tarjeta de despliegue incluye un/una Logs pestaña para ver las entradas de registro recientes:

Entradas de Registro
Cada entrada de registro muestra:
| Campo | Descripción |
|---|---|
| Gravedad | Barra codificada por colores (ver abajo) |
| Marca de tiempo | Hora de la solicitud (formato local) |
| Mensaje | Contenido del registro |
| Información HTTP | Código de estado y latencia (si aplica) |
Filtrar registros por gravedad utilizando los botones de filtro:
| Nivel | Color | Descripción |
|---|---|---|
| DEBUG | Gris | Mensajes de depuración |
| INFO | Azul | Solicitudes normales |
| WARNING | Amarillo | Problemas no críticos |
| ERROR | Rojo | Solicitudes fallidas |
| CRÍTICO | Rojo Oscuro | Fallos críticos |
| Control | Descripción |
|---|---|
| Errores | Filtrar a entradas de ERROR y ADVERTENCIA |
| Todos los | Mostrar todas las entradas del registro |
| Copiar | Copiar todos los registros visibles al portapapeles |
| Actualizar | Recargar entradas de registro |
La interfaz de usuario muestra las 20 entradas más recientes. La API predetermina 50 entradas por solicitud (máx. 200).
Flujo de trabajo de depuración
Al investigar errores: primero haga clic en Errors para filtrar las entradas de ERROR y WARNING, luego revise las marcas de tiempo y los códigos de estado HTTP. Copie los registros al portapapeles para compartirlos con su equipo.
Ejemplos de Código
Cada tarjeta de despliegue incluye un/una Code pestaña que muestra código API listo para usar con su URL de endpoint y clave API reales:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Credenciales autocompletadas
Al ver el Code pestaña en la plataforma, su URL de endpoint real y su clave de API se rellenan automáticamente. Copie el código y ejecútelo directamente. Consulte Claves de API para generar una clave.
Predicción del Despliegue
El Predict pestaña en cada tarjeta de despliegue proporciona un panel de predicción en línea — la misma interfaz que la del modelo Predict pestaña, pero ejecutando la inferencia a través del endpoint de despliegue en lugar del servicio compartido. Esto es útil para probar un endpoint desplegado directamente desde el navegador. Véase Inferencia para detalles de parámetros y formatos de respuesta.
Puntos finales de la API
Resumen de Monitorización
GET /api/monitoring
Devuelve métricas agregadas para todas las implementaciones propiedad del usuario autenticado. Consciente del espacio de trabajo a través de opcional owner parámetro de consulta.
Métricas de Despliegue
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h
Devuelve datos de sparkline y métricas resumidas para un despliegue específico. Intervalo de actualización: 60 segundos.
| Parámetro | Tipo | Descripción |
|---|---|---|
sparkline | booleano | Incluir datos de minigráficos |
range | string | Rango de tiempo: 1h, 6h, 24h, 7d, o 30d |
Registros de Despliegue
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING
Devuelve las entradas de registro recientes con filtro de severidad opcional y paginación.
| Parámetro | Tipo | Descripción |
|---|---|---|
limit | int | Máximo de entradas a devolver (por defecto: 50, máximo: 200) |
severity | string | Filtro de severidad separado por comas |
pageToken | string | Token de paginación de la respuesta anterior |
Estado del Despliegue
GET /api/deployments/{deploymentId}/health
Devuelve el estado de la comprobación de salud con la latencia de respuesta.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}
Optimización del rendimiento
Utilice datos de monitoreo para optimizar sus despliegues:
Si la latencia es demasiado alta:
- Verifique el número de instancias (puede que necesite más)
- Verifique que el tamaño del modelo sea adecuado
- Considere una región más cercana
- Verifique los tamaños de las imágenes que se envían
Reducción de la latencia
Cambiar de imgsz=1280 a datos imgsz=640 para una aceleración de ~4x con una pérdida mínima de precisión para la mayoría de los casos de uso. Despliegue en una región más cercana a sus usuarios para una menor latencia de red.
Si se producen errores:
- Revisar los registros de errores en el
Logspestaña - Verifique el formato de la solicitud (se requiere formulario multipart)
- Verificar la validez de la clave API
- Comprobar los límites de tasa
Si se alcanza la capacidad máxima:
- Considerar múltiples regiones
- Optimizar el procesamiento por lotes de solicitudes
- Aumentar los recursos de CPU y memoria
Preguntas frecuentes
¿Cuánto tiempo se retienen los datos?
| Tipo de datos | Retención |
|---|---|
| Métricas | 30 días |
| Registros | 7 días |
¿Puedo configurar un monitoreo externo?
Sí, las URL de los puntos finales funcionan con herramientas de monitorización externas:
- Monitoreo de tiempo de actividad (Pingdom, UptimeRobot)
- Herramientas APM (Datadog, New Relic)
- Comprobaciones de estado personalizadas a través de
/healthendpoint
¿Qué tan precisos son los valores de latencia?
Las métricas de latencia miden:
- P50: Tiempo de respuesta mediano
- P95: percentil 95
- P99: percentil 99
Estos representan el tiempo de procesamiento del lado del servidor, sin incluir la latencia de red para sus usuarios.
¿Por qué mis métricas están retrasadas?
Las métricas tienen un retraso de aproximadamente 2 minutos debido a:
- Pipeline de agregación de métricas
- Ventanas de agregación
- Caché del panel de control
Para depuración en tiempo real, consulte los registros que son casi instantáneos.
¿Puedo monitorear múltiples endpoints simultáneamente?
Sí, la página de despliegues muestra todos los puntos finales con tarjetas de resumen agregadas. Utilice la vista de tabla para comparar el rendimiento entre los despliegues.