Monitorización
Ultralytics Platform ofrece monitoreo integral para los endpoints desplegados. track métricas de solicitud, visualice registros y analice el rendimiento en tiempo real.
Panel de Monitorización
Acceda al panel de monitoreo global desde la barra lateral:
- Haga clic en Monitoring en la barra lateral
- Vea todos los despliegues de un vistazo
- Haga clic en endpoints individuales para ver los detalles
Tarjetas de Resumen
| Métrica | Descripción |
|---|---|
| Solicitudes Totales | Solicitudes en todos los endpoints (24h) |
| Despliegues Activos | Endpoints actualmente en ejecución |
| Tasa de Error | Porcentaje de solicitudes fallidas |
| Latencia Promedio | Tiempo medio de respuesta |
Tabla de Despliegues
Vea todos los despliegues con métricas clave:
| Columna | Descripción |
|---|---|
| Modelo | Nombre del modelo con enlace |
| Región | Región desplegada con bandera |
| Estado | Indicador de Ejecución/Detenido |
| Solicitudes | Recuento de solicitudes (24h) |
| Latencia | Tiempo de respuesta P50 |
| Errores | Recuento de errores (24h) |
| Minigráfico | Visualización de la tendencia de tráfico |
Actualizaciones en tiempo real
El panel se actualiza cada 30 segundos. Haga clic en actualizar para obtener actualizaciones inmediatas.
Métricas de Punto Final
Ver métricas detalladas para endpoints individuales:
- Navegue a la pestaña Deploy de su modelo
- Haga clic en un endpoint
- Ver el panel de métricas
Métricas Disponibles
| Métrica | Descripción | Unidad |
|---|---|---|
| Recuento de solicitudes | Solicitudes totales a lo largo del tiempo | recuento |
| Latencia de solicitud | Distribución del tiempo de respuesta | ms |
| Tasa de Error | Porcentaje de solicitudes fallidas | % |
| Número de instancias | Instancias de contenedores activas | recuento |
| Utilización de CPU | Uso del procesador | % |
| Uso de memoria | Consumo de RAM | MB |
Rangos de Tiempo
Seleccionar rango de tiempo para las métricas:
| Rango | Descripción |
|---|---|
| 1h | Última hora |
| 6h | Últimas 6 horas |
| 24h | Últimas 24 horas (predeterminado) |
| 7d | Últimos 7 días |
Gráficos de Métricas
Los gráficos interactivos muestran:
- Gráficos de líneas para tendencias a lo largo del tiempo
- Pase el ratón para ver los valores exactos
- Haga zoom para analizar períodos específicos
Registros
Ver registros de solicitudes para depuración:
Entradas de Registro
Cada entrada de registro muestra:
| Campo | Descripción |
|---|---|
| Marca de tiempo | Tiempo de solicitud |
| Gravedad | INFO, WARNING, ERROR |
| Mensaje | Contenido del registro |
| ID de solicitud | Identificador único |
Niveles de Gravedad
Filtrar registros por gravedad:
| Nivel | Color | Descripción |
|---|---|---|
| INFO | Azul | Solicitudes normales |
| WARNING | Amarillo | Problemas no críticos |
| ERROR | Rojo | Solicitudes fallidas |
Filtrado de Registros
Filtre los registros para encontrar problemas:
- Seleccione el nivel de gravedad
- Buscar por palabra clave
- Filtrar por rango de tiempo
Alertas
Configure alertas para problemas de endpoint (próximamente):
| Tipo de alerta | Disparador |
|---|---|
| Alta Tasa de Errores | Tasa de error > umbral |
| Alta Latencia | Latencia P95 > umbral |
| Sin solicitudes | Cero solicitudes durante el período |
| Escalado | Instancias a máxima capacidad |
Optimización del rendimiento
Utilice los datos de monitoreo para optimizar:
Alta Latencia
Si la latencia es demasiado alta:
- Verifique el número de instancias (puede que necesite más)
- Verifique que el tamaño del modelo sea adecuado
- Considere una región más cercana
- Verifique los tamaños de las imágenes que se envían
Alta Tasa de Errores
Si se producen errores:
- Revise los registros de errores para obtener detalles
- Verificar el formato de la solicitud
- Verificar la validez de la clave API
- Comprobar los límites de tasa
Problemas de Escalado
Si se alcanza la capacidad máxima:
- Aumentar el número máximo de instancias
- Establecer el número mínimo de instancias > 0
- Considerar múltiples regiones
- Optimizar el procesamiento por lotes de solicitudes
Exportar Datos
Exportar datos de monitoreo para su análisis:
- Seleccionar rango de tiempo
- Haga clic en Exportar
- Descargar archivo CSV
La exportación incluye:
- Marca de tiempo
- Recuento de solicitudes
- Métricas de latencia
- Recuento de errores
- Métricas de instancia
Preguntas frecuentes
¿Cuánto tiempo se retienen los datos?
| Tipo de datos | Retención |
|---|---|
| Métricas | 30 días |
| Registros | 7 días |
| Alertas | 90 días |
¿Puedo configurar un monitoreo externo?
Sí, las URL de los puntos finales funcionan con herramientas de monitorización externas:
- Monitoreo de tiempo de actividad (Pingdom, UptimeRobot)
- Herramientas APM (Datadog, New Relic)
- Comprobaciones de estado personalizadas
¿Qué tan precisos son los valores de latencia?
Las métricas de latencia miden:
- P50: Tiempo de respuesta mediano
- P95: percentil 95
- P99: percentil 99
Estos representan el tiempo de procesamiento del lado del servidor, sin incluir la latencia de red para sus usuarios.
¿Por qué mis métricas están retrasadas?
Las métricas tienen un retraso de aproximadamente 2 minutos debido a:
- Pipeline de agregación de métricas
- Ventanas de agregación
- Caché del panel de control
Para depuración en tiempo real, consulte los registros que son casi instantáneos.
¿Puedo monitorear múltiples endpoints simultáneamente?
Sí, el panel de monitorización global muestra todos los puntos finales. Utilice la tabla para comparar el rendimiento entre despliegues.