Ir al contenido

Monitorización

Ultralytics Platform ofrece monitoreo integral para los endpoints desplegados. track métricas de solicitud, visualice registros y analice el rendimiento en tiempo real.

Panel de Monitorización

Acceda al panel de monitoreo global desde la barra lateral:

  1. Haga clic en Monitoring en la barra lateral
  2. Vea todos los despliegues de un vistazo
  3. Haga clic en endpoints individuales para ver los detalles

Tarjetas de Resumen

MétricaDescripción
Solicitudes TotalesSolicitudes en todos los endpoints (24h)
Despliegues ActivosEndpoints actualmente en ejecución
Tasa de ErrorPorcentaje de solicitudes fallidas
Latencia PromedioTiempo medio de respuesta

Tabla de Despliegues

Vea todos los despliegues con métricas clave:

ColumnaDescripción
ModeloNombre del modelo con enlace
RegiónRegión desplegada con bandera
EstadoIndicador de Ejecución/Detenido
SolicitudesRecuento de solicitudes (24h)
LatenciaTiempo de respuesta P50
ErroresRecuento de errores (24h)
MinigráficoVisualización de la tendencia de tráfico

Actualizaciones en tiempo real

El panel se actualiza cada 30 segundos. Haga clic en actualizar para obtener actualizaciones inmediatas.

Métricas de Punto Final

Ver métricas detalladas para endpoints individuales:

  1. Navegue a la pestaña Deploy de su modelo
  2. Haga clic en un endpoint
  3. Ver el panel de métricas

Métricas Disponibles

MétricaDescripciónUnidad
Recuento de solicitudesSolicitudes totales a lo largo del tiemporecuento
Latencia de solicitudDistribución del tiempo de respuestams
Tasa de ErrorPorcentaje de solicitudes fallidas%
Número de instanciasInstancias de contenedores activasrecuento
Utilización de CPUUso del procesador%
Uso de memoriaConsumo de RAMMB

Rangos de Tiempo

Seleccionar rango de tiempo para las métricas:

RangoDescripción
1hÚltima hora
6hÚltimas 6 horas
24hÚltimas 24 horas (predeterminado)
7dÚltimos 7 días

Gráficos de Métricas

Los gráficos interactivos muestran:

  • Gráficos de líneas para tendencias a lo largo del tiempo
  • Pase el ratón para ver los valores exactos
  • Haga zoom para analizar períodos específicos

Registros

Ver registros de solicitudes para depuración:

Entradas de Registro

Cada entrada de registro muestra:

CampoDescripción
Marca de tiempoTiempo de solicitud
GravedadINFO, WARNING, ERROR
MensajeContenido del registro
ID de solicitudIdentificador único

Niveles de Gravedad

Filtrar registros por gravedad:

NivelColorDescripción
INFOAzulSolicitudes normales
WARNINGAmarilloProblemas no críticos
ERRORRojoSolicitudes fallidas

Filtrado de Registros

Filtre los registros para encontrar problemas:

  1. Seleccione el nivel de gravedad
  2. Buscar por palabra clave
  3. Filtrar por rango de tiempo

Alertas

Configure alertas para problemas de endpoint (próximamente):

Tipo de alertaDisparador
Alta Tasa de ErroresTasa de error > umbral
Alta LatenciaLatencia P95 > umbral
Sin solicitudesCero solicitudes durante el período
EscaladoInstancias a máxima capacidad

Optimización del rendimiento

Utilice los datos de monitoreo para optimizar:

Alta Latencia

Si la latencia es demasiado alta:

  1. Verifique el número de instancias (puede que necesite más)
  2. Verifique que el tamaño del modelo sea adecuado
  3. Considere una región más cercana
  4. Verifique los tamaños de las imágenes que se envían

Alta Tasa de Errores

Si se producen errores:

  1. Revise los registros de errores para obtener detalles
  2. Verificar el formato de la solicitud
  3. Verificar la validez de la clave API
  4. Comprobar los límites de tasa

Problemas de Escalado

Si se alcanza la capacidad máxima:

  1. Aumentar el número máximo de instancias
  2. Establecer el número mínimo de instancias > 0
  3. Considerar múltiples regiones
  4. Optimizar el procesamiento por lotes de solicitudes

Exportar Datos

Exportar datos de monitoreo para su análisis:

  1. Seleccionar rango de tiempo
  2. Haga clic en Exportar
  3. Descargar archivo CSV

La exportación incluye:

  • Marca de tiempo
  • Recuento de solicitudes
  • Métricas de latencia
  • Recuento de errores
  • Métricas de instancia

Preguntas frecuentes

¿Cuánto tiempo se retienen los datos?

Tipo de datosRetención
Métricas30 días
Registros7 días
Alertas90 días

¿Puedo configurar un monitoreo externo?

Sí, las URL de los puntos finales funcionan con herramientas de monitorización externas:

  • Monitoreo de tiempo de actividad (Pingdom, UptimeRobot)
  • Herramientas APM (Datadog, New Relic)
  • Comprobaciones de estado personalizadas

¿Qué tan precisos son los valores de latencia?

Las métricas de latencia miden:

  • P50: Tiempo de respuesta mediano
  • P95: percentil 95
  • P99: percentil 99

Estos representan el tiempo de procesamiento del lado del servidor, sin incluir la latencia de red para sus usuarios.

¿Por qué mis métricas están retrasadas?

Las métricas tienen un retraso de aproximadamente 2 minutos debido a:

  • Pipeline de agregación de métricas
  • Ventanas de agregación
  • Caché del panel de control

Para depuración en tiempo real, consulte los registros que son casi instantáneos.

¿Puedo monitorear múltiples endpoints simultáneamente?

Sí, el panel de monitorización global muestra todos los puntos finales. Utilice la tabla para comparar el rendimiento entre despliegues.



📅 Creado hace 20 días ✏️ Actualizado hace 20 días
glenn-jocher

Comentarios