Ir al contenido

Supervisión

Ultralytics proporciona una supervisión completa de los terminales implementados. Realice un seguimiento de las métricas de las solicitudes, consulte los registros y analice el rendimiento en tiempo real.

Panel de control

Accede al panel de control global desde la barra lateral:

  1. Haga clic en «Monitorización » en la barra lateral.
  2. Ver todas las implementaciones de un vistazo
  3. Haga clic en cada punto final para obtener más detalles.

Tarjetas de resumen

MétricaDescripción
Total de solicitudesSolicitudes en todos los puntos finales (24 h)
Implementaciones activasPuntos finales actualmente en ejecución
Tasa de errorPorcentaje de solicitudes fallidas
Latencia mediaTiempo medio de respuesta

Tabla de implementaciones

Ver todas las implementaciones con métricas clave:

ColumnaDescripción
ModeloNombre del modelo con enlace
RegiónRegión desplegada con bandera
EstadoIndicador de funcionamiento/parada
SolicitudesRecuento de solicitudes (24 h)
LatenciaTiempo de respuesta P50
ErroresRecuento de errores (24 h)
Gráfico de líneaVisualización de tendencias de tráfico

Actualizaciones en tiempo real

El panel de control realiza sondeos cada 30 segundos. Haga clic en Actualizar para obtener actualizaciones inmediatas.

Métricas de punto final

Ver métricas detalladas para puntos finales individuales:

  1. Navega hasta la pestaña Implementar de tu modelo.
  2. Haga clic en un punto final.
  3. Ver el panel de métricas

Métricas disponibles

MétricaDescripciónUnidad
Recuento de solicitudesTotal de solicitudes a lo largo del tiempocontar
Latencia de solicitudDistribución del tiempo de respuestams
Tasa de errorPorcentaje de solicitudes fallidas%
Número de instanciasInstancias de contenedor activascontar
CPUUso del procesador%
Uso de memoriaConsumo de RAMMB

Intervalos de tiempo

Seleccionar intervalo de tiempo para las métricas:

RangoDescripción
1hÚltima hora
6hÚltimas 6 horas
24hÚltimas 24 horas (predeterminado)
7dÚltimos 7 días

Tablas métricas

Los gráficos interactivos muestran:

  • Gráficos lineales para tendencias a lo largo del tiempo
  • Pase el cursor para ver los valores exactos.
  • Acercar para analizar períodos específicos

Troncos

Ver registros de solicitudes para depuración:

Entradas de registro

Cada entrada del registro muestra:

CampoDescripción
Marca de tiempoHora de la solicitud
GravedadINFORMACIÓN, ADVERTENCIA, ERROR
MensajeContenido del registro
ID de solicitudIdentificador único

Niveles de gravedad

Filtrar registros por gravedad:

NivelColorDescripción
INFORMACIÓNAzulSolicitudes normales
ADVERTENCIAAmarilloCuestiones no críticas
ERRORRojoSolicitudes fallidas

Filtrado de registros

Filtrar registros para encontrar problemas:

  1. Seleccionar nivel de gravedad
  2. Buscar por palabra clave
  3. Filtrar por intervalo de tiempo

Alertas

Configurar alertas para problemas en los terminales (próximamente):

Tipo de alertaGatillo
Alta tasa de errorTasa de error > umbral
Alta latenciaLatencia P95 > umbral
Sin solicitudesCero solicitudes para el período
EscaladoInstancias a capacidad máxima

Optimización del rendimiento

Utilice los datos de supervisión para optimizar:

Alta latencia

Si la latencia es demasiado alta:

  1. Comprueba el número de instancias (puede que se necesiten más).
  2. Verifique que el tamaño del modelo sea adecuado.
  3. Considerar una región más cercana
  4. Comprueba el tamaño de las imágenes que se envían.

Alta tasa de error

Si se producen errores:

  1. Revise los registros de errores para obtener más detalles.
  2. Comprueba el formato de la solicitud.
  3. Verificar que la clave API sea válida
  4. Comprueba los límites de velocidad

Problemas de escalabilidad

Si alcanza la capacidad:

  1. Aumentar el número máximo de instancias
  2. Establecer instancias mínimas > 0
  3. Considerar múltiples regiones
  4. Optimizar el procesamiento por lotes de solicitudes

Exportar datos

Exportar datos de supervisión para su análisis:

  1. Seleccionar intervalo de tiempo
  2. Haga clic en Exportar.
  3. Descargar archivo CSV

La exportación incluye:

  • Marca de tiempo
  • Recuento de solicitudes
  • Métricas de latencia
  • Recuento de errores
  • Métricas de instancia

Preguntas frecuentes

¿Durante cuánto tiempo se conservan los datos?

Tipo de datosRetención
Métricas30 días
Troncos7 días
Alertas90 días

¿Puedo configurar la supervisión externa?

Sí, las URL de los puntos finales funcionan con herramientas de supervisión externas:

  • Supervisión del tiempo de actividad (Pingdom, UptimeRobot)
  • Herramientas APM (Datadog, New Relic)
  • Revisiones médicas personalizadas

¿Qué grado de precisión tienen las cifras de latencia?

Las métricas de latencia miden:

  • P50: Tiempo medio de respuesta
  • P95: percentil 95
  • P99: percentil 99

Estos valores representan el tiempo de procesamiento del servidor, sin incluir la latencia de red para los usuarios.

¿Por qué se retrasan mis métricas?

Las métricas tienen un retraso de aproximadamente 2 minutos debido a:

  • Canalización de agregación de métricas
  • Ventanas de agregación
  • Almacenamiento en caché del panel de control

Para la depuración en tiempo real, comprueba los registros, que son casi instantáneos.

¿Puedo supervisar varios terminales a la vez?

Sí, el panel de control global muestra todos los puntos finales. Utilice la tabla para comparar el rendimiento entre las distintas implementaciones.



📅 Creado hace 0 días ✏️ Actualizado hace 0 días
glenn-jocher

Comentarios