Supervisión
Ultralytics proporciona una supervisión completa de los terminales implementados. Realice un seguimiento de las métricas de las solicitudes, consulte los registros y analice el rendimiento en tiempo real.
Panel de control
Accede al panel de control global desde la barra lateral:
- Haga clic en «Monitorización » en la barra lateral.
- Ver todas las implementaciones de un vistazo
- Haga clic en cada punto final para obtener más detalles.
Tarjetas de resumen
| Métrica | Descripción |
|---|---|
| Total de solicitudes | Solicitudes en todos los puntos finales (24 h) |
| Implementaciones activas | Puntos finales actualmente en ejecución |
| Tasa de error | Porcentaje de solicitudes fallidas |
| Latencia media | Tiempo medio de respuesta |
Tabla de implementaciones
Ver todas las implementaciones con métricas clave:
| Columna | Descripción |
|---|---|
| Modelo | Nombre del modelo con enlace |
| Región | Región desplegada con bandera |
| Estado | Indicador de funcionamiento/parada |
| Solicitudes | Recuento de solicitudes (24 h) |
| Latencia | Tiempo de respuesta P50 |
| Errores | Recuento de errores (24 h) |
| Gráfico de línea | Visualización de tendencias de tráfico |
Actualizaciones en tiempo real
El panel de control realiza sondeos cada 30 segundos. Haga clic en Actualizar para obtener actualizaciones inmediatas.
Métricas de punto final
Ver métricas detalladas para puntos finales individuales:
- Navega hasta la pestaña Implementar de tu modelo.
- Haga clic en un punto final.
- Ver el panel de métricas
Métricas disponibles
| Métrica | Descripción | Unidad |
|---|---|---|
| Recuento de solicitudes | Total de solicitudes a lo largo del tiempo | contar |
| Latencia de solicitud | Distribución del tiempo de respuesta | ms |
| Tasa de error | Porcentaje de solicitudes fallidas | % |
| Número de instancias | Instancias de contenedor activas | contar |
| CPU | Uso del procesador | % |
| Uso de memoria | Consumo de RAM | MB |
Intervalos de tiempo
Seleccionar intervalo de tiempo para las métricas:
| Rango | Descripción |
|---|---|
| 1h | Última hora |
| 6h | Últimas 6 horas |
| 24h | Últimas 24 horas (predeterminado) |
| 7d | Últimos 7 días |
Tablas métricas
Los gráficos interactivos muestran:
- Gráficos lineales para tendencias a lo largo del tiempo
- Pase el cursor para ver los valores exactos.
- Acercar para analizar períodos específicos
Troncos
Ver registros de solicitudes para depuración:
Entradas de registro
Cada entrada del registro muestra:
| Campo | Descripción |
|---|---|
| Marca de tiempo | Hora de la solicitud |
| Gravedad | INFORMACIÓN, ADVERTENCIA, ERROR |
| Mensaje | Contenido del registro |
| ID de solicitud | Identificador único |
Niveles de gravedad
Filtrar registros por gravedad:
| Nivel | Color | Descripción |
|---|---|---|
| INFORMACIÓN | Azul | Solicitudes normales |
| ADVERTENCIA | Amarillo | Cuestiones no críticas |
| ERROR | Rojo | Solicitudes fallidas |
Filtrado de registros
Filtrar registros para encontrar problemas:
- Seleccionar nivel de gravedad
- Buscar por palabra clave
- Filtrar por intervalo de tiempo
Alertas
Configurar alertas para problemas en los terminales (próximamente):
| Tipo de alerta | Gatillo |
|---|---|
| Alta tasa de error | Tasa de error > umbral |
| Alta latencia | Latencia P95 > umbral |
| Sin solicitudes | Cero solicitudes para el período |
| Escalado | Instancias a capacidad máxima |
Optimización del rendimiento
Utilice los datos de supervisión para optimizar:
Alta latencia
Si la latencia es demasiado alta:
- Comprueba el número de instancias (puede que se necesiten más).
- Verifique que el tamaño del modelo sea adecuado.
- Considerar una región más cercana
- Comprueba el tamaño de las imágenes que se envían.
Alta tasa de error
Si se producen errores:
- Revise los registros de errores para obtener más detalles.
- Comprueba el formato de la solicitud.
- Verificar que la clave API sea válida
- Comprueba los límites de velocidad
Problemas de escalabilidad
Si alcanza la capacidad:
- Aumentar el número máximo de instancias
- Establecer instancias mínimas > 0
- Considerar múltiples regiones
- Optimizar el procesamiento por lotes de solicitudes
Exportar datos
Exportar datos de supervisión para su análisis:
- Seleccionar intervalo de tiempo
- Haga clic en Exportar.
- Descargar archivo CSV
La exportación incluye:
- Marca de tiempo
- Recuento de solicitudes
- Métricas de latencia
- Recuento de errores
- Métricas de instancia
Preguntas frecuentes
¿Durante cuánto tiempo se conservan los datos?
| Tipo de datos | Retención |
|---|---|
| Métricas | 30 días |
| Troncos | 7 días |
| Alertas | 90 días |
¿Puedo configurar la supervisión externa?
Sí, las URL de los puntos finales funcionan con herramientas de supervisión externas:
- Supervisión del tiempo de actividad (Pingdom, UptimeRobot)
- Herramientas APM (Datadog, New Relic)
- Revisiones médicas personalizadas
¿Qué grado de precisión tienen las cifras de latencia?
Las métricas de latencia miden:
- P50: Tiempo medio de respuesta
- P95: percentil 95
- P99: percentil 99
Estos valores representan el tiempo de procesamiento del servidor, sin incluir la latencia de red para los usuarios.
¿Por qué se retrasan mis métricas?
Las métricas tienen un retraso de aproximadamente 2 minutos debido a:
- Canalización de agregación de métricas
- Ventanas de agregación
- Almacenamiento en caché del panel de control
Para la depuración en tiempo real, comprueba los registros, que son casi instantáneos.
¿Puedo supervisar varios terminales a la vez?
Sí, el panel de control global muestra todos los puntos finales. Utilice la tabla para comparar el rendimiento entre las distintas implementaciones.