Ir al contenido

Monitorización

La Plataforma Ultralytics proporciona monitoreo para puntos finales desplegados. Rastree métricas de solicitudes, vea registros y verifique el estado de salud con sondeo automático.

Tarjetas de resumen y mapa mundial de la página de Despliegue de la Plataforma Ultralytics

Panel de Despliegues

El Deploy página en la barra lateral sirve como el panel de monitoreo para todos sus despliegues. Combina el mapa mundial, las métricas de resumen y la gestión de despliegues en una sola vista. Ver Endpoints Dedicados para la creación y gestión de despliegues.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Tarjetas de Resumen

Cuatro tarjetas de resumen en la parte superior de la página muestran:

Cuatro tarjetas de resumen de la página de Despliegue de la Plataforma Ultralytics

MétricaDescripción
Solicitudes Totales (24h)Solicitudes en todos los puntos finales
Despliegues ActivosEndpoints actualmente en ejecución
Tasa de error (24h)Porcentaje de solicitudes fallidas
Latencia P95 (24h)Tiempo de respuesta del percentil 95

Alerta de tasa de error

La tarjeta de tasa de error resalta en rojo cuando la tasa supera el 5%. Consulte la Logs pestaña en despliegues individuales para diagnosticar errores.

Mapa Mundial

El mapa interactivo del mundo muestra:

  • Pines de región para las 43 regiones disponibles
  • Pines verdes para regiones desplegadas
  • Pines azules animados para regiones con despliegues activos en curso
  • Tamaño del pin varía según el estado de despliegue y la latencia

Mapa mundial con regiones desplegadas de la página de Despliegue de la Plataforma Ultralytics

Lista de Despliegues

Debajo de las tarjetas de resumen, la lista de despliegues muestra todos los puntos finales de tus proyectos. Usa el interruptor de modo de vista para alternar entre:

VerDescripción
TarjetasTarjetas de detalles completos con métricas, registros, código y pestañas de predicción
CompactoCuadrícula de tarjetas más pequeñas (1-4 columnas) con métricas clave
TablaTabla de datos con columnas ordenables: Nombre, Región, Estado, Solicitudes, P95, Errores

Actualizaciones en tiempo real

El panel de control consulta cada 30 segundos para obtener actualizaciones de métricas. Cuando los despliegues se encuentran en un estado de transición (creando, desplegando), la frecuencia de consulta aumenta a cada 3 segundos. Haga clic en el botón de actualizar para obtener actualizaciones inmediatas.

Métricas por implementación

Cada tarjeta de despliegue (en vista de tarjetas) muestra métricas en tiempo real:

Fila de métricas

MétricaDescripción
SolicitudesRecuento de solicitudes (24h) con icono
Latencia P95Tiempo de respuesta del percentil 95
Tasa de ErrorPorcentaje de solicitudes fallidas

Las métricas se obtienen del endpoint de la API de sparkline y se actualizan cada 60 segundos.

Comprobación del estado

Los despliegues en ejecución muestran un indicador de estado de salud:

IndicadorSignificado
Corazón verdeSaludable — muestra la latencia de respuesta
Corazón rojoNo saludable — muestra mensaje de error
Icono giratorioVerificación de estado en curso

Las verificaciones de estado se reintentan automáticamente cada 20 segundos cuando el sistema no está saludable. Haga clic en el icono de actualizar para activar manualmente una verificación de estado. La verificación de estado utiliza un tiempo de espera de 55 segundos para acomodar los arranques en frío en los puntos finales de escalado a cero.

Verificación de salud correcta con latencia de la tarjeta de Despliegue de la Plataforma Ultralytics

Tolerancia al Arranque en Frío

La comprobación de estado utiliza un tiempo de espera de 55 segundos para tener en cuenta los arranques en frío en los puntos finales de escalado a cero (hasta ~45 segundos en el peor de los casos). Una vez que el punto final se calienta, las comprobaciones de estado se completan en milisegundos.

Registros

Cada tarjeta de despliegue incluye un/una Logs pestaña para ver las entradas de registro recientes:

Pestaña de registros con filtro de severidad de la tarjeta de Despliegue de la Plataforma Ultralytics

Entradas de Registro

Cada entrada de registro muestra:

CampoDescripción
GravedadBarra codificada por colores (ver abajo)
Marca de tiempoHora de la solicitud (formato local)
MensajeContenido del registro
Información HTTPCódigo de estado y latencia (si aplica)

Filtrar registros por gravedad utilizando los botones de filtro:

NivelColorDescripción
DEBUGGrisMensajes de depuración
INFOAzulSolicitudes normales
WARNINGAmarilloProblemas no críticos
ERRORRojoSolicitudes fallidas
CRÍTICORojo OscuroFallos críticos
ControlDescripción
ErroresFiltrar a entradas de ERROR y ADVERTENCIA
Todos losMostrar todas las entradas del registro
CopiarCopiar todos los registros visibles al portapapeles
ActualizarRecargar entradas de registro

La interfaz de usuario muestra las 20 entradas más recientes. La API predetermina 50 entradas por solicitud (máx. 200).

Flujo de trabajo de depuración

Al investigar errores: primero haga clic en Errors para filtrar las entradas de ERROR y WARNING, luego revise las marcas de tiempo y los códigos de estado HTTP. Copie los registros al portapapeles para compartirlos con su equipo.

Ejemplos de Código

Cada tarjeta de despliegue incluye un/una Code pestaña que muestra código API listo para usar con su URL de endpoint y clave API reales:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Credenciales autocompletadas

Al ver el Code pestaña en la plataforma, su URL de endpoint real y su clave de API se rellenan automáticamente. Copie el código y ejecútelo directamente. Consulte Claves de API para generar una clave.

Predicción del Despliegue

El Predict pestaña en cada tarjeta de despliegue proporciona un panel de predicción en línea — la misma interfaz que la del modelo Predict pestaña, pero ejecutando la inferencia a través del endpoint de despliegue en lugar del servicio compartido. Esto es útil para probar un endpoint desplegado directamente desde el navegador. Véase Inferencia para detalles de parámetros y formatos de respuesta.

Puntos finales de la API

Resumen de Monitorización

GET /api/monitoring

Devuelve métricas agregadas para todas las implementaciones propiedad del usuario autenticado. Consciente del espacio de trabajo a través de opcional owner parámetro de consulta.

Métricas de Despliegue

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Devuelve datos de sparkline y métricas resumidas para un despliegue específico. Intervalo de actualización: 60 segundos.

ParámetroTipoDescripción
sparklinebooleanoIncluir datos de minigráficos
rangestringRango de tiempo: 1h, 6h, 24h, 7d, o 30d

Registros de Despliegue

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Devuelve las entradas de registro recientes con filtro de severidad opcional y paginación.

ParámetroTipoDescripción
limitintMáximo de entradas a devolver (por defecto: 50, máximo: 200)
severitystringFiltro de severidad separado por comas
pageTokenstringToken de paginación de la respuesta anterior

Estado del Despliegue

GET /api/deployments/{deploymentId}/health

Devuelve el estado de la comprobación de salud con la latencia de respuesta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Optimización del rendimiento

Utilice datos de monitoreo para optimizar sus despliegues:

Si la latencia es demasiado alta:

  1. Verifique el número de instancias (puede que necesite más)
  2. Verifique que el tamaño del modelo sea adecuado
  3. Considere una región más cercana
  4. Verifique los tamaños de las imágenes que se envían

Reducción de la latencia

Cambiar de imgsz=1280 a datos imgsz=640 para una aceleración de ~4x con una pérdida mínima de precisión para la mayoría de los casos de uso. Despliegue en una región más cercana a sus usuarios para una menor latencia de red.

Si se producen errores:

  1. Revisar los registros de errores en el Logs pestaña
  2. Verifique el formato de la solicitud (se requiere formulario multipart)
  3. Verificar la validez de la clave API
  4. Comprobar los límites de tasa

Si se alcanza la capacidad máxima:

  1. Considerar múltiples regiones
  2. Optimizar el procesamiento por lotes de solicitudes
  3. Aumentar los recursos de CPU y memoria

Preguntas frecuentes

¿Cuánto tiempo se retienen los datos?

Tipo de datosRetención
Métricas30 días
Registros7 días

¿Puedo configurar un monitoreo externo?

Sí, las URL de los puntos finales funcionan con herramientas de monitorización externas:

  • Monitoreo de tiempo de actividad (Pingdom, UptimeRobot)
  • Herramientas APM (Datadog, New Relic)
  • Comprobaciones de estado personalizadas a través de /health endpoint

¿Qué tan precisos son los valores de latencia?

Las métricas de latencia miden:

  • P50: Tiempo de respuesta mediano
  • P95: percentil 95
  • P99: percentil 99

Estos representan el tiempo de procesamiento del lado del servidor, sin incluir la latencia de red para sus usuarios.

¿Por qué mis métricas están retrasadas?

Las métricas tienen un retraso de aproximadamente 2 minutos debido a:

  • Pipeline de agregación de métricas
  • Ventanas de agregación
  • Caché del panel de control

Para depuración en tiempo real, consulte los registros que son casi instantáneos.

¿Puedo monitorear múltiples endpoints simultáneamente?

Sí, la página de despliegues muestra todos los puntos finales con tarjetas de resumen agregadas. Utilice la vista de tabla para comparar el rendimiento entre los despliegues.



📅 Creado hace 2 meses ✏️ Actualizado hace 25 días
glenn-jochersergiuwaxmann

Comentarios