Meet YOLO26: next-gen vision AI.

Link to this sectionMonitorización#

Ultralytics Platform proporciona monitorización para endpoints desplegados. Realiza un seguimiento de las métricas de solicitud, visualiza registros y comprueba el estado de salud con el sondeo automático.

Ultralytics Platform Deploy Page Overview Cards And World Map

Link to this sectionPanel de despliegues#

La página Deploy en la barra lateral sirve como panel de control de monitorización para todos tus despliegues. Combina el mapa mundial, métricas generales y la gestión de despliegues en una única vista. Consulta Dedicated Endpoints para crear y gestionar despliegues.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionTarjetas de resumen#

Cuatro tarjetas de resumen en la parte superior de la página muestran:

Ultralytics Platform Deploy Page Four Overview Cards

MétricaDescripción
Solicitudes totales (24h)Solicitudes a través de todos los endpoints
Despliegues activosEndpoints actualmente en ejecución
Tasa de error (24h)Porcentaje de solicitudes fallidas
Latencia P95 (24h)Tiempo de respuesta en el percentil 95
Alerta de tasa de error

La tarjeta de tasa de error se resalta en rojo cuando la tasa supera el 5%. Comprueba la pestaña Logs en los despliegues individuales para diagnosticar errores.

Link to this sectionMapa mundial#

El mapa mundial interactivo muestra:

  • Marcadores de región para las 43 regiones disponibles
  • Marcadores verdes para las regiones desplegadas
  • Marcadores azules animados para regiones con despliegues activos en progreso
  • El tamaño del marcador varía según el estado del despliegue y la latencia

Ultralytics Platform Deploy Page World Map With Deployed Regions

Link to this sectionLista de despliegues#

Debajo de las tarjetas de resumen, la lista de despliegues muestra todos los endpoints de tus proyectos. Utiliza el selector de modo de vista para cambiar entre:

VistaDescripción
TarjetasTarjetas detalladas con pestañas de métricas, registros, código y predicción
CompactoCuadrícula de tarjetas pequeñas (1-4 columnas) con métricas clave
TablaDataTable con columnas ordenables: Nombre, Región, Estado, Solicitudes, P95, Errores
Actualizaciones en tiempo real

El panel realiza un sondeo cada 15 segundos para obtener actualizaciones del estado del despliegue. Cuando los despliegues se encuentran en un estado de transición (creating, deploying o stopping), el sondeo aumenta a cada 3 segundos. Los gráficos de métricas se actualizan cada 60 segundos. Haz clic en el botón de refrescar para obtener actualizaciones inmediatas.

Link to this sectionMétricas por despliegue#

Cada tarjeta de despliegue (en la vista de tarjetas) muestra métricas en tiempo real:

Link to this sectionFila de métricas#

MétricaDescripción
SolicitudesNúmero de solicitudes (24h) con icono
Latencia P95Tiempo de respuesta en el percentil 95
Tasa de errorPorcentaje de solicitudes fallidas

Las métricas se obtienen del endpoint de la API de sparkline y se actualizan cada 60 segundos.

Link to this sectionComprobación de estado#

Los despliegues en ejecución muestran un indicador de comprobación de estado:

IndicadorSignificado
Corazón verdeSaludable: muestra la latencia de respuesta
Corazón rojoNo saludable: muestra el mensaje de error
Icono giratorioComprobación de estado en progreso

Las comprobaciones de estado se reintentan automáticamente cada 20 segundos cuando no son saludables. Haz clic en el icono de refrescar para activar manualmente una comprobación de estado. La comprobación utiliza un tiempo de espera de 55 segundos para adaptarse a arranques en frío en endpoints con escalado a cero.

Ultralytics Platform Deployment Card Health Check Healthy With Latency

Tolerancia al arranque en frío

La comprobación de estado utiliza un tiempo de espera de 55 segundos para contabilizar los arranques en frío en endpoints con escalado a cero (hasta ~45 segundos en el peor de los casos). Una vez que el endpoint se calienta, las comprobaciones de estado se completan en milisegundos.

Link to this sectionRegistros#

Cada tarjeta de despliegue incluye una pestaña Logs para ver las entradas de registro recientes:

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Link to this sectionEntradas de registro#

Cada entrada de registro muestra:

CampoDescripción
SeveridadBarra codificada por colores (ver abajo)
Marca de tiempoHora de solicitud (formato local)
MensajeContenido del registro
Información HTTPCódigo de estado y latencia (si procede)

Filtra los registros por severidad usando los botones de filtro:

NivelColorDescripción
DEBUGGrisMensajes de depuración
INFOAzulSolicitudes normales
WARNINGAmarilloProblemas no críticos
ERRORRojoSolicitudes fallidas
CRITICALRojo oscuroFallos críticos

La interfaz muestra las 20 entradas más recientes. La API tiene un límite por defecto de 50 entradas por solicitud (máximo 200).

Flujo de trabajo de depuración

Al investigar errores: haz clic primero en Errores para filtrar las entradas ERROR y WARNING, luego revisa las marcas de tiempo y los códigos de estado HTTP. Copia los registros al portapapeles para compartirlos con tu equipo.

Link to this sectionEjemplos de código#

Cada tarjeta de despliegue incluye una pestaña Code que muestra código de API listo para usar con tu URL de endpoint real y clave de API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Credenciales autocompletadas

Al visualizar la pestaña Code en la plataforma, tu URL de endpoint real y tu clave de API se rellenan automáticamente. Copia el código y ejecútalo directamente. Consulta API Keys para generar una clave.

Link to this sectionInferencia de despliegue#

La pestaña Predict en cada tarjeta de implementación proporciona un panel de predicción integrado: la misma interfaz que la pestaña Predict del modelo, pero ejecutando la inferencia a través del endpoint de implementación en lugar del servicio compartido. Esto es útil para probar un endpoint implementado directamente desde el navegador. Consulta Inference para ver los detalles de los parámetros y los formatos de respuesta.

Link to this sectionEndpoints de la API#

Link to this sectionDescripción general de la monitorización#

GET /api/monitoring

Devuelve métricas agregadas para todas las implementaciones propiedad del usuario autenticado. Reconoce el espacio de trabajo mediante el parámetro de consulta opcional owner.

Link to this sectionMétricas de implementación#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Devuelve datos de minigráficos (sparkline) y métricas de resumen para una implementación específica. Intervalo de actualización: 60 segundos.

ParámetroTipoDescripción
sparklineboolIncluir datos de minigráficos
rangecadenaIntervalo de tiempo: 1h, 6h, 24h, 7d o 30d

Link to this sectionRegistros de implementación#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Devuelve entradas de registro recientes con filtro de gravedad y paginación opcionales.

ParámetroTipoDescripción
limitenteroMáximo de entradas a devolver (predeterminado: 50, máximo: 200)
severitycadenaFiltro de gravedad separado por comas
pageTokencadenaToken de paginación de la respuesta anterior

Link to this sectionEstado de la implementación#

GET /api/deployments/{deploymentId}/health

Devuelve el estado de la comprobación de salud junto con la latencia de respuesta.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionOptimización del rendimiento#

Usa los datos de monitorización para optimizar tus implementaciones:

Si la latencia es demasiado alta:

  1. Comprueba el número de instancias (quizás necesites más)
  2. Verifica que el tamaño del modelo sea el adecuado
  3. Considera una región más cercana
  4. Comprueba los tamaños de las imágenes enviadas
Reducción de la latencia

Cambia de imgsz=1280 a imgsz=640 para obtener una aceleración de ~4x con una pérdida de precisión mínima en la mayoría de los casos de uso. Implementa en una región más cercana a tus usuarios para reducir la latencia de red.

Link to this sectionFAQ#

Link to this section¿Cuánto tiempo se retienen los datos?#

Tipo de datoRetención
Metrics30 días
Registros (Logs)7 días

Link to this section¿Puedo configurar una monitorización externa?#

Sí, las URL de los endpoints funcionan con herramientas de monitorización externas:

  • Monitorización de tiempo de actividad (Pingdom, UptimeRobot)
  • Herramientas de APM (Datadog, New Relic)
  • Comprobaciones de salud personalizadas mediante el endpoint /health

Link to this section¿Qué tan precisos son los números de latencia?#

Las métricas de latencia miden:

  • P50: Tiempo medio de respuesta
  • P95: Percentil 95
  • P99: Percentil 99

Estos representan el tiempo de procesamiento del lado del servidor, sin incluir la latencia de red para tus usuarios.

Link to this section¿Por qué mis métricas están retrasadas?#

Las métricas tienen un retraso de ~2 minutos debido a:

  • La canalización de agregación de métricas
  • Ventanas de agregación
  • Caché del panel de control

Para una depuración en tiempo real, consulta los registros, que son casi instantáneos.

Link to this section¿Puedo monitorizar varios endpoints juntos?#

Sí, la página de implementaciones muestra todos los endpoints con tarjetas de resumen agregadas. Utiliza la vista de tabla para comparar el rendimiento entre implementaciones.

Comentarios