Link to this sectionМониторинг#

Q: Как долго хранятся данные?

| Тип данных | Хранение | | --------------------- | -------- | | Metrics (Метрики) | 30 дней | | Логи | 7 дней |

Q: Насколько точны показатели задержки?

Метрики задержки измеряют: P50: медианное время отклика; P95: 95-й перцентиль; P99: 99-й перцентиль. Это время серверной обработки, не включая сетевую задержку до твоих пользователей.

Ultralytics Platform предоставляет функции мониторинга для развернутых эндпоинтов. Отслеживай метрики запросов, просматривай логи и проверяй статус работоспособности с помощью автоматического опроса.

Обзор карточек и карты мира на странице развертывания Ultralytics Platform

Link to this sectionДашборд развертываний#

Страница Deploy в боковой панели служит дашбордом для мониторинга всех твоих развертываний. Она объединяет карту мира, обзорные метрики и управление развертываниями в одном представлении. Ознакомься с разделом Выделенные эндпоинты для создания и управления развертываниями.

graph TB
    subgraph Dashboard
        Map[World Map]:::proc --- Cards[Overview Cards]:::proc
        Cards --- List[Deployments List]:::decide
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]:::out
        Health[Health Check]:::out
        Logs[Logs Tab]:::out
        Code[Code Tab]:::out
        Predict[Predict Tab]:::out
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    classDef proc fill:#2196F3,color:#fff
    classDef decide fill:#FF9800,color:#fff
    classDef out fill:#9C27B0,color:#fff

Link to this sectionКарточки обзора#

Четыре сводные карточки в верхней части страницы показывают:

Четыре карточки обзора на странице развертывания Ultralytics Platform

Метрика	Описание
Всего запросов (24ч)	Запросы по всем эндпоинтам
Активные развертывания	Запущенные в данный момент эндпоинты
Частота ошибок (24ч)	Процент неудачных запросов
P95 задержка (24ч)	95-й перцентиль времени отклика

Оповещение о частоте ошибок

Карточка частоты ошибок подсвечивается красным, если этот показатель превышает 5%. Перейди на вкладку Logs для конкретного развертывания, чтобы диагностировать ошибки.

Link to this sectionКарта мира#

Интерактивная карта мира показывает:

Пины регионов для всех 43 доступных регионов
Зеленые пины для развернутых регионов
Анимированные синие пины для регионов, в которых идет процесс развертывания
Размер пина меняется в зависимости от статуса развертывания и задержки

Карта мира на странице развертывания Ultralytics Platform с развернутыми регионами

Link to this sectionСписок развертываний#

Под карточками обзора находится список всех эндпоинтов в твоих проектах. Используй переключатель режима просмотра для выбора между:

Вид	Описание
Cards	Карточками с полной информацией, включая вкладки метрик, логов, кода и предсказаний
Compact	Сеткой из компактных карточек (1–4 столбца) с основными метриками
Table	Таблицей данных с сортируемыми столбцами: Имя, Регион, Статус, Запросы, P95, Ошибки

Обновления в реальном времени

Дашборд опрашивает статус развертывания каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), интервал опроса сокращается до 3 секунд. Графики метрик обновляются каждые 60 секунд. Нажми кнопку обновления для получения актуальных данных мгновенно.

Link to this sectionМетрики для каждого развертывания#

Каждая карточка развертывания (в режиме отображения карточками) показывает метрики в реальном времени:

Link to this sectionРяд метрик#

Метрика	Описание
Запросы	Количество запросов (24ч) со значком
P95 задержка	95-й перцентиль времени отклика
Частота ошибок	Процент неудачных запросов

Метрики извлекаются из эндпоинта спарклайн API и обновляются каждые 60 секунд.

Link to this sectionПроверка работоспособности#

Запущенные развертывания отображают индикатор работоспособности:

Индикатор	Значение
Зеленое сердце	Работает исправно — показывает задержку отклика
Красное сердце	Ошибка — показывает сообщение об ошибке
Вращающийся значок	Идет проверка работоспособности

Проверки работоспособности автоматически повторяются каждые 20 секунд в случае ошибки. Нажми на значок обновления, чтобы запустить проверку вручную. Проверка использует тайм-аут 55 секунд, чтобы учесть холодный старт эндпоинтов с масштабированием до нуля.

Карточка развертывания Ultralytics Platform с индикатором работоспособности и задержкой

Устойчивость к холодному старту

Проверка работоспособности использует тайм-аут 55 секунд для учета холодного старта на эндпоинтах с масштабированием до нуля (в худшем случае до ~45 секунд). Как только эндпоинт прогреется, проверки будут выполняться за миллисекунды.

Link to this sectionЛоги#

Каждая карточка развертывания содержит вкладку Logs для просмотра последних записей:

Вкладка логов на карточке развертывания Ultralytics Platform с фильтром серьезности

Link to this sectionЗаписи логов#

Каждая запись лога показывает:

Поле	Описание
Серьезность	Цветовая полоса (см. ниже)
Метка времени	Время запроса (локальный формат)
Сообщение	Содержимое лога
HTTP информация	Код статуса и задержка (если применимо)

Фильтруй логи по уровню серьезности с помощью кнопок:

Уровень	Цвет	Описание
DEBUG	Серый	Отладочные сообщения
INFO	Синий	Обычные запросы
WARNING	Желтый	Некритические проблемы
ERROR	Красный	Неудачные запросы
CRITICAL	Темно-красный	Критические сбои

Интерфейс показывает 20 последних записей. API по умолчанию возвращает 50 записей на запрос (макс. 200).

Процесс отладки

При расследовании ошибок: сначала нажми Ошибки, чтобы отфильтровать записи ERROR и WARNING, затем проверь метки времени и HTTP-коды статусов. Копируй логи в буфер обмена, чтобы поделиться ими с командой.

Link to this sectionПримеры кода#

Каждая карточка развертывания содержит вкладку Code с готовым к использованию API-кодом, содержащим URL твоего эндпоинта и API-ключ:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Автоматически заполняемые учетные данные

При просмотре вкладки Code на платформе URL твоего эндпоинта и API-ключ заполняются автоматически. Скопируй код и запусти его напрямую. См. раздел API Ключи для генерации ключа.

Link to this sectionИнференс развертывания (Deployment Predict)#

Вкладка Predict на каждой карточке развертывания предоставляет встроенную панель предсказаний — это тот же интерфейс, что и вкладка Predict у модели, но запуск инференса происходит через эндпоинт развертывания, а не через общий сервис. Это полезно для тестирования развернутого эндпоинта прямо из браузера. Подробную информацию о параметрах и форматах ответов смотри в Inference.

Link to this sectionAPI эндпоинты#

Link to this sectionОбзор мониторинга#

GET /api/monitoring

Возвращает агрегированные метрики для всех развертываний, принадлежащих авторизованному пользователю. Учитывает рабочую область через необязательный параметр запроса owner.

Link to this sectionМетрики развертывания#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Возвращает спарклайн-данные и сводные метрики для конкретного развертывания. Интервал обновления: 60 секунд.

Параметр	Тип	Описание
`sparkline`	bool	Включить спарклайн-данные
`range`	string	Временной диапазон: `1h`, `6h`, `24h`, `7d` или `30d`

Link to this sectionЛоги развертывания#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Возвращает последние записи логов с возможностью фильтрации по уровню серьезности и пагинацией.

Параметр	Тип	Описание
`limit`	int	Максимальное количество записей (по умолчанию: 50, макс: 200)
`severity`	string	Фильтр серьезности, разделенный запятыми
`pageToken`	string	Токен пагинации из предыдущего ответа

Link to this sectionСостояние развертывания#

GET /api/deployments/{deploymentId}/health

Возвращает статус проверки работоспособности (health check) с задержкой ответа.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionОптимизация производительности#

Используй данные мониторинга для оптимизации своих развертываний:

Если задержка слишком высокая:

Проверь количество инстансов (возможно, нужно больше)
Убедись, что размер модели соответствует задачам
Рассмотри использование более близкого региона
Проверь размер отправляемых изображений

Снижение задержки

Переключись с imgsz=1280 на imgsz=640 для ускорения примерно в 4 раза при минимальной потере точности для большинства случаев использования. Разверни в регионе, который ближе к твоим пользователям, чтобы снизить сетевую задержку.

Link to this sectionFAQ#

Link to this sectionКак долго хранятся данные?#

Тип данных	Хранение
Metrics (Метрики)	30 дней
Логи	7 дней

Link to this sectionМожно ли настроить внешний мониторинг?#

Да, URL эндпоинтов работают с внешними инструментами мониторинга:

Мониторинг аптайма (Pingdom, UptimeRobot)
Инструменты APM (Datadog, New Relic)
Пользовательские проверки через эндпоинт /health

Link to this sectionНасколько точны показатели задержки?#

Метрики задержки измеряют:

P50: медианное время отклика
P95: 95-й перцентиль
P99: 99-й перцентиль

Это время серверной обработки, не включая сетевую задержку до твоих пользователей.

Link to this sectionПочему мои метрики запаздывают?#

Метрики имеют задержку около 2 минут из-за:

Конвейера агрегации метрик
Окон агрегации
Кэширования дэшборда

Для отладки в реальном времени проверяй логи, которые приходят почти мгновенно.

Link to this sectionМожно ли мониторить несколько эндпоинтов вместе?#

Да, страница развертываний показывает все эндпоинты с карточками общего обзора. Используй табличный вид для сравнения производительности между развертываниями.

Участники

GLglenn-jocher¹¹ SEsergiuwaxmann¹

Создано 14 янв. 2026 г.Обновлено 4 дня назад