Link to this sectionМониторинг#
Ultralytics Platform предоставляет функции мониторинга для развернутых эндпоинтов. Отслеживай метрики запросов, просматривай логи и проверяй статус работоспособности с помощью автоматического опроса.

Link to this sectionДашборд развертываний#
Страница Deploy в боковой панели служит дашбордом для мониторинга всех твоих развертываний. Она объединяет карту мира, обзорные метрики и управление развертываниями в одном представлении. Ознакомься с разделом Выделенные эндпоинты для создания и управления развертываниями.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this sectionКарточки обзора#
Четыре сводные карточки в верхней части страницы показывают:

| Метрика | Описание |
|---|---|
| Всего запросов (24ч) | Запросы по всем эндпоинтам |
| Активные развертывания | Запущенные в данный момент эндпоинты |
| Частота ошибок (24ч) | Процент неудачных запросов |
| P95 задержка (24ч) | 95-й перцентиль времени отклика |
Карточка частоты ошибок подсвечивается красным, если этот показатель превышает 5%. Перейди на вкладку Logs для конкретного развертывания, чтобы диагностировать ошибки.
Link to this sectionКарта мира#
Интерактивная карта мира показывает:
- Пины регионов для всех 43 доступных регионов
- Зеленые пины для развернутых регионов
- Анимированные синие пины для регионов, в которых идет процесс развертывания
- Размер пина меняется в зависимости от статуса развертывания и задержки

Link to this sectionСписок развертываний#
Под карточками обзора находится список всех эндпоинтов в твоих проектах. Используй переключатель режима просмотра для выбора между:
| Вид | Описание |
|---|---|
| Cards | Карточками с полной информацией, включая вкладки метрик, логов, кода и предсказаний |
| Compact | Сеткой из компактных карточек (1–4 столбца) с основными метриками |
| Table | Таблицей данных с сортируемыми столбцами: Имя, Регион, Статус, Запросы, P95, Ошибки |
Дашборд опрашивает статус развертывания каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), интервал опроса сокращается до 3 секунд. Графики метрик обновляются каждые 60 секунд. Нажми кнопку обновления для получения актуальных данных мгновенно.
Link to this sectionМетрики для каждого развертывания#
Каждая карточка развертывания (в режиме отображения карточками) показывает метрики в реальном времени:
Link to this sectionРяд метрик#
| Метрика | Описание |
|---|---|
| Запросы | Количество запросов (24ч) со значком |
| P95 задержка | 95-й перцентиль времени отклика |
| Частота ошибок | Процент неудачных запросов |
Метрики извлекаются из эндпоинта спарклайн API и обновляются каждые 60 секунд.
Link to this sectionПроверка работоспособности#
Запущенные развертывания отображают индикатор работоспособности:
| Индикатор | Значение |
|---|---|
| Зеленое сердце | Работает исправно — показывает задержку отклика |
| Красное сердце | Ошибка — показывает сообщение об ошибке |
| Вращающийся значок | Идет проверка работоспособности |
Проверки работоспособности автоматически повторяются каждые 20 секунд в случае ошибки. Нажми на значок обновления, чтобы запустить проверку вручную. Проверка использует тайм-аут 55 секунд, чтобы учесть холодный старт эндпоинтов с масштабированием до нуля.

Проверка работоспособности использует тайм-аут 55 секунд для учета холодного старта на эндпоинтах с масштабированием до нуля (в худшем случае до ~45 секунд). Как только эндпоинт прогреется, проверки будут выполняться за миллисекунды.
Link to this sectionЛоги#
Каждая карточка развертывания содержит вкладку Logs для просмотра последних записей:

Link to this sectionЗаписи логов#
Каждая запись лога показывает:
| Поле | Описание |
|---|---|
| Серьезность | Цветовая полоса (см. ниже) |
| Метка времени | Время запроса (локальный формат) |
| Сообщение | Содержимое лога |
| HTTP информация | Код статуса и задержка (если применимо) |
Фильтруй логи по уровню серьезности с помощью кнопок:
| Уровень | Цвет | Описание |
|---|---|---|
| DEBUG | Серый | Отладочные сообщения |
| INFO | Синий | Обычные запросы |
| WARNING | Желтый | Некритические проблемы |
| ERROR | Красный | Неудачные запросы |
| CRITICAL | Темно-красный | Критические сбои |
Интерфейс показывает 20 последних записей. API по умолчанию возвращает 50 записей на запрос (макс. 200).
При расследовании ошибок: сначала нажми Ошибки, чтобы отфильтровать записи ERROR и WARNING, затем проверь метки времени и HTTP-коды статусов. Копируй логи в буфер обмена, чтобы поделиться ими с командой.
Link to this sectionПримеры кода#
Каждая карточка развертывания содержит вкладку Code с готовым к использованию API-кодом, содержащим URL твоего эндпоинта и API-ключ:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())При просмотре вкладки Code на платформе URL твоего эндпоинта и API-ключ заполняются автоматически. Скопируй код и запусти его напрямую. См. раздел API Ключи для генерации ключа.
Link to this sectionИнференс развертывания (Deployment Predict)#
Вкладка Predict на каждой карточке развертывания предоставляет встроенную панель предсказаний — это тот же интерфейс, что и вкладка Predict у модели, но запуск инференса происходит через эндпоинт развертывания, а не через общий сервис. Это полезно для тестирования развернутого эндпоинта прямо из браузера. Подробную информацию о параметрах и форматах ответов смотри в Inference.
Link to this sectionAPI эндпоинты#
Link to this sectionОбзор мониторинга#
GET /api/monitoringВозвращает агрегированные метрики для всех развертываний, принадлежащих авторизованному пользователю. Учитывает рабочую область через необязательный параметр запроса owner.
Link to this sectionМетрики развертывания#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hВозвращает спарклайн-данные и сводные метрики для конкретного развертывания. Интервал обновления: 60 секунд.
| Параметр | Тип | Описание |
|---|---|---|
sparkline | bool | Включить спарклайн-данные |
range | string | Временной диапазон: 1h, 6h, 24h, 7d или 30d |
Link to this sectionЛоги развертывания#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGВозвращает последние записи логов с возможностью фильтрации по уровню серьезности и пагинацией.
| Параметр | Тип | Описание |
|---|---|---|
limit | int | Максимальное количество записей (по умолчанию: 50, макс: 200) |
severity | string | Фильтр серьезности, разделенный запятыми |
pageToken | string | Токен пагинации из предыдущего ответа |
Link to this sectionСостояние развертывания#
GET /api/deployments/{deploymentId}/healthВозвращает статус проверки работоспособности (health check) с задержкой ответа.
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this sectionОптимизация производительности#
Используй данные мониторинга для оптимизации своих развертываний:
Если задержка слишком высокая:
- Проверь количество инстансов (возможно, нужно больше)
- Убедись, что размер модели соответствует задачам
- Рассмотри использование более близкого региона
- Проверь размер отправляемых изображений
Переключись с imgsz=1280 на imgsz=640 для ускорения примерно в 4 раза при минимальной потере точности для большинства случаев использования. Разверни в регионе, который ближе к твоим пользователям, чтобы снизить сетевую задержку.
Link to this sectionFAQ#
Link to this sectionКак долго хранятся данные?#
| Тип данных | Хранение |
|---|---|
| Metrics (Метрики) | 30 дней |
| Логи | 7 дней |
Link to this sectionМожно ли настроить внешний мониторинг?#
Да, URL эндпоинтов работают с внешними инструментами мониторинга:
- Мониторинг аптайма (Pingdom, UptimeRobot)
- Инструменты APM (Datadog, New Relic)
- Пользовательские проверки через эндпоинт
/health
Link to this sectionНасколько точны показатели задержки?#
Метрики задержки измеряют:
- P50: медианное время отклика
- P95: 95-й перцентиль
- P99: 99-й перцентиль
Это время серверной обработки, не включая сетевую задержку до твоих пользователей.
Link to this sectionПочему мои метрики запаздывают?#
Метрики имеют задержку около 2 минут из-за:
- Конвейера агрегации метрик
- Окон агрегации
- Кэширования дэшборда
Для отладки в реальном времени проверяй логи, которые приходят почти мгновенно.
Link to this sectionМожно ли мониторить несколько эндпоинтов вместе?#
Да, страница развертываний показывает все эндпоинты с карточками общего обзора. Используй табличный вид для сравнения производительности между развертываниями.