Мониторинг
Ultralytics Platform обеспечивает мониторинг развернутых эндпоинтов. Отслеживай метрики запросов, просматривай логи и проверяй статус работоспособности с помощью автоматического опроса.

Панель управления развертываниями
Страница Deploy на боковой панели служит панелью мониторинга для всех твоих развертываний. Она объединяет карту мира, обзорные метрики и управление развертываниями в одном представлении. См. Выделенные эндпоинты для создания развертываний и управления ими.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffОбзорные карточки
Четыре сводные карточки в верхней части страницы отображают:

| Метрика | Описание |
|---|---|
| Всего запросов (24ч) | Запросы по всем эндпоинтам |
| Активные развертывания | Текущие запущенные эндпоинты |
| Частота ошибок (24ч) | Процент неудачных запросов |
| P95 Latency (24ч) | Время отклика 95-го перцентиля |
Карточка частоты ошибок подсвечивается красным, когда показатель превышает 5%. Проверяй вкладку Logs для отдельных развертываний, чтобы диагностировать ошибки.
Карта мира
Интерактивная карта мира показывает:
- Маркеры регионов для всех 43 доступных регионов
- Зеленые маркеры для развернутых регионов
- Анимированные синие маркеры для регионов, где идет процесс развертывания
- Размер маркера меняется в зависимости от статуса развертывания и задержки

Список развертываний
Под обзорными карточками список развертываний показывает все эндпоинты в твоих проектах. Используй переключатель режима отображения, чтобы переключаться между:
| Вид | Описание |
|---|---|
| Карточки | Полные карточки с подробной информацией, вкладками метрик, логов, кода и предсказаний |
| Компактный | Сетка из небольших карточек (1-4 столбца) с ключевыми метриками |
| Таблица | Таблица с сортируемыми столбцами: Имя, Регион, Статус, Запросы, P95, Ошибки |
Панель опрашивает статус развертываний каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос ускоряется до 3 секунд. Графики метрик обновляются каждые 60 секунд. Нажми кнопку обновления для получения актуальных данных.
Метрики по каждому развертыванию
Каждая карточка развертывания (в режиме карточек) показывает метрики в реальном времени:
Строка метрик
| Метрика | Описание |
|---|---|
| Запросы | Количество запросов (24ч) со значком |
| P95 Latency | Время отклика 95-го перцентиля |
| Частота ошибок | Процент неудачных запросов |
Метрики извлекаются из API-эндпоинта спарклайнов и обновляются каждые 60 секунд.
Проверка состояния (Health Check)
Для запущенных развертываний отображается индикатор проверки работоспособности:
| Индикатор | Значение |
|---|---|
| Зеленое сердце | Работоспособен — показывает задержку отклика |
| Красное сердце | Неработоспособен — показывает сообщение об ошибке |
| Вращающийся значок | Идет проверка работоспособности |
Проверки работоспособности автоматически повторяются каждые 20 секунд при возникновении проблем. Нажми на значок обновления для запуска проверки вручную. Проверка использует тайм-аут 55 секунд, чтобы учесть холодный старт эндпоинтов с масштабированием до нуля.

Проверка работоспособности использует тайм-аут 55 секунд для учета холодных стартов на эндпоинтах с масштабированием до нуля (до ~45 секунд в худшем случае). Как только эндпоинт прогреется, проверки выполняются за миллисекунды.
Логи
Каждая карточка развертывания включает вкладку Logs для просмотра недавних записей логов:

Записи логов
Каждая запись лога показывает:
| Поле | Описание |
|---|---|
| Уровень критичности | Цветовая полоса (см. ниже) |
| Временная метка | Время запроса (локальный формат) |
| Сообщение | Содержимое лога |
| HTTP информация | Код статуса и задержка (если применимо) |
Фильтруй логи по уровню критичности, используя кнопки фильтра:
| Уровень | Цвет | Описание |
|---|---|---|
| DEBUG | Серый | Отладочные сообщения |
| INFO | Синий | Обычные запросы |
| WARNING | Желтый | Некритичные проблемы |
| ERROR | Красный | Неудачные запросы |
| CRITICAL | Темно-красный | Критические сбои |
UI отображает 20 последних записей. API по умолчанию выдает 50 записей на запрос (макс. 200).
При расследовании ошибок: сначала нажми Errors, чтобы отфильтровать записи ERROR и WARNING, затем изучи временные метки и коды состояния HTTP. Скопируй логи в буфер обмена, чтобы поделиться с командой.
Примеры кода
Каждая карточка развертывания включает вкладку Code, где показан готовый к использованию код API с твоим актуальным URL эндпоинта и ключом API:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())При просмотре вкладки Code на платформе твой фактический URL-адрес конечной точки и API ключ заполняются автоматически. Скопируй код и запусти его напрямую. См. API Keys, чтобы создать ключ.
Deployment Predict
Вкладка Predict на карточке каждого развертывания предоставляет встроенную панель предсказаний — это тот же интерфейс, что и вкладка Predict модели, но вывод выполняется через конечную точку развертывания, а не через общую службу. Это удобно для тестирования развернутой конечной точки прямо из браузера. См. Inference для получения подробной информации о параметрах и форматах ответов.
API Endpoints
Обзор мониторинга
GET /api/monitoringВозвращает агрегированные метрики для всех развертываний, принадлежащих аутентифицированному пользователю. Учет рабочего пространства через опциональный параметр запроса owner.
Метрики развертывания
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hВозвращает данные спарклайнов и сводные метрики для конкретного развертывания. Интервал обновления: 60 секунд.
| Параметр | Тип | Описание |
|---|---|---|
sparkline | bool | Включить данные спарклайнов |
range | строка | Временной диапазон: 1h, 6h, 24h, 7d или 30d |
Журналы развертывания
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGВозвращает последние записи журнала с опциональным фильтром по серьезности и пагинацией.
| Параметр | Тип | Описание |
|---|---|---|
limit | int | Максимальное количество возвращаемых записей (по умолчанию: 50, макс.: 200) |
severity | строка | Фильтр серьезности через запятую |
pageToken | строка | Токен пагинации из предыдущего ответа |
Состояние развертывания
GET /api/deployments/{deploymentId}/healthВозвращает статус проверки работоспособности с задержкой ответа.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}Оптимизация производительности
Используй данные мониторинга для оптимизации своих развертываний:
Если задержка слишком высока:
- Проверь количество экземпляров (возможно, нужно больше)
- Убедись, что размер модели выбран верно
- Рассмотри выбор региона поближе
- Проверь размеры отправляемых изображений
Переключись с imgsz=1280 на imgsz=640 для ускорения примерно в 4 раза при минимальной потере точности для большинства сценариев использования. Разверни в регионе, который ближе к твоим пользователям, чтобы снизить сетевую задержку.
Часто задаваемые вопросы (FAQ)
Как долго хранятся данные?
| Тип данных | Хранение |
|---|---|
| Метрики | 30 дней |
| Журналы | 7 дней |
Могу ли я настроить внешний мониторинг?
Да, URL-адреса конечных точек работают со сторонними инструментами мониторинга:
- Мониторинг доступности (Pingdom, UptimeRobot)
- Инструменты APM (Datadog, New Relic)
- Пользовательские проверки работоспособности через конечную точку
/health
Насколько точны показатели задержки?
Метрики задержки измеряют:
- P50: Медианное время отклика
- P95: 95-й перцентиль
- P99: 99-й перцентиль
Это представляет время обработки на стороне сервера, не включая сетевую задержку до твоих пользователей.
Почему мои метрики задерживаются?
Метрики имеют задержку около 2 минут из-за:
- Конвейера агрегации метрик
- Окон агрегации
- Кэширования дашборда
Для отладки в реальном времени проверяй журналы, они доступны почти мгновенно.
Могу ли я отслеживать несколько конечных точек вместе?
Да, страница развертываний показывает все конечные точки с агрегированными карточками обзора. Используй табличный вид для сравнения производительности между развертываниями.