Мониторинг

Ultralytics Platform обеспечивает мониторинг развернутых эндпоинтов. Отслеживай метрики запросов, просматривай логи и проверяй статус работоспособности с помощью автоматического опроса.

Обзор карточек развертывания и карта мира на Ultralytics Platform

Панель управления развертываниями

Страница Deploy на боковой панели служит панелью мониторинга для всех твоих развертываний. Она объединяет карту мира, обзорные метрики и управление развертываниями в одном представлении. См. Выделенные эндпоинты для создания развертываний и управления ими.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Обзорные карточки

Четыре сводные карточки в верхней части страницы отображают:

Четыре обзорные карточки на странице развертывания Ultralytics Platform

МетрикаОписание
Всего запросов (24ч)Запросы по всем эндпоинтам
Активные развертыванияТекущие запущенные эндпоинты
Частота ошибок (24ч)Процент неудачных запросов
P95 Latency (24ч)Время отклика 95-го перцентиля
Оповещение о частоте ошибок

Карточка частоты ошибок подсвечивается красным, когда показатель превышает 5%. Проверяй вкладку Logs для отдельных развертываний, чтобы диагностировать ошибки.

Карта мира

Интерактивная карта мира показывает:

  • Маркеры регионов для всех 43 доступных регионов
  • Зеленые маркеры для развернутых регионов
  • Анимированные синие маркеры для регионов, где идет процесс развертывания
  • Размер маркера меняется в зависимости от статуса развертывания и задержки

Карта мира на странице развертывания Ultralytics Platform с развернутыми регионами

Список развертываний

Под обзорными карточками список развертываний показывает все эндпоинты в твоих проектах. Используй переключатель режима отображения, чтобы переключаться между:

ВидОписание
КарточкиПолные карточки с подробной информацией, вкладками метрик, логов, кода и предсказаний
КомпактныйСетка из небольших карточек (1-4 столбца) с ключевыми метриками
ТаблицаТаблица с сортируемыми столбцами: Имя, Регион, Статус, Запросы, P95, Ошибки
Обновления в реальном времени

Панель опрашивает статус развертываний каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос ускоряется до 3 секунд. Графики метрик обновляются каждые 60 секунд. Нажми кнопку обновления для получения актуальных данных.

Метрики по каждому развертыванию

Каждая карточка развертывания (в режиме карточек) показывает метрики в реальном времени:

Строка метрик

МетрикаОписание
ЗапросыКоличество запросов (24ч) со значком
P95 LatencyВремя отклика 95-го перцентиля
Частота ошибокПроцент неудачных запросов

Метрики извлекаются из API-эндпоинта спарклайнов и обновляются каждые 60 секунд.

Проверка состояния (Health Check)

Для запущенных развертываний отображается индикатор проверки работоспособности:

ИндикаторЗначение
Зеленое сердцеРаботоспособен — показывает задержку отклика
Красное сердцеНеработоспособен — показывает сообщение об ошибке
Вращающийся значокИдет проверка работоспособности

Проверки работоспособности автоматически повторяются каждые 20 секунд при возникновении проблем. Нажми на значок обновления для запуска проверки вручную. Проверка использует тайм-аут 55 секунд, чтобы учесть холодный старт эндпоинтов с масштабированием до нуля.

Карточка развертывания Ultralytics Platform, проверка работоспособности, здорово с задержкой

Допуск к холодному старту

Проверка работоспособности использует тайм-аут 55 секунд для учета холодных стартов на эндпоинтах с масштабированием до нуля (до ~45 секунд в худшем случае). Как только эндпоинт прогреется, проверки выполняются за миллисекунды.

Логи

Каждая карточка развертывания включает вкладку Logs для просмотра недавних записей логов:

Вкладка логов карточки развертывания Ultralytics Platform с фильтром по уровню критичности

Записи логов

Каждая запись лога показывает:

ПолеОписание
Уровень критичностиЦветовая полоса (см. ниже)
Временная меткаВремя запроса (локальный формат)
СообщениеСодержимое лога
HTTP информацияКод статуса и задержка (если применимо)

Фильтруй логи по уровню критичности, используя кнопки фильтра:

УровеньЦветОписание
DEBUGСерыйОтладочные сообщения
INFOСинийОбычные запросы
WARNINGЖелтыйНекритичные проблемы
ERRORКрасныйНеудачные запросы
CRITICALТемно-красныйКритические сбои

UI отображает 20 последних записей. API по умолчанию выдает 50 записей на запрос (макс. 200).

Рабочий процесс отладки

При расследовании ошибок: сначала нажми Errors, чтобы отфильтровать записи ERROR и WARNING, затем изучи временные метки и коды состояния HTTP. Скопируй логи в буфер обмена, чтобы поделиться с командой.

Примеры кода

Каждая карточка развертывания включает вкладку Code, где показан готовый к использованию код API с твоим актуальным URL эндпоинта и ключом API:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Автоматически заполняемые учетные данные

При просмотре вкладки Code на платформе твой фактический URL-адрес конечной точки и API ключ заполняются автоматически. Скопируй код и запусти его напрямую. См. API Keys, чтобы создать ключ.

Deployment Predict

Вкладка Predict на карточке каждого развертывания предоставляет встроенную панель предсказаний — это тот же интерфейс, что и вкладка Predict модели, но вывод выполняется через конечную точку развертывания, а не через общую службу. Это удобно для тестирования развернутой конечной точки прямо из браузера. См. Inference для получения подробной информации о параметрах и форматах ответов.

API Endpoints

Обзор мониторинга

GET /api/monitoring

Возвращает агрегированные метрики для всех развертываний, принадлежащих аутентифицированному пользователю. Учет рабочего пространства через опциональный параметр запроса owner.

Метрики развертывания

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Возвращает данные спарклайнов и сводные метрики для конкретного развертывания. Интервал обновления: 60 секунд.

ПараметрТипОписание
sparklineboolВключить данные спарклайнов
rangeстрокаВременной диапазон: 1h, 6h, 24h, 7d или 30d

Журналы развертывания

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Возвращает последние записи журнала с опциональным фильтром по серьезности и пагинацией.

ПараметрТипОписание
limitintМаксимальное количество возвращаемых записей (по умолчанию: 50, макс.: 200)
severityстрокаФильтр серьезности через запятую
pageTokenстрокаТокен пагинации из предыдущего ответа

Состояние развертывания

GET /api/deployments/{deploymentId}/health

Возвращает статус проверки работоспособности с задержкой ответа.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

Оптимизация производительности

Используй данные мониторинга для оптимизации своих развертываний:

Если задержка слишком высока:

  1. Проверь количество экземпляров (возможно, нужно больше)
  2. Убедись, что размер модели выбран верно
  3. Рассмотри выбор региона поближе
  4. Проверь размеры отправляемых изображений
Снижение задержки

Переключись с imgsz=1280 на imgsz=640 для ускорения примерно в 4 раза при минимальной потере точности для большинства сценариев использования. Разверни в регионе, который ближе к твоим пользователям, чтобы снизить сетевую задержку.

Часто задаваемые вопросы (FAQ)

Как долго хранятся данные?

Тип данныхХранение
Метрики30 дней
Журналы7 дней

Могу ли я настроить внешний мониторинг?

Да, URL-адреса конечных точек работают со сторонними инструментами мониторинга:

  • Мониторинг доступности (Pingdom, UptimeRobot)
  • Инструменты APM (Datadog, New Relic)
  • Пользовательские проверки работоспособности через конечную точку /health

Насколько точны показатели задержки?

Метрики задержки измеряют:

  • P50: Медианное время отклика
  • P95: 95-й перцентиль
  • P99: 99-й перцентиль

Это представляет время обработки на стороне сервера, не включая сетевую задержку до твоих пользователей.

Почему мои метрики задерживаются?

Метрики имеют задержку около 2 минут из-за:

  • Конвейера агрегации метрик
  • Окон агрегации
  • Кэширования дашборда

Для отладки в реальном времени проверяй журналы, они доступны почти мгновенно.

Могу ли я отслеживать несколько конечных точек вместе?

Да, страница развертываний показывает все конечные точки с агрегированными карточками обзора. Используй табличный вид для сравнения производительности между развертываниями.

Комментарии