Meet YOLO26: next-gen vision AI.

Link to this sectionМониторинг#

Ultralytics Platform предоставляет функции мониторинга для развернутых эндпоинтов. Отслеживай метрики запросов, просматривай логи и проверяй статус работоспособности с помощью автоматического опроса.

Обзор карточек и карты мира на странице развертывания Ultralytics Platform

Link to this sectionДашборд развертываний#

Страница Deploy в боковой панели служит дашбордом для мониторинга всех твоих развертываний. Она объединяет карту мира, обзорные метрики и управление развертываниями в одном представлении. Ознакомься с разделом Выделенные эндпоинты для создания и управления развертываниями.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionКарточки обзора#

Четыре сводные карточки в верхней части страницы показывают:

Четыре карточки обзора на странице развертывания Ultralytics Platform

МетрикаОписание
Всего запросов (24ч)Запросы по всем эндпоинтам
Активные развертыванияЗапущенные в данный момент эндпоинты
Частота ошибок (24ч)Процент неудачных запросов
P95 задержка (24ч)95-й перцентиль времени отклика
Оповещение о частоте ошибок

Карточка частоты ошибок подсвечивается красным, если этот показатель превышает 5%. Перейди на вкладку Logs для конкретного развертывания, чтобы диагностировать ошибки.

Link to this sectionКарта мира#

Интерактивная карта мира показывает:

  • Пины регионов для всех 43 доступных регионов
  • Зеленые пины для развернутых регионов
  • Анимированные синие пины для регионов, в которых идет процесс развертывания
  • Размер пина меняется в зависимости от статуса развертывания и задержки

Карта мира на странице развертывания Ultralytics Platform с развернутыми регионами

Link to this sectionСписок развертываний#

Под карточками обзора находится список всех эндпоинтов в твоих проектах. Используй переключатель режима просмотра для выбора между:

ВидОписание
CardsКарточками с полной информацией, включая вкладки метрик, логов, кода и предсказаний
CompactСеткой из компактных карточек (1–4 столбца) с основными метриками
TableТаблицей данных с сортируемыми столбцами: Имя, Регион, Статус, Запросы, P95, Ошибки
Обновления в реальном времени

Дашборд опрашивает статус развертывания каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), интервал опроса сокращается до 3 секунд. Графики метрик обновляются каждые 60 секунд. Нажми кнопку обновления для получения актуальных данных мгновенно.

Link to this sectionМетрики для каждого развертывания#

Каждая карточка развертывания (в режиме отображения карточками) показывает метрики в реальном времени:

Link to this sectionРяд метрик#

МетрикаОписание
ЗапросыКоличество запросов (24ч) со значком
P95 задержка95-й перцентиль времени отклика
Частота ошибокПроцент неудачных запросов

Метрики извлекаются из эндпоинта спарклайн API и обновляются каждые 60 секунд.

Link to this sectionПроверка работоспособности#

Запущенные развертывания отображают индикатор работоспособности:

ИндикаторЗначение
Зеленое сердцеРаботает исправно — показывает задержку отклика
Красное сердцеОшибка — показывает сообщение об ошибке
Вращающийся значокИдет проверка работоспособности

Проверки работоспособности автоматически повторяются каждые 20 секунд в случае ошибки. Нажми на значок обновления, чтобы запустить проверку вручную. Проверка использует тайм-аут 55 секунд, чтобы учесть холодный старт эндпоинтов с масштабированием до нуля.

Карточка развертывания Ultralytics Platform с индикатором работоспособности и задержкой

Устойчивость к холодному старту

Проверка работоспособности использует тайм-аут 55 секунд для учета холодного старта на эндпоинтах с масштабированием до нуля (в худшем случае до ~45 секунд). Как только эндпоинт прогреется, проверки будут выполняться за миллисекунды.

Link to this sectionЛоги#

Каждая карточка развертывания содержит вкладку Logs для просмотра последних записей:

Вкладка логов на карточке развертывания Ultralytics Platform с фильтром серьезности

Link to this sectionЗаписи логов#

Каждая запись лога показывает:

ПолеОписание
СерьезностьЦветовая полоса (см. ниже)
Метка времениВремя запроса (локальный формат)
СообщениеСодержимое лога
HTTP информацияКод статуса и задержка (если применимо)

Фильтруй логи по уровню серьезности с помощью кнопок:

УровеньЦветОписание
DEBUGСерыйОтладочные сообщения
INFOСинийОбычные запросы
WARNINGЖелтыйНекритические проблемы
ERRORКрасныйНеудачные запросы
CRITICALТемно-красныйКритические сбои

Интерфейс показывает 20 последних записей. API по умолчанию возвращает 50 записей на запрос (макс. 200).

Процесс отладки

При расследовании ошибок: сначала нажми Ошибки, чтобы отфильтровать записи ERROR и WARNING, затем проверь метки времени и HTTP-коды статусов. Копируй логи в буфер обмена, чтобы поделиться ими с командой.

Link to this sectionПримеры кода#

Каждая карточка развертывания содержит вкладку Code с готовым к использованию API-кодом, содержащим URL твоего эндпоинта и API-ключ:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Автоматически заполняемые учетные данные

При просмотре вкладки Code на платформе URL твоего эндпоинта и API-ключ заполняются автоматически. Скопируй код и запусти его напрямую. См. раздел API Ключи для генерации ключа.

Link to this sectionИнференс развертывания (Deployment Predict)#

Вкладка Predict на каждой карточке развертывания предоставляет встроенную панель предсказаний — это тот же интерфейс, что и вкладка Predict у модели, но запуск инференса происходит через эндпоинт развертывания, а не через общий сервис. Это полезно для тестирования развернутого эндпоинта прямо из браузера. Подробную информацию о параметрах и форматах ответов смотри в Inference.

Link to this sectionAPI эндпоинты#

Link to this sectionОбзор мониторинга#

GET /api/monitoring

Возвращает агрегированные метрики для всех развертываний, принадлежащих авторизованному пользователю. Учитывает рабочую область через необязательный параметр запроса owner.

Link to this sectionМетрики развертывания#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Возвращает спарклайн-данные и сводные метрики для конкретного развертывания. Интервал обновления: 60 секунд.

ПараметрТипОписание
sparklineboolВключить спарклайн-данные
rangestringВременной диапазон: 1h, 6h, 24h, 7d или 30d

Link to this sectionЛоги развертывания#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Возвращает последние записи логов с возможностью фильтрации по уровню серьезности и пагинацией.

ПараметрТипОписание
limitintМаксимальное количество записей (по умолчанию: 50, макс: 200)
severitystringФильтр серьезности, разделенный запятыми
pageTokenstringТокен пагинации из предыдущего ответа

Link to this sectionСостояние развертывания#

GET /api/deployments/{deploymentId}/health

Возвращает статус проверки работоспособности (health check) с задержкой ответа.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionОптимизация производительности#

Используй данные мониторинга для оптимизации своих развертываний:

Если задержка слишком высокая:

  1. Проверь количество инстансов (возможно, нужно больше)
  2. Убедись, что размер модели соответствует задачам
  3. Рассмотри использование более близкого региона
  4. Проверь размер отправляемых изображений
Снижение задержки

Переключись с imgsz=1280 на imgsz=640 для ускорения примерно в 4 раза при минимальной потере точности для большинства случаев использования. Разверни в регионе, который ближе к твоим пользователям, чтобы снизить сетевую задержку.

Link to this sectionFAQ#

Link to this sectionКак долго хранятся данные?#

Тип данныхХранение
Metrics (Метрики)30 дней
Логи7 дней

Link to this sectionМожно ли настроить внешний мониторинг?#

Да, URL эндпоинтов работают с внешними инструментами мониторинга:

  • Мониторинг аптайма (Pingdom, UptimeRobot)
  • Инструменты APM (Datadog, New Relic)
  • Пользовательские проверки через эндпоинт /health

Link to this sectionНасколько точны показатели задержки?#

Метрики задержки измеряют:

  • P50: медианное время отклика
  • P95: 95-й перцентиль
  • P99: 99-й перцентиль

Это время серверной обработки, не включая сетевую задержку до твоих пользователей.

Link to this sectionПочему мои метрики запаздывают?#

Метрики имеют задержку около 2 минут из-за:

  • Конвейера агрегации метрик
  • Окон агрегации
  • Кэширования дэшборда

Для отладки в реальном времени проверяй логи, которые приходят почти мгновенно.

Link to this sectionМожно ли мониторить несколько эндпоинтов вместе?#

Да, страница развертываний показывает все эндпоинты с карточками общего обзора. Используй табличный вид для сравнения производительности между развертываниями.

Контрибьюторы

Комментарии