Развертывание

Ultralytics Platform предоставляет широкие возможности развертывания для вывода твоих моделей YOLO в продакшн. Тестируй модели с помощью инференса в браузере, развертывай их на выделенных эндпоинтах в 43 регионах по всему миру и отслеживай производительность в реальном времени.



Watch: Get Started with Ultralytics Platform - Deploy

Обзор

Раздел «Развертывание» (Deployment) помогает тебе:

  • Тестировать модели прямо в браузере с помощью вкладки Predict
  • Развертывать на выделенных эндпоинтах в 43 регионах по всему миру
  • Мониторить метрики запросов, логи и результаты проверок работоспособности
  • Масштабировать до нуля при простое (сейчас развертывания запускают один активный инстанс)

Карта мира на странице развертывания Ultralytics Platform с обзорными карточками

Варианты развертывания

Ultralytics Platform предлагает несколько путей развертывания:

ПараметрОписаниеЛучше всего подходит для
Вкладка PredictИнференс в браузере с использованием изображений, веб-камеры и примеровРазработка, валидация
Общий инференсМультитенантный сервис в 3 регионахЛегкое использование, тестирование
Выделенные эндпоинтыОдиночные сервисы в 43 регионахПродакшн, низкая задержка

Рабочий процесс

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
TestПроверь модель на вкладке Predict
НастройкаВыбери регион и имя развертывания (развертывания используют фиксированные стандартные ресурсы)
РазвертываниеСоздай выделенный эндпоинт на вкладке Deploy
МониторингОтслеживай запросы, задержки, ошибки и логи в разделе Мониторинг

Архитектура

Общий инференс

Сервис общего инференса работает в 3 ключевых регионах, автоматически направляя запросы в зависимости от региона твоих данных:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
ОбластьРасположение
СШААйова, США
ЕСБельгия, Европа
APТайвань, Азиатско-Тихоокеанский регион

Выделенные эндпоинты

Развертывай в 43 регионах по всему миру на Ultralytics Cloud:

  • Америка: 14 регионов
  • Европа: 13 регионов
  • Азиатско-Тихоокеанский регион: 12 регионов
  • Ближний Восток и Африка: 4 региона

Каждый эндпоинт — это отдельный сервис с:

  • Стандартными ресурсами: 1 CPU, 2 GiB памяти, minInstances=0, maxInstances=1
  • Масштабированием до нуля при простое
  • Уникальным URL эндпоинта
  • Независимым мониторингом, логами и проверками работоспособности

Страница развертываний

Переходи на глобальную страницу развертываний из бокового меню в разделе Deploy. На этой странице отображаются:

  • Карта мира с отметками регионов развертывания (интерактивная карта)
  • Обзорные карточки: Всего запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
  • Список развертываний с тремя режимами просмотра: карточки, компактный и таблица
  • Кнопка New Deployment для создания эндпоинтов из любой готовой модели

Обзорные карточки и список развертываний на странице Ultralytics Platform

Автоматический опрос

Обычно страница обновляется каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос учащается до одного раза в 3 секунды для получения более быстрой обратной связи.

Основные характеристики

Глобальное покрытие

Развертывай ближе к своим пользователям, используя 43 региона, охватывающие:

  • Северную Америку, Южную Америку
  • Европу, Ближний Восток, Африку
  • Азиатско-Тихоокеанский регион, Океанию

Поведение при масштабировании

Эндпоинты в настоящее время ведут себя следующим образом:

  • Масштабирование до нуля: отсутствие затрат при простое (по умолчанию)
  • Один активный инстанс: maxInstances в настоящее время ограничен 1 на всех тарифных планах
Экономия затрат

Масштабирование до нуля включено по умолчанию (мин. инстансов = 0). Ты платишь только за время активного инференса.

Низкая задержка

Выделенные эндпоинты обеспечивают:

  • Холодный старт: ~5-15 секунд (кешированный контейнер), до ~45 секунд (первое развертывание)
  • Горячий инференс: 50-200 мс (зависит от модели)
  • Региональная маршрутизация для оптимальной производительности

Проверки работоспособности

Каждое запущенное развертывание включает автоматическую проверку работоспособности с:

  • Индикатором статуса в реальном времени (исправно/неисправно)
  • Отображением задержки ответа
  • Автоматической повторной попыткой при неисправности (опрос каждые 20 секунд)
  • Кнопкой ручного обновления

Быстрый старт

Разверни модель менее чем за 2 минуты:

  1. Обучи или загрузи модель в проект
  2. Перейди на вкладку Deploy модели
  3. Выбери регион из таблицы задержек
  4. Нажми Deploy — твой эндпоинт готов к работе
Быстрое развертывание
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

После развертывания используй URL эндпоинта со своим ключом API для отправки запросов на инференс из любого приложения.

Быстрые ссылки

Часто задаваемые вопросы (FAQ)

В чем разница между общим и выделенным инференсом?

ХарактеристикаОбщийВыделенная
ЗадержкаПеременнаяСтабильная
СтоимостьБесплатно (включено)Бесплатно (базовый), оплата по мере использования (расширенный)
МасштабОграниченМасштабирование до нуля, один инстанс
Регионы343
URLУниверсальныйПользовательские
Частота20 зап/минБезлимитно

Сколько времени занимает развертывание?

Развертывание выделенного эндпоинта обычно занимает 1-2 минуты:

  1. Скачивание образа (~30 с)
  2. Запуск контейнера (~30 с)
  3. Проверка работоспособности (~30 с)

Могу ли я развернуть несколько моделей?

Да, каждая модель может иметь несколько эндпоинтов в разных регионах. Количество развертываний ограничено тарифным планом: Free 3, Pro 10, Enterprise unlimited.

Что происходит, когда эндпоинт простаивает?

Если включено масштабирование до нуля:

  • Эндпоинт масштабируется вниз после периода бездействия
  • Первый запрос вызывает холодный старт
  • Последующие запросы обрабатываются быстро

Первые запросы после периода простоя вызывают холодный старт.

Комментарии