Перейти к содержанию

Развертывание

Ultralytics Platform предоставляет комплексные возможности развертывания для внедрения ваших моделей YOLO в производство. Тестируйте модели с помощью инференса на основе браузера, развертывайте на выделенных конечных точках в 43 глобальных регионах и отслеживайте производительность в реальном времени.

Обзор

Раздел «Развертывание» поможет вам:

  • Тест моделей непосредственно в браузере с помощью Predict вкладка
  • Развертывать на выделенных конечных точках в 43 глобальных регионах
  • Мониторинг: Отслеживайте метрики запросов, журналы и проверки работоспособности.
  • Масштабирование автоматически в зависимости от трафика (включая масштабирование до нуля)

Ultralytics Platform Страница развертывания Карта мира с обзорными карточками

Варианты развертывания

Платформа Ultralytics предлагает несколько путей развертывания:

ВариантОписаниеЛучше всего подходит для
Вкладка «Предсказать»Инференс на основе браузера с использованием изображений, веб-камеры и примеровРазработка, валидация
Общий выводМультитенантный сервис в 3 регионахНеинтенсивное использование, тестирование
Выделенные конечные точкиОднопользовательские сервисы в 43 регионахПроизводство, низкая задержка

Рабочий процесс

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
ТестВалидировать модель с помощью Predict вкладка
НастроитьВыберите регион, ресурсы и имя развертывания
РазвертываниеСоздайте выделенную конечную точку из Deploy вкладка
МониторингОтслеживайте запросы, задержку, ошибки и логи в Мониторинге

Архитектура

Общий вывод

Общий сервис инференса работает в 3 ключевых регионах, автоматически маршрутизируя запросы на основе вашего региона данных:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
РегионМестоположение
СШААйова, США
ЕСБельгия, Европа
APГонконг, Азиатско-Тихоокеанский регион

Выделенные конечные точки

Развертывание в 43 регионах по всему миру в Ultralytics Cloud:

  • Америка: 14 регионов
  • Европа: 13 регионов
  • Азиатско-Тихоокеанский регион: 12 регионов
  • Ближний Восток и Африка: 4 региона

Каждая конечная точка представляет собой однопользовательский сервис с:

  • Выделенные вычислительные ресурсы (настраиваемые CPU и память)
  • Автомасштабирование (масштабирование до нуля при простое)
  • Уникальный URL конечной точки
  • Независимый мониторинг, логи и проверки работоспособности

Страница развертываний

Доступ к странице глобальных развертываний из боковой панели в разделе Deploy. Эта страница показывает:

  • Карта мира с отметками развернутых регионов (интерактивная карта)
  • Карточки обзора: Общее количество запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
  • Список развертываний с тремя режимами просмотра: карточки, компактный и таблица
  • Новое развертывание: кнопка для создания конечных точек из любой завершенной модели

Платформа Ultralytics: Страница развертывания, обзорные карточки и список развертываний

Автоматический опрос

Страница опрашивает каждые 30 секунд для обновления метрик. Когда развертывания находятся в переходном состоянии (создание, развертывание, остановка), частота опроса увеличивается до каждых 2-3 секунд для почти мгновенной обратной связи.

Основные характеристики

Глобальное покрытие

Развертывайте ближе к вашим пользователям в 43 регионах, охватывающих:

  • Северная Америка, Южная Америка
  • Европа, Ближний Восток, Африка
  • Азиатско-Тихоокеанский регион, Океания

Автомасштабирование

Конечные точки масштабируются автоматически:

  • Масштабирование до нуля: Отсутствие затрат в режиме простоя (по умолчанию)
  • Масштабирование вверх: Автоматическая обработка пиковых нагрузок

Экономия затрат

Масштабирование до нуля включено по умолчанию (минимальное количество экземпляров = 0). Вы платите только за активное время инференса.

Низкая задержка

Выделенные конечные точки обеспечивают:

  • Холодный запуск: ~5-15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
  • Теплый вывод: 50-200 мс (зависит от модели)
  • Региональная маршрутизация для оптимальной производительности

Проверки работоспособности

Каждое запущенное развертывание включает автоматическую проверку работоспособности с:

  • Индикатор состояния в реальном времени (работоспособно/неработоспособно)
  • Отображение задержки ответа
  • Автоматический повтор при неработоспособности (опрос каждые 20 секунд)
  • Кнопка ручного обновления

Быстрый старт

Развернуть модель менее чем за 2 минуты:

  1. Обучите или загрузите модель в проект
  2. Перейдите на вкладку Развертывание модели
  3. Выберите регион из таблицы задержек
  4. Нажмите Развернуть — ваша конечная точка активна

Быстрое развертывание

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

После развертывания используйте URL конечной точки с вашим API-ключом для отправки запросов на вывод из любого приложения.

  • Вывод: тестирование моделей в браузере
  • Конечные точки: развертывание выделенных конечных точек
  • Мониторинг: Отслеживайте производительность развертывания

Часто задаваемые вопросы

В чем разница между общим и выделенным выводом?

ФункциональностьОбщиеВыделенные
ЗадержкаПеременнаяСтабильная
СтоимостьОплата за запросОплата за время работы
МасштабОграниченныеНастраиваемые
Регионы343
URLОбщиеПользовательский

Сколько времени занимает развертывание?

Развертывание выделенной конечной точки обычно занимает 1-2 минуты:

  1. Загрузка образа (~30 с)
  2. Запуск контейнера (~30 с)
  3. Проверка работоспособности (~30 с)

Могу ли я развернуть несколько моделей?

Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в соответствии с вашим тарифным планом).

Что происходит, когда конечная точка простаивает?

При включенном масштабировании до нуля:

  • Конечная точка масштабируется вниз после периода бездействия
  • Первый запрос вызывает холодный старт
  • Последующие запросы выполняются быстро

Первые запросы после периода простоя вызывают «холодный старт».



📅 Создано 2 месяцев назад ✏️ Обновлено 25 дней назад
glenn-jochersergiuwaxmann

Комментарии