Перейти к содержанию

Развертывание

Ultralytics предоставляет комплексные возможности развертывания для внедрения ваших YOLO в производство. Тестируйте модели с помощью браузерного вывода, развертывайте их на выделенных конечных точках в 43 регионах мира и отслеживайте производительность в режиме реального времени.

Обзор

Раздел «Развертывание» поможет вам:

  • Тест модели непосредственно в браузере с помощью Predict вкладка
  • Развертывать на выделенных конечных точках в 43 глобальных регионах
  • Мониторинг метрик запросов, журналов и проверок работоспособности
  • Автоматическое масштабирование в зависимости от трафика (включая масштабирование до нуля)

Ultralytics Страница развертывания Карта мира с обзорными картами

Варианты развертывания

Платформа Ultralytics предлагает несколько путей развертывания:

ВариантОписаниеЛучше всего подходит для
Вкладка «Прогноз»Вывод на основе браузера с использованием изображений, веб-камеры и примеровРазработка, валидация
Общий выводМульти-тенантный сервис в 3 регионахНеинтенсивное использование, тестирование
Выделенные конечные точкиУслуги для одного арендатора в 43 регионахПроизводство, низкая задержка

Рабочий процесс

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
ТестПроверить модель с помощью Predict вкладка
НастроитьВыберите регион, ресурсы и название развертывания
РазвертываниеСоздайте специальную конечную точку из Deploy вкладка
МониторингОтслеживание запросов, задержек, ошибок и журналов в Мониторинге

Архитектура

Общий вывод

Служба совместного вывода работает в 3 ключевых регионах, автоматически маршрутизируя запросы в зависимости от региона хранения ваших данных:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
РегионМестоположение
СШААйова, США
ЕСБельгия, Европа
APГонконг, Азиатско-Тихоокеанский регион

Выделенные конечные точки

Разверните в 43 регионах по всему миру на Ultralytics :

  • Америка: 14 регионов
  • Европа: 13 регионов
  • Азиатско-Тихоокеанский регион: 12 регионов
  • Ближний Восток и Африка: 4 региона

Каждая конечная точка представляет собой однопользовательский сервис с:

  • Выделенные вычислительные ресурсы (настраиваемый CPU память)
  • Автоматическое масштабирование (масштабирование до нуля в режиме простоя)
  • Уникальный URL конечной точки
  • Независимый мониторинг, журналы и проверки работоспособности

Страница развертываний

Перейдите на страницу глобальных развертываний из боковой панели под Deploy. На этой странице показано:

  • Карта мира с отмеченными регионами (интерактивная карта)
  • Обзорные карты: общее количество запросов (24 часа), активные развертывания, частота ошибок (24 часа), задержка P95 (24 часа)
  • Список развертываний с тремя режимами просмотра: карточки, компактный и таблица
  • Новая кнопка «Развертывание» для создания конечных точек из любой завершенной модели

Обзор страницы развертывания Ultralytics Карты и список развертываний

Автоматический опрос

Страница опрашивается каждые 30 секунд для обновления метрик. Когда развертывания находятся в переходном состоянии (создание, развертывание, остановка), опрос увеличивается до каждых 2-3 секунд для получения практически мгновенной обратной связи.

Основные характеристики

Глобальное покрытие

Развертывайте ближе к вашим пользователям в 43 регионах, охватывающих:

  • Северная Америка, Южная Америка
  • Европа, Ближний Восток, Африка
  • Азиатско-Тихоокеанский регион, Океания

Автомасштабирование

Конечные точки масштабируются автоматически:

  • Масштабирование до нуля: без затрат в режиме простоя (по умолчанию)
  • Масштабирование: автоматическая обработка пиковых нагрузок

Экономия затрат

По умолчанию включена функция «Масштабирование до нуля» (мин. количество экземпляров = 0). Вы платите только за время активного вывода.

Низкая задержка

Выделенные конечные точки обеспечивают:

  • Холодный запуск: ~5–15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
  • Теплый вывод: 50-200 мс (зависит от модели)
  • Региональная маршрутизация для оптимальной производительности

Проверка здоровья

Каждое развертывание включает автоматическую проверку работоспособности с помощью:

  • Индикатор рабочего состояния (исправен/неисправен)
  • Отображение задержки отклика
  • Автоматическая повторная попытка при неисправности (опрос каждые 20 секунд)
  • Кнопка ручного обновления

Быстрый старт

Разверните модель менее чем за 2 минуты:

  1. Обучить или загрузить модель в проект
  2. Перейдите на вкладку «Развертывание» модели.
  3. Выберите регион из таблицы задержек
  4. Нажмите «Развернуть» — ваша конечная точка запущена.

Быстрое развертывание

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

После развертывания используйте URL-адрес конечной точки с вашим ключом API для отправки запросов на вывод из любого приложения.

  • Вывод: тестирование моделей в браузере
  • Конечные точки: развертывание выделенных конечных точек
  • Мониторинг: Отслеживайте производительность развертывания

Часто задаваемые вопросы

В чем разница между общим и выделенным выводом?

ФункциональностьОбщиеВыделенные
ЗадержкаПеременнаяСтабильная
СтоимостьОплата за запросОплата за время работы
МасштабОграниченныеНастраиваемые
Регионы343
URLОбщиеПользовательский

Сколько времени занимает развертывание?

Развертывание выделенной конечной точки обычно занимает 1-2 минуты:

  1. Загрузка образа (~30 с)
  2. Запуск контейнера (~30 с)
  3. Проверка работоспособности (~30 с)

Могу ли я развернуть несколько моделей?

Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в соответствии с вашим тарифным планом).

Что происходит, когда конечная точка простаивает?

При включенном масштабировании до нуля:

  • Конечная точка масштабируется вниз после периода бездействия
  • Первый запрос вызывает холодный старт
  • Последующие запросы выполняются быстро

Первые запросы после периода бездействия запускают холодный запуск.



📅 Создано 1 месяц назад ✏️ Обновлено 5 дней назад
glenn-jochersergiuwaxmann

Комментарии