Перейти к содержанию

Развертывание

Платформа Ultralytics предоставляет комплексные варианты развертывания для внедрения ваших моделей YOLO в производство. Тестируйте модели с помощью Inference API, развертывайте на выделенных конечных точках и отслеживайте производительность в реальном времени.

Обзор

Раздел «Развертывание» поможет вам:

  • Тестировать модели непосредственно в браузере
  • Развертывать на выделенных конечных точках в 43 глобальных регионах
  • Отслеживать метрики запросов и журналы
  • Масштабировать автоматически в зависимости от трафика

Варианты развертывания

Платформа Ultralytics предлагает несколько путей развертывания:

ВариантОписаниеЛучше всего подходит для
Вкладка «Тест»Браузерное тестирование выводаРазработка, валидация
Общий APIМногопользовательский сервис выводаНеинтенсивное использование, тестирование
Выделенные конечные точкиОднопользовательские производственные сервисыПроизводство, низкая задержка

Рабочий процесс

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
ТестПроверка модели с помощью sample_images
НастроитьВыбор региона и параметров масштабирования
РазвертываниеСоздание выделенной конечной точки
Мониторингtrack запросов, задержки и ошибок

Архитектура

Общий вывод

Общий сервис вывода работает в 3 ключевых регионах:

РегионМестоположение
СШААйова, США
ЕСБельгия, Европа
APТайвань, Азиатско-Тихоокеанский регион

Запросы автоматически направляются в ваш регион данных.

Выделенные конечные точки

Развертывание в 43 регионах по всему миру:

  • Америка: 15 регионов
  • Европа: 12 регионов
  • Азиатско-Тихоокеанский регион: 16 регионов

Каждая конечная точка представляет собой однопользовательский сервис с:

  • Выделенные вычислительные ресурсы
  • Автомасштабирование (от 0 до N экземпляров)
  • Пользовательский URL
  • Независимый мониторинг

Основные характеристики

Глобальное покрытие

Развертывайте ближе к вашим пользователям в 43 регионах, охватывающих:

  • Северная Америка, Южная Америка
  • Европа, Ближний Восток, Африка
  • Азиатско-Тихоокеанский регион, Океания

Автомасштабирование

Конечные точки масштабируются автоматически:

  • Масштабирование до нуля: без затрат в режиме простоя
  • Масштабирование вверх: обработка пиковых нагрузок
  • Настраиваемые лимиты: установка мин./макс. количества экземпляров

Низкая задержка

Выделенные конечные точки обеспечивают:

  • Холодный старт: ~2-5 секунд
  • Теплый вывод: 50-200 мс (зависит от модели)
  • Региональная маршрутизация для оптимальной производительности
  • Вывод: тестирование моделей в браузере
  • Конечные точки: развертывание выделенных конечных точек
  • Мониторинг: Отслеживайте производительность развертывания

Часто задаваемые вопросы

В чем разница между общим и выделенным выводом?

ФункциональностьОбщиеВыделенные
ЗадержкаПеременнаяСтабильная
СтоимостьОплата за запросОплата за время работы
МасштабОграниченныеНастраиваемые
Регионы343
URLОбщиеПользовательский

Сколько времени занимает развертывание?

Развертывание выделенной конечной точки обычно занимает 1-2 минуты:

  1. Загрузка образа (~30 с)
  2. Запуск контейнера (~30 с)
  3. Проверка работоспособности (~30 с)

Могу ли я развернуть несколько моделей?

Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в соответствии с вашим тарифным планом).

Что происходит, когда конечная точка простаивает?

При включенном масштабировании до нуля:

  • Конечная точка масштабируется вниз после периода бездействия
  • Первый запрос вызывает холодный старт
  • Последующие запросы выполняются быстро

Чтобы избежать холодных стартов, установите минимальное количество экземпляров > 0.



📅 Создано 20 дней назад ✏️ Обновлено 14 дней назад
glenn-jocher

Комментарии